Claude AI超越GPT 3.5,AI聊天機器人競爭激烈

字節跳動 發佈了一款名爲 BAGEL 的開源多模態基礎模型,擁有70億個活躍參數,整體參數量達到140億。BAGEL 在標準多模態理解基準測試中表現出色,超越了當前一些頂級開源視覺語言模型,如 Qwen2.5-VL 和 InternVL-2.5。此外,在文本到圖像的生成質量上,BAGEL 的表現也與強大的專業生成器 SD3相媲美。更重要的是,BAGEL 在經典圖像編輯場景中的效果優於許多領先的開源模型。BAGEL 採用了一種名爲混合變換器專家(MoT)的架構,旨在最大化模型對多樣化多模態信息的學習能力。它使用兩個獨立的編
在最新的公告中,京東宣佈將免費向其 POP 商家推出五大人工智能(AI)營銷產品。這一舉措旨在幫助商家利用先進技術提升銷售效果和運營效率。這些新工具包括直播數字人、商家客服智能體、短視頻生成工具、京點點以及京麥 AI 助手,均爲商家提供了更爲高效的營銷手段。京東數字人將爲新客戶提供免費版本。這一工具包含了五種時尚感和個性化的數字人,可以進行180分鐘的合成直播。這些數字人不僅能夠以低至真人1/10的成本進行直播,而且可以全天候不間斷帶貨,效果超越80% 的真人
谷歌在I/O2025大會上宣佈,NotebookLM將推出全新視頻概覽(Video Overviews)功能,允許用戶通過上傳的PDF、圖片、文本等來源素材,自動生成動畫風格的短片,深入淺出地講解複雜內容。這一功能面向所有用戶開放,首版僅支持英語,引發全球教育、科研和內容創作社區的熱烈討論。AIbase綜合最新社交媒體動態,深入解析視頻概覽的技術亮點及其對AI輔助學習與創作的深遠影響。視頻概覽:從靜態素材到動畫講解NotebookLM的視頻概覽功能利用Gemini1.5Pro的多模態能力,將用戶上傳的PDF、圖片、文本、
谷歌近日正式發佈了 Project Astra 的最新功能,該項目展示了其強大的智能助理能力,能夠控制 Android 手機。這一技術目前已經以應用程序的形式提供給受信任的測試者,並在 Pixel9Pro 上進行了演示。在演示中,用戶在修理自行車的過程中,與 Astra 進行實時對話。用戶首先請求 Astra 在線查找一份 PDF 手冊,Astra 隨後打開文檔,並以懸浮氣泡的形式展示其觸控操作,同時界面發出亮光,以便用戶可以清晰地看到其正在滾動到所需頁面的過程。接着,Astra 打開了 YouTube 應用,進行視頻搜索並播放
根據彭博社記者馬克・古爾曼的最新報道,蘋果公司正在積極籌備在其即將發佈的 iOS19中向第三方開發者開放其人工智能(AI)模型。這一舉措旨在促進軟件開發,推動應用創新,並增強蘋果自家硬件產品的吸引力。據瞭解,蘋果正在研發一套軟件開發工具包(SDK)及相關框架,以便開發者能夠利用 Apple Intelligence 所採用的大型語言模型來創建新功能。這一計劃預計將在即將到來的全球開發者大會(WWDC)上正式發佈,時間定於6月9日。目前,Apple Intelligence 已經被應用於 iOS 和 macOS 的一些功能,
火山引擎正式推出豆包·語音播客模型,豆包·語音播客模型基於流式模型構建,能夠實現從文本創作到雙人對話式播客的秒級轉化,爲用戶帶來“低成本、高時效、強互動”的全新創作體驗。這一模型的推出,不僅解決了傳統AI播客創作中的諸多痛點,還極大地簡化了播客製作流程,讓熱點內容能夠瞬間轉化爲生動的播客。