繼 DeepSeek R1之後,阿里雲通義千問團隊剛剛宣佈推出其最新的開源模型
此次發佈的 Qwen2.5-1M 系列包含兩個開源模型:
繼 DeepSeek R1之後,阿里雲通義千問團隊剛剛宣佈推出其最新的開源模型
此次發佈的 Qwen2.5-1M 系列包含兩個開源模型:
中央廣播電視總檯《2025年春節聯歡晚會》在多個電視頻道直播。杭州宇樹科技攜旗下人形機器人登上春晚舞臺,帶來了一場別開生面的表演節目《秧Bot》。該節目由著名導演張藝謀執導,將傳統文化與機器人技術完美融合。在節目中,宇樹科技的多個人形機器人穿上紅色大花襖,手持手絹跳起了秧歌。這些機器人不僅實現了極爲柔順的行走,還能與舞者完美配合互動,精準完成轉手絹等複雜動作,展現了高度的靈活性和精準性。宇樹科技官網顯示,登上春晚舞臺的是Unitree H1/H1-2人形機器人
阿里雲通義千問開源了全新的視覺模型Qwen2.5-VL,並推出了3B、7B和72B三個尺寸版本。其中,旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍,超越了GPT-4o與Claude3.5。阿里雲官方介紹稱,新的Qwen2.5-VL能夠更準確地解析圖像內容,並突破性地支持超過1小時的視頻理解。該模型可以在視頻中搜索具體事件,並對視頻的不同時間段進行要點總結,從而快速、高效地幫助用戶提取視頻中的關鍵信息。此外,Qwen2.5-VL無需微調即可變身爲一個能操控手機和電腦的AI視覺智能體(Visual Agents),實現多
國產大模型公司DeepSeek的應用登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,超越了ChatGPT。這一成就不僅引起了市場的廣泛關注,也對AI芯片龍頭英偉達的股價產生了重大影響。儘管如此,英偉達發言人仍然對DeepSeek給出了高度評價,稱其爲AI領域的一項卓越進步,並指出DeepSeek的工作展示瞭如何利用測試時間縮放技術、廣泛可用的模型以及符合出口管制的計算資源來創建新型號。英偉達發言人補充道,推理過程需要大量英偉達GPU和高性能網絡支持。英偉達目前掌握三種擴展規律
DeepSeek應用超越ChatGPT,登頂蘋果美國區免費App下載排行榜,引發市場熱議。這家被稱爲“大模型版拼多多”的中國公司,其應用的快速上升讓海內外技術同行和投資機構都密切關注。對於這一排名變化,ChatGPT迴應稱,DeepSeek可能在某些方面有獨特優勢或滿足了用戶特定需求,但這樣的排名變化也許是暫時的,同時也表明AI應用市場競爭激烈,創新空間巨大。在國外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準測試排名已升至全類別大模型第三,與OpenAI的ChatGPT-4o最新版並列。劃重點: 📈 DeepSee
DeepSeek發佈公告稱其線上服務近期遭受了大規模惡意攻擊,導致註冊過程可能變得繁忙。DeepSeek提醒用戶,如果遇到註冊困難,可以稍等後重試。已註冊用戶可以正常登錄,不受影響。此外,有報道稱DeepSeek曾暫時限制了非86手機號的註冊方式,但已註冊用戶登錄不受影響。DeepSeek作爲當前最熱門的大模型之一,在主流榜單中,其DeepSeek-V3在開源模型中位列榜首,與世界上最先進的閉源模型不相上下。DeepSeek的創始人梁文鋒在接受媒體採訪時表示,中國AI不可能永遠處於跟隨的位置。他指出,中
國產大模型DeepSeek發佈了全新的Janus-Pro多模態大模型,正式進軍文生圖領域。這一舉動標誌着DeepSeek在多模態AI技術上的重大突破。在GenEval和DPG-Bench基準測試中,Janus-Pro-7B不僅擊敗了OpenAI的DALL-E3,還超越了Stable Diffusion、Emu3-Gen等熱門模型。Janus-Pro採用MIT開源協議,這意味着它可以無限制地用於商業場景。DeepSeek表示,Janus-Pro是2024年11月13日發佈的JanusFlow大模型的高級版本。相比前代模型,Janus-Pro優化了訓練策略,擴展了訓練數據,並且模型規模更大。這些改進使得Janus-Pro在多模態理解和文本