Sakana AI 是一家專注於自然啓發算法的人工智能研究實驗室,近日推出了一種名爲 Transformer² (Transformer-squared) 的創新自適應語言模型。該模型無需昂貴的微調,即可在推理過程中動態學習並適應新任務,這標誌着大型語言模型 (LLM) 技術發展的重要一步。
Sakana AI 的 Transformer² 模型突破 LLM 限制,實現動態推理

Sakana AI 是一家專注於自然啓發算法的人工智能研究實驗室,近日推出了一種名爲 Transformer² (Transformer-squared) 的創新自適應語言模型。該模型無需昂貴的微調,即可在推理過程中動態學習並適應新任務,這標誌着大型語言模型 (LLM) 技術發展的重要一步。
在瑞士達沃斯舉行的論壇上,OpenAI 首席產品官凱文・韋爾(Kevin Weil)於1月21日表示,我們正處於人工智能代理的邊緣。他預測,到2025年,ChatGPT 將不僅僅是一個可以回答各種問題的智能工具,而是能夠在現實世界中爲用戶完成具體任務的 “智能助手”。韋爾強調,人工智能代理將在未來很快能夠處理許多日常瑣事,這些事情往往讓人感到煩惱,比如填寫表格、預訂餐廳等。他堅信,這種技術的進步是毋庸置疑的,用戶將會體驗到前所未有的便利。與此同時,LinkedIn 首席執行官瑞安・羅斯
JetBrains,這家以開發 IntelliJ IDE 和 Kotlin 語言而聞名的公司,近日推出了其首款 AI 編碼助手 Junie。這款新工具旨在幫助開發者處理日常開發任務,並能夠理解現有項目的上下文,爲新應用的創建和功能擴展提供支持。Junie 在備受推崇的 SWE-Bench Verified 基準測試中,針對500個常見的開發者任務,成功解決了其中的53.6%。儘管這一成績在目前來看並非最高(目前最佳模型得分超過60%),但 JetBrains 認爲 Junie 的表現“很有希望”。值得注意的是,目前領先的 Weights & Biases 的 “Programmer O1crosscheck5”
視頻生成領域迎來革命性突破。人工智能公司HeyGen最新發布的數字人運動控制系統,首次實現虛擬形象的大幅度肢體動作操控。這項技術突破使數字人不僅能完成基礎的頭部微表情,更能流暢執行彈奏樂器、舞蹈表演等複雜肢體動作,甚至精確控制手指關節完成特定手勢。演示視頻中,虛擬角色手持鮮花的自然抓握動作引發行業關注。儘管當前展示仍以單一物品操作爲主,但技術底層已具備物體交互能力框架。分析人士指出,該功能已具備商品展示應用潛力,未來迭代可能突破現有展示形
隨着人工智能技術的快速發展,AI玩具正迅速成爲一個備受關注的新興市場。業內人士普遍認爲,AI玩具是大模型技術在硬件端的理想落地場景之一。多家上市公司正在加緊佈局這一藍海市場,推動了AI玩具的蓬勃發展。市場研究機構 Research and Markets 預測,全球 AI 玩具市場規模將從2022年的約87億美元增長到2030年的351.1億美元,年複合增長率將超過16%。這一巨大的增長潛力吸引了衆多企業和資本的目光。圖源備註:圖片由AI生成,圖片授權服務商Midjourney目前,市場上已經涌現出多款備受歡迎
今日,百川公司宣佈,其最新研發的Baichuan-M1系列模型正式面世,包括國內首個全場景深度思考模型Baichuan-M1-preview與行業首個開源醫療增強大模型Baichuan-M1-14B,兩款模型均展現了卓越的性能與創新的技術特點。
近日,有媒體報道,印度商業巨頭穆凱什・阿班尼領導的信實集團(Reliance)正在籌備建設一個可能成爲全球最大的人工智能數據中心,項目選址位於印度古吉拉特邦的賈曼加爾(Jamnagar)。該數據中心的計劃容量達到3千兆瓦,這一規模遠超當前最大的微軟600兆瓦數據中心。圖源備註:圖片由AI生成,圖片授權服務商Midjourney據報道,該項目的投資預算在200億到300億美元之間。爲了推動這一龐大的項目,阿班尼在2020年成功融資超過250億美元,吸引了包括 Meta、谷歌、銀湖資本、通用大西洋、KKR、