月之暗面最近發佈了全球首個支持20萬字輸入長度的大模型Moonshot AI,以及搭載該模型的智能聊天工具Kimi Chat。Moonshot AI的創始人楊植麟曾在CMU學習AI,被視爲中國本土“OpenAI”的候選人之一。相比其他模型,Moonshot AI通過存儲、算力等多方面優化,實現了長文本處理的突破,標誌着生成式AI進入長文本時代。Moonshot AI通過避免“鯨魚模型”“蜜蜂模型”“蝌蚪模型”的捷徑,實現真正的長文本理解。計劃明年推出多模態能力,進一步擴展應用邊界。
相關推薦
北大團隊提出全新框架LIFT 將長上下文知識注入模型參數
北京大學張牧涵團隊提出了一種全新的框架——Long Input Fine-Tuning (LIFT),通過將長輸入文本訓練進模型參數中,使任意短上下文窗口模型獲得長文本處理能力。這一方法顛覆了傳統的長文本處理思路,不再專注於無限擴充上下文窗口,而是將長文本知識內化到模型參數中,類似於人類將工作記憶轉化爲長期記憶的過程。目前大模型處理長文本面臨兩大主要挑戰:傳統注意力機制的平方複雜度導致處理長文本時計算和內存開銷巨大 模型難以理解散落在長文本各處的長程依賴關係現有的解決
AI21 Labs發佈Jamba 1.6,打破長文本處理極限、支持多種語言
AI21Labs 近日發佈了其最新的 Jamba1.6系列大型語言模型,這款模型被稱爲當前市場上最強大、最高效的長文本處理模型。與傳統的 Transformer 模型相比,Jamba 模型在處理長上下文時展現出了更高的速度和質量,其推理速度比同類模型快了2.5倍,標誌着一種新的技術突破。Jamba1.6系列包括 Jamba Mini(12億參數)和 Jamba Large(94億參數),並且專門針對商業應用進行了優化,具備函數調用、結構化輸出(如 JSON)和基於現實的生成能力。這些模型的應用範圍廣泛,從企業級的智能助手到學術研究,均能發揮
楊植麟迴應月之暗面仲裁案,首次澄清張予彤股份問題
近日,金沙江創投主管合夥人朱嘯虎多次在社交平臺上發文迴應月之暗面仲裁案,並“炮轟”前金沙江創投主管合夥人張予彤。針對此事,月之暗面創始人兼CEO楊植麟於昨晚通過社交媒體發表聲明,迴應了關於他離開前公司重新創業以及張予彤在月之暗面股份的問題。楊植麟明確表示,在離開循環科技重新創業時,所有必要的手續都已得到每一位董事的簽字同意。他強調,自己與前公司以及部分股東之間的決策是獨立的,並未受到任何干預。針對張予彤在月之暗面的任職和所持股份問題,
智譜AI:GLM-4-Long API上線 輸入、輸出價格0.001元 /千tokens
智譜AI宣佈,支持超長上下文長度的LLM GLM-4-Long已經在開放平臺bigmodel.cn上線。該模型專爲處理超長文本而設計,能夠一次性閱讀相當於兩本《紅樓夢》或125篇論文的文本量,廣泛應用於翻譯長篇文檔、全局分析財報、提取關鍵信息以及構建具有超長記憶的聊天機器人等場景。
Kimi開放平臺:Kimi 企業級 API 發佈 更高效、安全和穩定
北京月之暗面科技有限公司(Moonshot AI)宣佈 Kimi 企業級 API 正式發佈。這些API提供企業級的模型推理能力,確保程序擁有領先的穩定體驗,同時提供更高等級的數據安全保障和併發速率。此外,Kimi還提供專屬的技術支持服務,併爲用戶帶來下一代模型和新能力的優先體驗機會。
