AI日報：OpenAI重磅上線Sora；智譜AI免費多模態模型GLM-4V-Flash；騰訊雲打造AI代碼助手

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、OpenAI正式上線Sora，ChatGPT Pro用戶可無限生成、最長20秒

OpenAI 在 "ship-mas" 系列活動中發佈了 Sora Turbo 視頻生成 AI，支持生成20秒1080p 視頻，用戶可通過文本、圖片或視頻進行創作，具有多種風格和剪輯功能。該平臺強調創意表達與內容安全，用戶可瀏覽其他創作者的視頻。

【AiBase 提要:】
🌟 Sora Turbo 支持生成最高1080p 分辨率的20秒視頻。
🎨 用戶可以使用多種工具進行創意視頻製作。
🔒 所有生成視頻均附加水印和 C2PA 元數據確保安全。
詳情鏈接:https://sora.com/

2、智譜AI上線免費多模態模型GLM-4V-Flash:圖像處理精確度提升

北京智譜華章科技有限公司推出了其首個免費多模態API——GLM-4V-Flash，旨在提升圖像處理的精確度，降低開發者的使用門檻。該模型支持多種語言，並具備多項高級圖像處理功能，如圖像描述生成和視覺問答等，能夠爲特定行業提供精準解決方案。

【AiBase提要:】
🌐 GLM-4V-Flash是首個免費多模態API，支持26種語言，降低開發門檻。
📊 具備圖像描述生成、分類、視覺推理等高級功能，適用於多個行業。
🚀 該模型已在社交媒體、教育、美容等領域展現出顯著效益。
詳情鏈接:https://www.bigmodel.cn/console/trialcenter

3、騰訊雲AI代碼助手上線，基於混元大模型打造

騰訊雲推出的AI代碼助手旨在通過預測和提供代碼建議來幫助程序員提升開發效率。該工具利用混元大模型，能夠深入理解代碼上下文，提供精準的代碼補全建議，超越傳統的關鍵詞匹配方式。它不僅能適應程序員的編碼風格，還在多個關鍵場景中展現了強大的編碼輔助能力，如生成正則表達式、快速生成前端頁面以及清晰解讀複雜代碼。

微信截圖_20241210085836.png

【AiBase提要:】
⚙️ AI代碼助手通過深入理解代碼上下文，提供精準的代碼補全建議，顯著提升開發效率。
📈 該助手能夠學習程序員的編碼風格，提供定製化的代碼補全，貼合個人習慣。
🔍 通過混元大模型，AI代碼助手在多個場景中展現強大能力，包括生成正則表達式和快速適配新接口規範。

4、可靈AI API V1.5模型新增標準std模式、V1.0模型新增運動筆刷

北京快手科技有限公司近日推出了可靈AI的API V1.5模型標準模式和V1.0模型的“運動筆刷”功能。這些更新旨在提升用戶體驗，增強藝術創作的靈活性與效率。V1.5模型以其卓越的效果和快速的處理速度爲用戶提供了高性價比的選擇，而V1.0模型的新功能則允許用戶爲圖片中的人物或物體指定運動軌跡，帶來了更精準的運動控制和生動的表現。

【AiBase提要:】
✨ V1.5模型標準模式提供了出色的效果和快速的處理速度，提升用戶體驗。
🖌️ V1.0模型新增的“運動筆刷”功能允許用戶指定運動軌跡，實現精準控制。
🌟 新功能豐富了可靈AI的功能，爲視覺藝術創作帶來了創新的可能性。

5、書生·萬象多模態大模型InternVL2.5開源性能媲美GPT-4o

上海 AI 實驗室推出的書生·萬象InternVL2.5模型在多模態理解基準上取得了超過70%的準確率，成爲首個開源模型與商業模型如GPT-4o和Claude-3.5-Sonnet相媲美。該模型通過鏈式思考推理技術提升了性能，並在多個領域展現了強大的測試時間可擴展性及多學科推理能力。

【AiBase提要:】
🚀 InternVL2.5模型在多模態理解基準上達到了超過70%的準確率，表現出色。
📈 通過鏈式思考推理技術，該模型實現了3.7個百分點的性能提升，展現了強大的可擴展性。
🌐 開源特性使得研究人員和開發者能夠自由訪問和使用該模型，推動多模態AI技術的發展。
詳情鏈接:https://www.modelscope.cn/collections/InternVL-25-fbde6e47302942

6、Swift Ventures發佈AI公司指數 明確人工智能投資標準

Swift Ventures推出了一項新的人工智能公司指數，旨在幫助投資者識別真正進行AI技術投資的上市公司。該指數分析了數千份數據，發現儘管公司在財報中頻繁提及AI，實際大規模投資的公司卻寥寥無幾。當前追蹤的90家公司在AI研究和人才密度方面表現突出，年增長率遠超市場平均水平。

【AiBase提要:】
📊 該指數追蹤約90家公司，依據AI研究投資、人才密度和AI收入進行評分。
💡 投資AI研究的公司，其平均毛利潤是未投資公司的兩倍，顯示出研究與盈利能力的正相關。
🚀 一些低調公司在AI領域表現出色，年增長率超過50%，表明AI轉型已超越大技術公司。

7、量子計算驚天一躍!谷歌Willow芯片5分鐘搞定138億年計算，OpenAI都看傻了

谷歌的Willow量子芯片在量子計算領域取得了劃時代的突破，成功將計算任務從傳統計算機需要的10^25年縮短至僅5分鐘，展示了量子技術的巨大潛力。通過精細的工程設計，Willow在增加量子比特數量的同時，顯著降低了計算誤差，推動了量子計算的進步。

【AiBase提要:】
⚡ Willow芯片在量子計算中實現了低於閾值的誤差控制，錯誤率顯著降低。
⏱️ 計算速度驚人，10^25年的任務僅需5分鐘，展現了量子計算的巨大潛力。
🔒 Willow的進步引發了對加密安全的擔憂，尤其是對比特幣等加密貨幣的潛在威脅。

8、宅男福音!VR角色扮演AI來了，南洋理工“造人”新突破，唱跳互動還能陪你聊!

新加坡南洋理工大學的研究團隊推出了名爲SOLAMI的AI技術，能夠創造出活靈活現的3D虛擬角色，支持實時互動、語音理解和動作響應。該技術利用深度學習，將用戶的語音和動作轉化爲虛擬角色可理解的語言，提供自然流暢的互動體驗。SOLAMI還配備VR界面，用戶可通過VR設備與虛擬角色進行面對面交流。

【AiBase提要:】
🎮 SOLAMI是一個端到端的社會視覺-語言-動作建模框架，實現用戶與虛擬角色的自然互動。
📊 SynMSI合成數據集爲訓練提供了豐富的對話和動作數據，解決了數據缺乏的問題。
🌐 SOLAMI的沉浸式VR界面讓用戶能夠身臨其境地與虛擬角色互動，提升了社交體驗。
詳情鏈接:https://solami-ai.github.io/

9、X 正式表態，全新AI圖像生成器Aurora將在本週內向所有用戶推出

近日，社交網絡 X（前身爲推特）推出了新的圖像生成器Aurora，經過數十億個樣本訓練，具備高質量圖像生成能力。雖然最初被撤下，但現已重新上線，計劃在一週內向所有用戶推廣。Aurora能夠精準渲染真實世界的視覺細節，儘管在測試中發現其生成的圖像偶爾存在不自然的融合和細節缺失問題。

【AiBase提要:】
✨ Aurora是由xAI開發的新圖像生成器，具備照片級渲染能力。
🌍 目前已在部分國家上線，預計一週內向所有用戶推廣。
🔍 測試發現Aurora生成的圖像有時存在不自然的融合和人物細節缺失問題。
詳情鏈接:https://x.ai/blog/grok-image-generation-release

10、Reddit 推出 AI 問答功能，但用戶卻不買賬!

Reddit最近推出了名爲“Reddit Answers”的新功能，旨在通過AI驅動的問答提升用戶搜索體驗。然而，儘管該功能可以基於平臺內的帖子和評論提供答案，用戶的反饋卻並不積極，許多人認爲改善搜索功能的優先級更高。該功能目前僅在美國的有限用戶中測試，且尚未在Android平臺上推出。

【AiBase提要:】
🔍 新功能“Reddit Answers”開始在美國有限用戶中測試，旨在提升搜索體驗。
🤖 該功能利用Reddit平臺內的帖子和評論，提供AI驅動的問答服務。
😟 用戶反響平平，許多人對搜索功能改善的優先級表示不滿。

11、特斯拉陶琳:將堅持自動駕駛純視覺路線

特斯拉副總裁陶琳重申了公司在自動駕駛技術上堅持純視覺路線的決心。她強調，只有通過攝像頭和視覺神經網絡的結合，才能更好地模擬人類的駕駛習慣，從而實現更安全、更智能的完全自動駕駛。特斯拉的AI4芯片已在所有在售車型中配備，算力提升顯著，標誌着公司在硬件上已爲完全自動駕駛做好準備。

【AiBase提要:】
🔍 特斯拉堅持通過純視覺技術實現完全自動駕駛，認爲這是最安全、最智能的方案。
💡 自動駕駛技術採用端到端大模型，已實現從光子輸入到決策輸出的全過程。
📈 所有在售車型均配備最新AI4芯片，算力提升5倍，爲實現完全自動駕駛奠定基礎。

12、驚人復甦!Stability AI新管理層六個月實現無債務、三位數業務增長

Stability AI在新任首席執行官普雷姆・阿卡拉朱的帶領下，經過六個月的努力，成功實現了業務的三位數增長，並清除了所有債務。阿卡拉朱強調公司資產負債表的健康狀態，並專注於API和許可服務的快速發展。新管理團隊的形成吸引了曾經離開的投資者回歸，標誌着公司前景的向好。

【AiBase提要:】
💼 Stability AI新CEO普雷姆・阿卡拉朱表示，公司業務已實現三位數增長，且無債務。
📈 新管理團隊在六個月內完成復甦，吸引曾離開的投資者回歸。
🎥 知名導演詹姆斯・卡梅隆已加入Stability AI董事會，顯示行業信心回升。

13、智源開源無標註視頻學習的3D 生成模型 See3D

北京智源人工智能研究院推出了 See3D 模型，能夠利用無標註互聯網視頻進行3D 生成。該模型通過視覺條件技術，生成相機方向可控且何一致的多視角圖像，避免傳統相機標註的需求，具有良好的數據擴展性和適用性。See3D 已開源，支持多種3D 創作應用。

微信截圖_20241210151417.png

【AiBase 提要:】
🌟 See3D 利用大規模無標註視頻進行3D 學習，降低數據採集成本。
🎥 模型支持從文本、單視圖到3D 生成，功能多樣。
🔍 開源模型和數據集促進3研究社區關注無相機標註數據。
項目地址: https://vision.baai.ac.cn/see3d

AI日報：OpenAI重磅上線Sora；智譜AI免費多模態模型GLM-4V-Flash；騰訊雲打造AI代碼助手

相關AI新聞推薦

Adobe聯手MIT打造CausVid視頻生成模型，首幀延遲僅1.3秒！

HarperCollins談未來有聲讀物與人工智能影響，Spotify進軍市場獲贊

OpenAI向所有用戶開放ChatGPT Canvas 功能，新增支持Python代碼運行

通用汽車放棄 Cruise 自動駕駛出租車，轉向個人自動駕駛汽車

YouTube 擴展 AI 自動配音功能，數十萬創作者受益

面壁智能獲新一輪數億元融資將提速端側等大模型商業化佈局

AI日報：OpenAI重磅上線Sora；智譜AI免費多模態模型GLM-4V-Flash；騰訊雲打造AI代碼助手

相關AI新聞推薦

Adobe聯手MIT打造CausVid視頻生成模型，首幀延遲僅1.3秒！

HarperCollins談未來有聲讀物與人工智能影響，Spotify進軍市場獲贊

OpenAI向所有用戶開放ChatGPT Canvas 功能，新增支持Python代碼運行

通用汽車放棄 Cruise 自動駕駛出租車，轉向個人自動駕駛汽車

YouTube 擴展 AI 自動配音功能，數十萬創作者受益

面壁智能獲新一輪數億元融資 將提速端側等大模型商業化佈局

面壁智能獲新一輪數億元融資將提速端側等大模型商業化佈局