AI日報：支付寶推AI創意生成平臺；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準備o3推理模型

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、谷歌發佈王炸推理模型Gemini2.0Flash Thinking，挑戰 OpenAI o1

谷歌近期推出的Gemini2.0Flash Thinking模型在多模態推理領域展現出強大的能力，支持32，000個輸入標記和8，000個輸出標記，極大提升了處理複雜問題的效率。該模型通過透明的逐步推理方式解決了AI“黑箱”問題，增強了用戶對模型決策過程的理解。

【AiBase提要:】
🌟 Gemini2.0Flash Thinking模型具備強大的推理能力，支持32，000個輸入標記和8，000個輸出標記。
💡 該模型通過下拉菜單提供逐步推理，增強透明性，解決AI“黑箱”問題。
🖼️ 具備原生圖像上傳與分析能力，擴展了多模態應用場景。
詳情鏈接:https://ai.google.dev/gemini-api/docs/thinking-mode?hl=zh-cn

2、支付寶面向商家營銷推出AI創意生成平臺，已累計生成8700萬張AI素材

支付寶最近推出了名爲“螞上有創意”的AI創意生成平臺，專爲商家和設計師提供快速生成創意素材和智能分析的服務。該平臺不僅免費開放了大量營銷圖片素材，還通過AI技術支持快速生成海報、視頻等內容，並提供創意洞察服務，幫助商家提升營銷效果。

【AiBase提要:】
🖼️ 支持快速生成海報、Banner、視頻等多種內容，簡化創意製作流程。
📊 提供AI創意洞察服務，幫助商家分析和優化營銷物料，提高轉化率。
🚀 自去年以來，支付寶已生成8700萬張AI素材，推動商家營銷的智能化發展。

3、Runway更新重磅功能: 支持插入中間幀控制視頻生成

Runway平臺最近推出了一項重要更新，允許用戶在視頻生成過程中插入中間幀。這一功能的推出滿足了許多用戶的期待，使得視頻製作的創作自由度和靈活性大大增強。用戶不僅可以上傳首尾幀，還可以通過添加中間幀來豐富視頻內容，提升畫面的協調性和流暢度。

【AiBase提要:】
🎨 用戶現在可以在視頻生成中選擇首尾幀並插入中間幀，增加創作靈活性。
🚀 新增的關鍵幀功能使得視頻畫面更豐富，提升了整體質量和流暢度。
✨ 用戶體驗反饋積極，展示了該功能在實際應用中的效果。

4、電商產品試穿神器!Krea AI新功能:幾秒鐘將真實產品添加到任何圖像中

Krea AI最近推出了令人興奮的新功能——自定義訓練，允許用戶在幾秒鐘內將真實產品添加到任何圖像中。該功能通過簡單的塗抹和選擇商品圖，實現了產品與圖像的無縫融合，極大提升了設計和創作的效率。用戶可以輕鬆替換模特的配件和服裝，甚至進行logo的替換。

【AiBase提要:】
✨ 用戶可以在幾秒鐘內將真實產品添加到圖像中，提升設計效率。
🖌️ 通過簡單的塗抹和選擇，AI實現產品與圖像的完美融合。
👗 支持多種替換操作，包括配件、服裝和logo，操作流暢。

5、跳過o2!OpenAI 或計劃推出新一代 “o3” 推理模型

OpenAI 正在研發新一代推理模型“o3”，旨在提升用戶提問時的迴應質量，使其更加深思熟慮和邏輯嚴謹。由於與英國電信公司O2的商標衝突，OpenAI選擇跳過“o2”直接命名爲“o3”。此舉不僅反映了公司在品牌命名上的謹慎態度，也標誌着OpenAI在應對產品更新放緩及市場競爭加劇方面的重要戰略調整。

【AiBase提要:】
🌟 OpenAI 正在開發新的推理模型 “o3”，旨在提升思考能力和用戶互動體驗。
⚖️ 由於與英國電信公司 O2的潛在商標衝突，OpenAI 決定跳過 “o2” 直接命名爲 “o3”。
📈 新模型的推出是 OpenAI 應對產品更新放緩的一項戰略舉措，期望在各行業實現更廣泛的應用。

6、閃速!ElevenLabs推Flash語音對話模型:僅75毫秒延遲支持32種語言

ElevenLabs近期推出了其最新的人聲合成模型Flash，聲稱這是迄今爲止最快的文本轉語音解決方案，生成語音的延遲僅爲75毫秒，特別適合低延遲的對話式語音助手。Flash模型分爲兩個版本，其中Flash v2僅支持英語，而Flash v2.5則支持32種語言。儘管在音質和情感深度上稍遜於Turbo模型，但Flash在盲測中表現優異，成爲速度最快的選擇。

【AiBase提要:】
🌟 Flash模型生成語音的延遲僅爲75毫秒，適合低延遲的對話式語音助手。
🌍 Flash v2.5支持32種語言，用戶生成每兩個字符消耗1個積分。
🚀 在盲測中，Flash模型表現優於其他同類產品，成爲速度最快的文本轉語音解決方案。

7、ChatGPT桌面端新增應用協作功能 Mac用戶輕鬆讀取應用內容

OpenAI最近推出了ChatGPT桌面應用程序的重要更新，其中新增的“與應用協作”功能使得ChatGPT能夠直接讀取多種應用程序的內容，如終端、IDE和文本編輯器。這一更新極大地提升了開發者和創作者的工作效率，支持的應用程序包括Apple Notes、Notion、VS Code等。

【AiBase提要:】
🌟 ChatGPT新增“與應用協作”功能，支持直接讀取多個應用內容。
💻 支持的應用包括Apple Notes、Xcode、VS Code等，覆蓋廣泛。
🗣️ 更新後，用戶可使用高級語音模式與應用進行互動，提供更直觀的使用體驗。

8、AI編程助手Cursor再獲融資1億美元，估值飆升至26億美元

Anysphere 公司開發的 AI 編程助手 Cursor 在短短四個月內完成了1億美元的 B 輪融資，估值飆升至26億美元。這一輪融資由 Thrive Capital 領投，Andreessen Horowitz 參與但未主導。Cursor 的市場競爭雖激烈，但其受歡迎程度明顯高於競爭對手，年收入在短時間內從400萬美元增長至4800萬美元。

【AiBase提要:】
🌟 Cursor 成功融資1億美元，估值達26億美元!
🚀 僅四個月時間，公司估值暴漲6.5倍，投資者熱情高漲。
💰 公司的年收入從400萬美元迅速增長至4800萬美元，業績亮眼。

9、GPT之父離職震動AI圈:OpenAI傳奇研究員Radford轉向獨立研究

OpenAI的核心研究員Alec Radford宣佈離職，轉向獨立研究，引發AI領域的廣泛關注。他是GPT系列的首席設計師，曾在AI領域做出重要貢獻，包括提出基於Transformer的語言模型生成預訓練方法。Radford的離職標誌着AI人才流動的挑戰，同時也可能預示着獨立研究者在AI技術創新中將發揮越來越重要的作用。

【AiBase提要:】
🚀 Radford在2016年加入OpenAI，推動了GPT系列模型的研發，奠定了現代AI的基礎。
📈 他的離職發生在OpenAI高層頻繁變動的背景下，可能影響公司的未來發展方向。
🤝 儘管選擇獨立研究，Radford計劃與OpenAI及其他AI開發者保持合作，探索新的創新模式。

10、閃極推出國內首款999元AI眼鏡:30g重量挑戰可穿戴新賽道

閃極科技於12月19日發佈了國內首款量產AI眼鏡——閃極AI「拍拍鏡」，起售價999元，預計於2025年1月15日開始發貨。這款眼鏡以經典黑框設計爲主，重量僅50g，實際佩戴感受約30g。搭載索尼1600萬像素攝像頭及瑞聲科技Hi-Fi揚聲器，支持多種AI功能，未來還將通過在線升級增加更多功能。

【AiBase提要:】
🕶️ 閃極AI「拍拍鏡」是國內首款量產AI眼鏡，起售價999元，預計2025年1月15日發貨。
📸 眼鏡搭載索尼1600萬像素攝像頭和瑞聲科技Hi-Fi揚聲器，重量控制在50g，佩戴感受僅30g。
🚀 通過自研Loomo OS系統，支持語音識別、實時翻譯等AI功能，未來可在線升級更多功能。

11、Stable Diffusion3.5Large正式上線亞馬遜 Bedrock平臺

在AWS re:Invent大會上，Stable Diffusion3.5Large（SD3.5Large）正式在亞馬遜Bedrock平臺上線，旨在爲開發者提供一個安全、便捷的生成式人工智能應用開發環境。該模型在文本到圖像生成方面表現卓越，支持多樣化的視覺風格，並能準確響應用戶的輸入。

【AiBase提要:】
🌟 SD3.5Large模型已在亞馬遜Bedrock平臺上線，支持便捷安全的AI應用開發。
🎨 該模型具備多樣風格生成、優異的文本提示遵循性和多元化圖像輸出能力。
🔧 新升級的圖像服務包括穩定圖像超級版和核心版，提供更高質量和性價比的生成解決方案。
詳情鏈接:https://stability.ai/news/stable-diffusion-35-large-is-now-available-on-amazon-bedrock?utm_source=futuretools.io&utm_medium=newspage

12、14萬億token訓練量加持:Falcon3挑戰主流開源AI模型

阿布扎比技術創新研究院（TII）發佈的新一代開源AI模型Falcon3，憑藉14萬億token的訓練量和優化的架構設計，在消費級硬件上表現出色，創下新紀錄。與前代產品相比，Falcon3的訓練規模翻倍，展現出強勁的競爭力，尤其是在與其他主流開源模型的基準測試中表現優異。

【AiBase提要:】
🚀 Falcon3系列推出四種規格，滿足不同用戶需求，支持多種語言處理。
🏆 在Hugging Face的評測中，Falcon3超越了多款主流開源模型，展現出強大的性能。
💡 TII計劃在2025年推出多模態模型，進一步擴展Falcon3的應用場景。

AI日報：支付寶推AI創意生成平臺；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準備o3推理模型

相關推薦

大模型公司造手機搶跑OpenAI:階躍星辰7月13日發首款AI智能體終端

OpenAI發佈GPT-5.6，深綁微軟Copilot365破除“分道揚鑣”傳聞

OpenAI"二號人物"卸任:因神經免疫系統疾病復發，Fidji Simo轉任兼職顧問

OpenAI大整合：聊天、辦公、編程三合一，全新ChatGPT桌面應用上線

OpenAI發佈GPT-5.6模型系列:Sol、Terra、Luna三版本上線，主打網絡安全與高性價比