歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、OpenAI推出全新的模型系列OpenAI o1

OpenAI推出了全新的模型系列OpenAI o1,這個新模型在推理能力上表現得更加出色,爲解決複雜問題提供了更強的推理能力。用戶需要調整提示方式以適應o1模型的工作方式,提示工程發生了重大變革,用戶需要給出簡單直接的提示,避免使用思路鏈提示,使用分隔符來明確模型解析的部分,並限制額外上下文以避免複雜回答。

【AiBase提要:】

🤖 OpenAI o1模型需要簡單、直接的提示,而非複雜的指導。

🧠 避免使用思路鏈提示,因爲o1模型已經具備內部推理能力。

📑 使用分隔符來明確模型解析的部分,並限制額外上下文以避免複雜回答。

詳情鏈接:https://openai.com/index/introducing-openai-o1-preview/

2、谷歌Gemini Live語音聊天向安卓用戶免費開放,隨時隨地與AI聊天!

谷歌宣佈Gemini Live語音聊天模式現在免費向所有安卓用戶開放,這意味着每個人都可以體驗智能對話AI的樂趣。用戶可以隨時用聲音提問,甚至在回答過程中打斷,爲用戶帶來流暢的語音交互體驗。Gemini Live爲用戶提供了一種新的交互方式,無論在家中還是外出,都能隨時與AI進行有趣的對話。

【AiBase提要:】

🌟 Gemini Live語音聊天功能現在免費向所有安卓用戶開放!

🗣️ 用戶可以直接用聲音提問,甚至在回答時打斷。

🌍 目前僅支持英文,未來將在iOS上推出並支持更多語言。

3、Midjourney 7. 0 版本或在 2 個月內發佈 一次性可生成 8 張圖,正開發3D系統

Midjourney創始人David Holz在Discord上分享公司最新項目進展,強調技術創新以競爭AI圖像生成領域。公司推遲發佈7.0版本,但功能更豐富。重點在提高技術可訪問性和工具專業使用價值。計劃推出多圖生成、圖像編輯器、3D系統、個性化功能和視頻生成。公司選擇穩健發展道路,注重提升用戶體驗。

【AiBase提要:】

🚀7.0版本推遲但功能更豐富,重點在提高技術可訪問性和工具專業使用價值。

🎨 新功能包括多圖生成、圖像編輯器、3D系統、個性化和視頻生成,提升用戶體驗。

💡 Midjourney選擇穩健發展道路,注重實用功能和用戶體驗,以保持競爭優勢。

詳情鏈接:https://top.aibase.com/tool/midjourneywangyeban

4、元象發佈MoE開源大模型XVERSE-MoE-A36B

作爲中國最大的Mixture of Experts(MoE)開源大模型,XVERSE-MoE-A36B的發佈標誌着中國在AI領域的重大進步,將國產開源技術提升至國際領先水平。該模型的性能和效率帶來了訓練時間的縮短、推理性能的提升,以及降低了AI應用的成本,爲中小企業、研究者和開發者提供了更多選擇機會。

image.png

【AiBase提要:】

🚀 XVERSE-MoE-A36B擁有255B總參數和36B激活參數,性能可與超過100B參數的大模型相媲美,實現了跨級的性能躍升。

💡 MoE架構通過組合多個細分領域的專家模型,打破了傳統擴展定律的侷限,保持了模型性能最大化,降低了計算成本。

📈 元象MoE在權威評測中超越了多個同類模型,包括國內千億MoE模型Skywork-MoE、傳統MoE霸主Mixtral-8x22B等。

詳情鏈接:https://huggingface.co/xverse/XVERSE-MoE-A36B

5、Fish Speech1.4發佈:開源TTS模型迎來多語言突破

Fish Speech1.4版本的發佈標誌着這款開源文本轉語音(TTS)模型在多語言支持和性能方面取得了重大突破。更新展現了強大的技術實力和廣闊的應用前景。

【AiBase提要:】

🌐 多語言支持大幅提升: 訓練數據量翻倍至70萬小時,支持8種主要語言,拓展了應用範圍。

⚡ 性能與功能全面升級: 超快速度與低延遲,即時語音克隆功能,靈活部署選項和API服務。

🚀 應用前景廣闊: 教育領域支持語言學習,娛樂產業即時語音克隆,輔助技術視障人士工具,智能客服和跨文化交流。

詳情鏈接:https://fish.audio/zh-CN/auth/

6、告別幻覺!谷歌推新模型DataGemma,統計數據準確率暴漲58%

谷歌推出新的開源AI模型DataGemma,旨在解決大語言模型在處理統計數據時常出現的“幻覺”問題,標誌着谷歌在AI領域的重要進展。DataGemma利用谷歌的數據共享平臺,顯著提升模型回答統計問題的準確性。初步測試顯示,DataGemma在統計查詢準確性方面有顯著提升。

【AiBase提要:】

🌟 DataGemma模型旨在減少AI在統計查詢中的錯誤,提高準確性。

📊 DataGemma利用Data Commons平臺數據,增強模型回答的準確性。

🔍 DataGemma在初步測試中表現出顯著的統計查詢準確性提升。

詳情鏈接:https://huggingface.co/collections/google/datagemma-release-66df7636084d2b150a4e6643

7、Jina AI推出Reader-LM小型語言模型

Jina AI推出的Reader-LM小型語言模型爲將原始HTML內容轉化爲乾淨整潔的Markdown格式提供了便利,擺脫了繁瑣的網頁數據處理。該模型快速高效,自動剔除雜亂內容,展現出優異性能和高準確性。

image.png

【AiBase提要:】

✨ Reader-LM能快速高效轉換網頁內容爲Markdown,無需複雜規則或正則表達式。

🔍 提供兩個參數模型,優化HTML轉Markdown任務,性能超越大型模型。

💡 具備強大長上下文處理能力,在資源受限環境中也能高效運行。

詳情鏈接:https://jina.ai/news/reader-lm-small-language-models-for-cleaning-and-converting-html-to-markdown/

8、估值2000萬美元!AI工具Shopsense AI 支持拍照就能買到明星同款

在MTV音樂錄像帶大獎(VMAs)上,觀衆們通過Shopsense AI技術可以即時購買明星造型相似的服裝,展現出未來購物體驗的可能性。雖然技術仍需提升準確性,但Shopsense正不斷改進,以與其他媒體公司競爭。其商業模式多元,通過點擊付費和銷售分成獲取收入,市場潛力巨大。

image.png

【AiBase提要:】

🌟 觀衆可通過上傳照片獲取與明星造型相似的商品推薦,包括高端和親民選擇。

🛍️ Shopsense AI計劃擴展到旅遊、運動等其他領域的商品推薦,實現內容與購物的無縫連接。

📈 Shopsense AI與Paramount合作,爲觀衆提供即時購買明星造型相似服裝的便利體驗。

9、一場商標之戰!谷歌因使用 “Gemini” 標名稱被起訴侵權

最近,谷歌因其新推出的 AI 服務 “Gemini” 而被一家名爲 Gemini Data 的公司起訴,指控其侵犯商標權。這起糾紛揭示了大型科技公司在商標使用上的挑戰和法律風險,警示企業在命名新產品或服務時需謹慎考慮已有商標。

【AiBase提要:】

🌟 谷歌因使用 “Gemini” 商標被 Gemini Data 起訴,指控其侵犯商標權。

🔍 谷歌在申請商標時遭到拒絕,因該名稱與其他商標相似。

🤖 谷歌的 Gemini 聊天機器人承認正在侵犯商標,反映出雙方的法律糾紛。

10、阿聯酋國有投資公司 MGX 考慮向 OpenAI 投資數十億美元

阿聯酋國有投資公司MGX考慮向OpenAI投資數十億美元,這一舉動將進一步推動OpenAI的融資計劃,顯示出OpenAI強勁的商業表現。同時,MGX的成立旨在加速人工智能和先進技術的發展,鞏固阿聯酋在全球科技領域的領先地位。

【AiBase提要:】

💰 MGX考慮向OpenAI投資數十億美元,推動OpenAI融資計劃。

🤖 OpenAI年化經常性收入達40億美元,展現強勁商業表現。

🌍 MGX由穆巴達拉與G42共同創辦,專注於人工智能和先進技術的發展。

11、強得可怕!有人測試用OpenAI o1解答高中數學期末考題,竟全對了

這篇文章介紹了一位Reddit網友使用OpenAI最新模型OpenAI o1解答高中數學題的驚人效果。他對人工智能的能力充滿好奇,通過測試發現OpenAI o1在短時間內準確解答了中國高中數學考題,引起了網友的關注與討論。結果顯示了AI在處理複雜數學問題上的強大能力,引發了對AI未來應用前景的討論。

image.png

【AiBase提要:】

🤖 AI能力驚人:OpenAI o1在短時間內準確解答高中數學考題,全對

💡 科技進步引發思考:網友對AI未來發展提出疑問,討論教育領域的影響

🌐 智能化學習輔助:AI在教育領域有巨大潛力,爲學生提供智能化學習輔助