歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、谷歌推超強多模態模型實驗版Gemini1.5Pro,排名領先GPT-4o、Claude-3.5Sonnet

谷歌今天推出了Gemini1.5Pro實驗版本0801,在人工智能領域取得重大突破。Gemini1.5Pro在多任務表現出色,具有多模態能力和廣闊上下文窗口,引發了AI發展和社會影響的討論。

image.png

【AiBase提要:】

🚀 谷歌推出Gemini1.5Pro實驗版本0801,在排行榜上領先競爭對手。

💪 該模型在多任務中表現出色,具有多模態能力和廣闊上下文窗口。

⚖️ 發佈引發AI發展和社會影響的討論,谷歌尋求反饋以完善模型。

詳情鏈接:https://top.aibase.com/tool/gemini-pro

2、AI圖像生成迎來新霸主!開源模型FLUX.1橫空出世,Midjourney、DALL·E3緊張了?

在人工智能領域,每一天都可能發生顛覆性的變革。FLUX.1作爲一匹令人矚目的黑馬,以其強大性能和開源特性引爆了AI圈。創始人Robin Rombach的權威背景和FLUX.1的創新架構使其成爲AI圖像生成領域的新霸主,爲整個AI行業注入新活力。

image.png

【AiBase提要:】

🚀 FLUX.1超越閉源模型和開源SD3系列,性能大幅領先

💡 基於Vision Transformer架構,採用流程匹配訓練方法,提升模型性能

🌟 FLUX.1展現出在文本嵌入圖片等方面的明顯優勢

詳情鏈接:https://github.com/black-forest-labs/flux

3、Stability AI推新AI模型Stable Fast3D:半秒內生成3D圖像 速度提升1200倍

Stability AI最新推出的Stable Fast3D技術實現了從單張圖像快速生成3D圖像,處理速度比之前快1200倍,具有廣泛的實用價值。該技術基於先進的生成式AI模型,爲設計、建築、零售、虛擬現實和遊戲開發等多個行業帶來革命性變革。

image.png

【AiBase提要:】

😃Stable Fast3D技術實現半秒內生成3D圖像,速度大幅提升

👍新模型在設計、建築、零售、虛擬現實和遊戲開發等多個行業具有實用價值

👏Stability AI持續引領圖像生成技術發展,從2D到4D不斷創新

詳情鏈接:https://top.aibase.com/tool/stable-fast-3d

4、AI視頻創作平臺Hedra融資1000萬美元

近日,AI視頻創作領域迎來重磅消息,Hedra成功籌集1000萬美元種子資金,引發廣泛關注。Hedra推出了視頻基礎模型Character-1,已有超35萬用戶創作超160萬視頻,部分走紅網絡。多家公司推出視頻生成模型,大公司積極參與AI驅動的視頻創作。

【AiBase提要:】

🔥 Hedra獲1000萬美元種子資金,推出Character-1模型。

💡 超35萬用戶使用Character-1創作超160萬視頻,部分走紅網絡。

🚀 多家公司推出視頻生成模型,大公司積極參與AI驅動的視頻創作。

詳情鏈接:https://www.hedra.com/blog/announcement

5、阿里語音合成模型CosyVoice更新 讓AI說話更有人味兒 

阿里巴巴推出的最新語音合成模型CosyVoice展示了未來人機交互的美好藍圖,逼真度和靈活性令人驚歎。該技術不僅能生成符合特定性別、年齡和個性的聲音,還能模擬人類說話時的自然特徵,添加情感和風格,使AI表達更加豐富多彩。CosyVoice與SenseVoice構成FunAudioLLM框架,提升語音交互體驗,支持多語言識別和情感識別。技術突破預示着人機交互將迎來全新時代,爲教育、娛樂、客戶服務等領域帶來革命性變化。

【AiBase提要:】

🤖 CosyVoice模型展示未來人機交互藍圖,逼真靈活,生成符合性別、年齡、個性聲音,模擬自然特徵,添加情感風格。

🔊 FunAudioLLM框架提升語音交互體驗,SenseVoice支持多語言識別和情感識別,反應速度快,應用前景廣泛。

📚 技術突破預示人機交互新時代,CosyVoice和FunAudioLLM爲教育、娛樂、客戶服務等領域帶來革命性變化。

詳情鏈接:https://top.aibase.com/tool/cosyvoice

6、阿里國際站AI生意助手再升級:文本類AI生成能力完全免費

阿里巴巴國際站總裁張闊宣佈AI生意助手的全新發布,包括極簡發品功能和AI自動接待功能。AI技術的應用顯著降低外貿行業門檻,已有3萬家中小企業使用,優化後的商品曝光量提高了37%,支付轉化率提升了50%。AI生意助手成爲商家高效經營和快速接單的得力助手。更新的三大權益提供更靈活的使用方式,文本類AI生成能力免費,不滿意的功能可免費二次生成。將持續更新更多功能。

【AiBase提要:】

🚀 AI生意助手極簡發品功能縮短商家發佈時間至最快60秒。

💬 AI自動接待功能提升海外買家二次回覆率約40%。

💡 AI技術應用降低外貿行業門檻,3萬家中小企業使用,商品曝光量提高37%,支付轉化率提升50%。

7、桌面ChromeAI搜索升級,引入類似Circle to Search的功能

Google Lens在桌面版Chrome中進行AI驅動的升級,爲用戶帶來更便捷的搜索體驗。用戶可以通過點擊搜索框中的新按鈕激活Google Lens,實現多重搜索並查看文本和圖像搜索結果。此更新將全球推出,部分功能僅對美國用戶開放。另外,Chrome還新增了AI功能,允許用戶通過提問搜索歷史來查找鏈接。這些功能將逐步在未來幾天或幾周內在美國用戶中推出。

image.png

【AiBase提要:】

🌐 Google Lens在桌面版Chrome進行AI驅動升級,用戶可通過點擊搜索框按鈕激活並進行多重搜索。

📅 更新將在“未來幾天”全球推出,部分功能僅對美國用戶開放。

💬 Chrome新增可詢問搜索歷史的AI功能,將“在未來幾周內”在美國推出,用戶可選擇,目前依靠雲模型提供結果。

8、以色列人工智能初創公司aiOla推出超高速開源語音識別模型Whisper-Medusa

aiOla推出的Whisper-Medusa語音識別模型在速度上比OpenAI的Whisper提升了50%,並保持了準確性。這一舉措將加快語音應用的響應速度,提升效率,降低成本。

image.png

【AiBase提要:】

💥 速度提升50%: Whisper-Medusa比OpenAI的Whisper速度快50%

🎯 不損準確性: Whisper-Medusa在提升速度的同時保持了與原模型相同的準確性

📈 應用前景廣: Whisper-Medusa有望加快語音應用的響應速度,提升效率,降低成本

9、Suno聲稱用受版權保護的音樂進行訓練模型是“合理使用”

本文報道了美國唱片業協會(RIAA)對音樂生成初創公司 Udio 和 Suno 提起訴訟的情況。Suno 承認使用受版權保護的音樂訓練其 AI 模型,並聲稱這屬於合理使用。RIAA 對此表示不認同,認爲這是侵權行爲。案件結果可能影響相關領域的先例。

【AiBase提要:】

🎶 RIAA 起訴 Udio 和 Suno 使用版權音樂訓練模型。

💻 Suno 承認用受版權保護的音樂進行訓練模型,但稱此爲合理使用。

👀 案件結果可能開創影響相關領域的先例。

10、微軟首次在SEC文件中將OpenAI列爲競爭對手

微軟近日在提交給美國證券交易委員會(SEC)的年度10K報告中,首次將其長期合作伙伴OpenAI列爲競爭對手,引發業界猜測。這一舉動可能受當前反壟斷環境影響,微軟與OpenAI的關係走向仍有待觀察。

【AiBase提要:】

🔍 微軟將OpenAI列爲競爭對手,引發業界關注。

💰 微軟投資OpenAI130億美元,成爲獨家雲提供商。

🔄 合作伙伴與競爭對手並非互斥,微軟與OpenAI關係變化有先例。

11、庫克稱蘋果AI將推動用戶升級

蘋果公司在2024年第三財季取得了穩健的財務業績,尤其是服務營收實現了增長。蒂姆·庫克透露了關於Apple Intelligence的部分特性和未來發布的新款iPhone16,展望了蘋果在人工智能領域的發展。

image.png

【AiBase提要:】

📈 蘋果公司2024年第三財季總淨營收達857.77億美元,同比增長5%。

📱 iPhone營收達392.96億美元,Mac和iPad營收增長,服務營收達242.13億美元。

🚀 Apple Intelligence功能將逐步推出,新款iPhone16即將發佈,將支持AI技術。

12、300餘名視頻遊戲演員聯合抗議 聲討好萊塢無監管AI使用!

在好萊塢星光閃耀的背後,演員們團結起來抗議無監管AI使用,維護自身權益。這場抗議凸顯了人工智能時代下演員生存權的重要性。

【AiBase提要:】

🎭 演員抗議無監管AI使用,維護權益。

💼 人工智能威脅演員生存,聲音形象或被濫用。

💰 演員與遊戲公司談判僵局,關鍵在於誰是表演者。

13、港大與MIT聯手打造ItiNera:你的私人AI導遊,一鍵規劃完美Citywalk路線!

在都市的喧囂中,每個人都渴望一場說走就走的citywalk,穿梭於大街小巷,探索歷史遺蹟,沉浸在當地文化之中。ItiNera系統通過結合空間優化與大型語言模型,提供個性化的城市行程規劃服務,爲旅行者帶來全新的探索城市方式。

image.png

【AiBase提要:】

🌆 ItiNera是開放域城市行程規劃系統,能根據用戶自然語言描述生成個性化行程。

🗺️ ItiNera利用LLM與空間優化模塊,提取和排序POIs,打造空間連貫的行程。

🔓 ItiNera已在TuTu在線旅行服務上部署,吸引數千用戶使用其城市旅行規劃服務。

詳情鏈接:https://arxiv.org/pdf/2402.07204