歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、階躍星辰視頻生成大模型Step-Video開啓內測 可在躍問視頻申請

階躍星辰的Step-Video模型正式開啓內測,用戶可以通過躍問視頻官網申請資格。該模型支持從文本生成高達1080P分辨率、最長10秒的視頻,展現出在自動優化提示詞、美學風格和運動控制方面的顯著優勢。

image.png

【AiBase提要:】

🎬 Step-Video模型支持從文本生成高清視頻,分辨率高達1080P,最長可達10秒。

🌟 在美學風格上,Step-Video對中國風題材的理解和生成尤爲精準,符合古詩意境。

⚙️ 該模型在運動控制方面表現優異,能夠生成符合物理規律的視頻,處理複雜的空間關係。

詳情鏈接:https://top.aibase.com/tool/yuewenshipin

2、Luma發佈全新圖像生成模型Luma Photon,速度更快,成本更低!

Luma Labs推出的Luma Photon和Photon Flash是兩款革命性的圖像生成模型,具有超高的生成速度和低成本優勢。Luma Photon在多項測試中表現出色,能夠生成高質量的圖像,適用於廣告、影視、藝術等多個領域。

【AiBase提要:】

🚀 Luma Photon生成圖像速度是市場上其他模型的10倍,成本低至0.2美分每張1080p圖片。

🎨 支持多輪自然語言指令,用戶可逐步優化生成內容,適合複雜創意任務。

📈 在質量、創造力和理解力方面,Luma Photon在雙盲評估中超越市場上所有模型。

詳情鏈接:https://lumalabs.ai/photon

3、可靈AI導演共創計劃作品12月6日上線 將發佈9部電影級AI視頻

快手科技宣佈將於12月6日正式上線中國首個AIGC導演共創計劃——“可靈AI導演共創計劃”。此計劃由快手自研的視頻生成大模型“可靈AI”聯合多位知名導演共同發起,旨在通過AI技術拓寬影視創作的邊界。

image.png

【AiBase提要:】

🎥 計劃由快手科技與9位知名導演共同發起,涵蓋多元題材。

🤖 所有短片將使用可靈AI進行視頻生成,推動AI技術在影視創作中的應用。

📈 可靈AI自發布以來已服務超500萬用戶,生成5100萬個視頻和1.5億張圖片。

4、字節旗下即夢AI灰測圖片2.1模型 AI生圖終於可以出中文字體了!

字節跳動旗下的即夢AI最近推出了圖片2.1模型,解決了AI圖像生成中文字體的問題。用戶只需簡單輸入文字描述,便可快速生成個性化海報,極大提高了設計師的工作效率。新模型的應用場景廣泛,包括海報製作、書籍封面設計和社交媒體配圖。

image.png

【AiBase提要:】

🎨 新模型支持中文字體生成,提升海報設計效率。

📚 用戶可通過文字描述創建個性化海報和封面。

🌌 模型應用場景廣泛,適用於社交媒體、故事創作等。

詳情鏈接:https://top.aibase.com/tool/jimeng

5、祕塔AI搜索:「學術搜索」數據增加7倍 新增”解釋“功能

上海祕塔網絡科技有限公司最近對其AI祕塔學術搜索功能進行了重大升級,數據量增加了7倍,用戶現在可以更全面地檢索到數千萬篇Open Access論文,包括40%的SCI論文及頂級期刊如《Nature》和《Science》。此次更新還新增了“解釋”功能,幫助用戶理解複雜的文獻內容。

微信截圖_20241203091022.png

【AiBase提要:】

📈 數據量增加7倍,覆蓋數千萬篇Open Access論文,提升檢索能力。

📝 新增“解釋”功能,幫助用戶理解文獻中複雜的句子。

🌍 支持44種語言的翻譯模型,消除小語種論文的閱讀障礙。

6、李飛飛創業首秀:一張圖生成交互式3D 世界,AIGC 進入全新時代!

李飛飛的最新創業項目World Labs,帶來了顛覆性的3D生成技術。用戶只需提供一張圖片或一句話,就能創造出互動的3D場景,標誌着AIGC進入全新的沉浸式時代。這項技術不僅能精準還原細節,還能模擬各種相機效果,賦予用戶導演般的控制感。

【AiBase提要:】

🖼️ 只需一張圖片或一句話,即可生成栩栩如生的3D場景,開啓全新交互體驗。

🎥 該技術支持模擬多種相機效果,讓用戶在3D世界中自由掌控鏡頭。

🚀 World Labs計劃持續提升3D世界的規模和精度,探索更多用戶互動方式。

詳情鏈接:https://www.worldlabs.ai/blog

7、告別語音克隆侵權!Hume AI推出語音控制功能,可創建個性化AI語音

Hume AI最近推出了一項名爲“語音控制”的實驗性功能,使用戶能夠輕鬆創建個性化的AI聲音,無需任何編碼技能。該功能允許用戶通過滑塊調整聲音特徵,提供多種維度的定製選項,旨在滿足多樣化的應用需求。

image.png

【AiBase提要:】

🔊 Hume AI推出“語音控制”功能,用戶可輕鬆創建個性化AI聲音。

🛠️ 該功能無須編碼技能,用戶可以通過滑塊調整聲音特徵。

🌐 Hume旨在通過個性化和情感智能的語音AI來滿足多樣化的應用需求。

詳情鏈接:https://www.hume.ai/blog/introducing-voice-control

8、Cohere推新的搜索模型 Rerank3.5:可處理100多種語言精準查詢

Cohere最近推出的Rerank3.5搜索模型,標誌着企業數據檢索的重大進步。該模型支持超過100種語言的查詢,尤其在阿拉伯語、日語和韓語等主要商業語言中表現出色,幫助跨國公司打破語言障礙。內部測試顯示,Rerank3.5在金融服務領域的表現顯著提升,能夠節省成本並降低風險。

image.png

【AiBase提要:】

📊 Rerank3.5能夠處理100多種語言的查詢,幫助全球企業打破語言障礙。

💡 內部測試顯示,該模型在金融服務領域的搜索表現大幅提升,能節省成本和降低風險。

🚀 Cohere 通過主流雲平臺的部署,力求成爲企業搜索的行業標準,同時企業需隨時適應快速變化的 AI 環境。

詳情鏈接:https://cohere.com/blog/rerank-3pt5

9、OpenAI CFO 迴應廣告傳聞:當前不考慮引入廣告模式

OpenAI的首席財務官Sarah Friar在接受採訪時表示,當前公司並無計劃引入廣告,儘管廣告收入對盈利公司來說是一個誘人的選擇。Friar提到,OpenAI正在快速增長,並在現有商業模式中發現了機會,未來可能會探索其他收入來源。

【AiBase提要:】

🌟 OpenAI CFO Sarah Friar 表示當前無意引入廣告,未來有可能探索其他收入來源。

💼 OpenAI 招聘了多位廣告和市場營銷領域的專家,表明未來或將考慮廣告模式。

🚪 公司高管頻繁變動,創始人 Sam Altman 依然在努力推動公司願景。

10、提到 “David Mayer”一詞ChatGPT就崩潰,這是什麼神祕力量?

最近,社交媒體上出現了一個讓人困惑的現象:OpenAI的聊天機器人ChatGPT在提到“David Mayer”時無法正常回應,並強制結束對話。這一現象引發了網友們的廣泛討論與猜測,許多人嘗試詢問ChatGPT有關“David Mayer”的信息,卻都遭遇了同樣的結局。

image.png

【AiBase提要:】

🌐 ChatGPT在提到“David Mayer”時無法迴應,並強制結束對話。

🔍 “David Mayer”可能與法律問題有關,涉及GDPR被遺忘權。

🤔 其他姓名同樣會導致ChatGPT出現故障,凸顯AI模型的複雜性。

11.WPS Office 推出 AI 語音速記功能

WPS Office 近期發佈了 AI 語音速記功能,增強了語音轉文字的體驗,支持實時錄音和多語言互譯。該功能通過聲紋識別和 AI 自動總結提升準確性,並與 WPS 雲文檔深度整合,確保用戶在錄音過程中能順利繼續錄音。用戶可在最新版本的 WPS Office 中輕鬆找到並使用此功能。

微信截圖_20241203150637.png

【AiBase 提要:】  

🗣️ 語音速記功能實現實時錄音與音頻轉文字。  

🌐 支持中英等多種語言的互譯功能。  

🔒 提供安全的文檔協作體驗,提升用戶便利性。

12.騰訊發佈混元視頻生成大模型:130 億參數全面開源 

騰訊推出了混元視頻生成模型,擁有 130 億參數,是當前最大開源視頻生成模型。該模型支持高清、真實感視頻生成,適用於廣告和創意視頻等商業應用。用戶可通過騰訊元寶 APP 和騰訊雲接口進行試用或對接,降低了視頻生成的技術門檻,促進了 AI 技術的普及。

【AiBase 提要:】

🎥 混元視頻生成模型具備超寫實質感,適合多種商業場景使用。  

🔧 模型允許用戶細緻刻畫生成內容,提供高度語義遵循。  

🌐 開源模式推動了 AI 視頻生成技術的民主化,鼓勵創意與開發者創新。  

官網:https://aivideo.hunyuan.tencent.com

模型:https://huggingface.co/tencent/HunyuanVideo