歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、萬物皆可一鍵毛茸茸!阿里通義App上線“局部風格化”功能

通義App最近推出的“局部風格化”功能引發了社交平臺的熱潮。用戶只需簡單操作,就能爲照片添加多種風格化效果。通義萬相ACE圖片編輯模型的支持,使得用戶可以通過簡單描述實現圖像編輯,極大地降低了使用門檻。

image.png

【AiBase提要:】

🖼️ 用戶可以通過通義App的“局部風格化”功能,輕鬆爲照片中的特定對象添加風格化效果。

✨ 首批上線的風格模板包括針織、毛絨、冰雕和陶瓷等七種,豐富了用戶的選擇。

🤖 該功能基於通義萬相ACE模型,用戶只需口語化描述意圖,即可完成各種圖像編輯任務。

2、阿里國際AI團隊開源開放型問題推理模型Marco-o1

阿里巴巴國際AI團隊推出的Marco-o1模型,專注於解決開放型問題,超越了傳統的標準答案領域。該模型通過創新的self-play和MCTS技術,構建了具備反思能力的超長CoT數據,展現了在機器翻譯和其他領域的強大能力。

image.png

【AiBase提要:】

🧠 Marco-o1模型專注於開放型問題的解決,超越了傳統的學科領域。

🔍 該模型通過self-play和MCTS技術,構建了具備反思和改正能力的超長CoT數據。

🌐 研究團隊計劃開源更多數據與模型,推動AI領域的進一步發展。

詳情鏈接:https://modelscope.cn/models/AIDC-AI/Marco-o1

3、Anthropic發佈開源MCP協議 推動AI系統與數據源的雙向連接

Anthropic推出的模型上下文協議(MCP)旨在通過連接AI助手與多種數據源,提高查詢響應的質量和相關性。MCP解決了AI助手與數據源之間的隔離問題,允許開發者在應用程序與數據源之間建立雙向連接,簡化了系統的擴展性。

【AiBase提要:】

🌐 MCP協議允許AI助手直接從多個數據源提取信息,解決信息孤島問題。

🔄 開發者可以通過MCP服務器共享數據,簡化與不同數據源的連接。

📈 目前已有多家公司集成MCP,Anthropic還提供了預構建的MCP服務器以支持企業應用。

詳情鏈接:https://www.anthropic.com/news/model-context-protocol

4、Runway推圖像生成模型Frames 專注特定美學,重構創意邊界

Runway的Frames模型以革命性的方式重新定義了視覺創作的可能性。Frames的獨特之處在於其對風格和美學的精細控制,使每一幀都能展現出藝術家的風格,同時激發創意的多樣性。

【AiBase提要:】

✨ Frames模型提供細粒度的控制,用戶可精確調整圖像的外觀和氛圍。

🌈 該工具在保持風格一致的同時,激發創意的多樣性,適合各種視覺項目。

🚀 Frames不僅是技術升級,更是創意民主化的突破,適合所有創作者。

詳情鏈接:https://runwayml.com/research/introducing-frames

5、腦洞大開!Luma推全新Dream Machine 文字、圖像、視頻一條龍服務

Luma AI推出了Dream Machine平臺,旨在簡化高質量圖像和視頻的創作過程,適合各種技術水平的用戶。該平臺基於先進的Photon圖像基礎模型,允許用戶通過自然語言或參考圖像進行創作,省去複雜的提示工程。Dream Machine的直觀設計和強大的功能,如角色參考、鏡頭運動等。

【AiBase提要:】

🖼️ Dream Machine平臺基於Luma最新的Photon模型,支持高質量圖像生成。

💬 用戶可以通過自然語言描述或上傳參考圖像,簡化創作過程。

🎥 平臺提供動畫故事情節制作功能,確保視頻中的角色一致性。

詳情鏈接:https://lumalabs.ai/dream-machine

6、英偉達出品!AI音頻模型Fugatto:輸入文本、音頻可生成音樂、音效

Fugatto是NVIDIA推出的一款革命性音頻生成模型,具備25億參數,旨在通過文本和音頻輸入爲音樂創作提供靈活支持。該模型突破了傳統音頻生成的侷限,採用創新的數據生成方法和可組合音頻表示變換技術,使藝術家和開發者能夠實時生成和修改聲音。

【AiBase提要:】

🎵 Fugatto是NVIDIA推出的音頻AI模型,擁有25億參數,支持文本與音頻輸入。

💻 採用創新的數據生成方法和可組合音頻表示變換技術,使得用戶能夠靈活生成和修改聲音。

🌟 初步測試顯示,Fugatto在音頻合成與變換方面的表現優於多種專業模型。

詳情鏈接:https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/

7、新型AI圖像生成框架OminiControl:可將素材主體融入生成圖片中

OminiControl是新加坡國立大學研究團隊提出的圖像生成框架,旨在提升圖像生成的靈活性和效率。通過參數重用機制,該框架能夠以更少的額外參數處理圖像條件,顯著提高生成能力。它還提供了一個名爲Subjects200K的數據集,包含超過20萬張一致性圖像,爲研究人員提供了豐富的資源。

image.png

【AiBase提要:】

🌟 OminiControl通過參數重用機制,讓圖像生成的控制能力更強大,效率更高。

🎨 該框架能同時處理多種圖像條件任務,如邊緣、深度圖等,適應不同創作需求。

📸 團隊發佈了超過20萬張圖像的數據集Subjects200K,助力進一步的研究與探索。

詳情鏈接:https://huggingface.co/spaces/Yuanshi/OminiControl

8、三星有意將ChatGPT集成到Galaxy AI,挑戰谷歌Gemini

金融分析師Dan Nystedt透露,OpenAI正與三星電子洽談合作,計劃將ChatGPT集成到三星最新的Galaxy AI系統中。這一合作有望提升三星AI系統的語言理解和交互能力,可能對谷歌的Gemini構成挑戰。

【AiBase提要:】

📱 三星與OpenAI洽談將ChatGPT集成到Galaxy AI,提升語言理解能力。

🌐 此次合作可能對谷歌的Gemini模型造成重大沖擊,打破其市場主導地位。

🤝 這並非首次合作傳聞,三星與OpenAI的互動潛力持續加深。

9、蘋果公佈2024年度iPhone應用”入圍名單, AI應用再度被冷落

蘋果公司近日公佈了2024年“年度iPhone應用”入圍名單,顯示出對人工智能技術在移動應用生態系統中影響的低估。儘管ChatGPT等AI應用在市場上表現出色,但在提名中卻未能獲得認可。

【AiBase提要:】

📉 蘋果2024年“年度iPhone應用”提名名單再次忽視了AI應用的影響。

🎨 提名的應用主要聚焦於激發人類創造力,而非依賴AI自動化功能。

🏆 少數AI應用在iPad和Mac的年度提名中出現,但整體提名數量較少。

10.Kimi 數學版上線,科學思維解讀生活

Kimi 數學版正式上線,用戶可通過網頁與 k0-math 模型互動,深入理解數學知識。此版本支持 LaTeX 輸入及公式轉換,提升用戶體驗。未來將推出移動版,團隊致力於優化功能和互動性,增強用戶在學習數學時的樂趣。

【AiBase 提要:】  

🌟 Kimi 數學版通過 k0-math 模型提供數學互動體驗。  

🎮 用戶可通過此版解答問題,享受科學維解讀生活。  

📚 支持 LaTeX 輸入和公式截圖轉換,方便用戶操作。

11、英特爾研究顯示使用AI PC每週能省4小時工作時間

英特爾公司最新發佈的研究報告揭示,AI電腦能夠顯著提高用戶的工作效率,平均每週爲用戶節省超過240分鐘的工作時間。這項研究強調了AI電腦在任務處理、隱私保護和自適應學習方面的優勢。

【AiBase提要:】

⏳ AI PC 每週可爲用戶節省240分鐘的日常工作時間。

💰 科技公司預計到2025年將在 AI 基礎設施上投入超過2000億美元。

⚠️ AI 初創企業面臨融資挑戰,可能會減緩創新速度。