歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品 點擊瞭解:https://top.aibase.com/

📰🤖📢AI新鮮事
斯坦福推可以在手機端跑的大模型 Octopusv2超越GPT-4一夜爆火

【AiBase提要:】
⭐️ 斯坦福大學推出Octopusv2,20億參數模型,可在手機等設備上運行,準確性和延遲超越GPT-4,上下文長度減少95%。
⭐️ 設備端AI智能體時代來臨,Octopusv2開發過程創新函數token策略,訓練方法提高推理速度,表現優異。
⭐️ Octopus-V2-2B在性能評估中表現卓越,速度提高168%,爲設備端AI發展注入新活力。
論文地址:https://arxiv.org/abs/2404.01744
模型主頁:https://huggingface.co/NexaAIDev/Octopus-v2
90後小夥用AI“復活”逝者,一年成交1000單
【AiBase提要:】
⭐️90後小夥張澤偉使用AI技術,爲逝者塑造數字形象,已接超過1000筆訂單。
⭐️ 他的團隊通過還原逝者的相貌、聲音,讓客戶能與其數字形象互動。
⭐️ 這種業務獨特之處在於AI技術生成逝者數字形象的反應,無需人類扮演。
OpenAI爲開發者添加新功能 允許構建自定義模型

【AiBase提要:】
⭐️ 開發者可以使用OpenAI的新功能構建特定於組織、業務領域、任務需求的自定義模型。
⭐️ 自定義模型包括專門知識庫、特定數據理解、執行任務或特定輸入響應。
⭐️ OpenAI提供微調API、自定義訓練模型程序和輔助微調服務等功能幫助開發者構建自定義模型。
詳細內容:https://openai.com/blog/introducing-improvements-to-the-fine-tuning-api-and-expanding-our-custom-models-program
OpenAI 轉錄了超過一百萬小時的 YouTube 視頻來訓練 GPT-4
【AiBase提要:】
🤖 OpenAI使用YouTube視頻轉錄訓練GPT-4
📚 AI公司遇到高質量訓練數據挑戰
⚖️ 公司處理數據問題涉及版權法模糊區域
AI視頻理解天花板,全新MiniGPT4-Video刷爆SOTA!寶格麗宣傳片配文一絕

【AiBase提要:】
⭐ MiniGPT4-Video框架能理解複雜視頻,還能創作詩歌配文。
⭐ 支持處理時態視覺數據和文本數據,善於理解視頻的複雜性。
⭐ 在多個基準測試中,MiniGPT4-Video有顯着提高,可爲視頻配文、廣告等提供強大解讀能力。
論文:https://arxiv.org/pdf/2404.03413.pdf
DeepMind發佈Gecko: 專注於文檔檢索 性能媲美大7倍模型

【AiBase提要:】
🦎 Gecko是通用文本嵌入模型,專注於文檔檢索、語義相似度和分類任務。
🦎 Gecko通過從LLM中提煉知識,融入檢索器,實現強大檢索性能。
🦎 在大規模文本嵌入基準上,256維Gecko優於768維現有模型。
論文地址:https://arxiv.org/pdf/2403.20327.pdf
微軟投資1000億美元推動生成式AI,這支股票有望大漲
【AiBase提要】
🧠 微軟部署基於 Arm 設計的定製芯片,有望爲 Arm Holdings 帶來增長。
📈 Arm Holdings 已受益於人工智能芯片增長,微軟項目或進一步推動其業績。
🔋 微軟可能通過定製芯片減少對其他公司依賴,提高性能降低成本,有望帶動 Arm 收入增長。
馬斯克的朋友將幫助 xAI 籌集30億美元
【AiBase提要:】
🤑 投資者與馬斯克有着密切關係,計劃幫助 xAI 籌集30億美元。
🤖 xAI 與 OpenAI 和 Anthropic 等競爭對手展開競爭,加緊發展在競爭激烈的人工智能領域。
💼 人工智能人才爭奪戰激烈,xAI 和其他競爭對手競相吸引和留住。
AI下一個重大飛躍是理解情感,第一個具有情商的對話型AI來了

【AiBase提要:】
⭐️ HumeAI發佈具有情感識別能力的對話AI,能檢測53種情緒。
⭐️ HumeAI致力於理解和迴應用戶情感,通過聲音特徵實現互動。
⭐️ 提供API讓用戶訓練自己的AI模型,應用廣泛覆蓋健康、客服等領域。
官網地址:https://dev.hume.ai/docs/expression-measurement-api/overview
金山辦公 WPS365將發佈一站式AI辦公產品
【AiBase提要:】
⭐ WPS365將強調提升用戶辦公效率與體驗
⭐ 套件包含內容創作工具和協作軟件
⭐ 核心理念是統一工具、協作和管理
🤖📱💼AI應用
Infinity AI:輸入劇本即可一鍵生成電影 還提供數字人克隆功能

【AiBase提要:】
⭐ 目標:只需要輸入劇本內容,即可一鍵生成電影,官方已經發布Demo
⭐ 技術團隊成功克隆CEO形象展示產品功能,提出未來小團隊藉助AI有望贏得奧斯卡獎預言。
⭐ 提供克隆自己服務,用戶可以通過錄制視頻訓練定製AI模型,生成包含自己聲音和麪部表情的視頻內容。
官網:https://top.aibase.com/tool/infinity-ai
在線體驗地址:https://studio.infinity.ai/
詳細教程及視頻:https://qqi2gjmnk4.feishu.cn/wiki/HTmRwpZ1hiRONpkZ3SIce89ynuc?fromScene=spaceOverview
谷歌推Scenic:可識別視頻內容 並生成詳細描述

【AiBase提要:】
🔍 提供 SOTA 模型和基線模型,支持快速原型設計大規模視覺模型。
🔍 使用 JAX 和 Flax 進行開發,支持圖像、視頻、音頻和多模態組合模型。
🔍 能識別視頻內容並生成詳細描述,提供功能豐富的基線模型和數據集。
產品入口:https://top.aibase.com/tool/scenic
CameraCtrl:讓文本生成視頻實現鏡頭控制 支持AnimateDiff控制鏡頭

【AiBase提要:】
⭐鏡頭控制在視頻生成中至關重要
⭐通過訓練鏡頭編碼器實現插拔式鏡頭模塊
⭐不同數據集視頻增強鏡頭控制的可控性和泛化性
產品入口:https://hehao13.github.io/projects-CameraCtrl/
Lixel CyberColor:自動生成無限大的電影級效果的3D場景

【AiBase提要:】
⭐️ LCC採用Multi-SLAM和高斯濺射技術生成電影級效果的3D場景。
⭐️ XGRIDS的Multi-SLAM算法和3DGS技術創造逼真大型3D模型。
⭐️ XGRIDS提供LCC插件和SDK支持在多平臺上無限複製3D內容。
官網地址:https://xgrids.com/lcc
AI語音識別工具Universal-1:38秒可以處理60分鐘音頻 比fast Whisper更快
【AiBase提要:】
⭐️ Universal-1提供準確魯棒的多語言語音轉文字功能
⭐️ Universal-1通過時間戳估計提高了準確性和說話者辨識
⭐️ AssemblyAI利用Conformer RNN-T架構和Google Cloud TPUs構建了高效的Universal-1模型
產品入口:https://top.aibase.com/tool/universal-1
InstantStyle: 文本生成圖像風格參考,用於SD保持風格一致

【AiBase提要:】
⭐️ 內容和風格有效分離,通過簡單但強大的技術實現。
⭐️ CLIP全局特徵的應用,明確風格和內容的解耦。
⭐️ 不同層級網絡捕捉不同語義信息,實現更好的風格保留效果。
————
每日midjourney prompt:性感電商模特

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
A beautiful Chinese Girl,Detailed facial details,long hair ,dark hair, wearing a short pink satin dress. She is sitting on concrete stairs in front of a tiled building facade. The lighting is soft and natural, with sunlight casting shadows --ar3:4--v6.0--style raw
一個美麗的中國女孩,詳細的面部細節,長髮,深色頭髮,穿着一件粉紅色的緞面短裙。她坐在瓷磚建築正面前的混凝土樓梯上。燈光柔和自然,陽光投射出陰影
