歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://app.aibase.com/zh
1、谷歌Gemini 3.0 Pro開始小範圍推送:強化推理能力,正式發佈或在本月底
谷歌DeepMind團隊開始向部分用戶推送Gemini 3.0 Pro模型,該模型在推理能力和多模態處理上有所提升,並計劃在10月底正式發佈。
【AiBase提要:】
🧠 Gemini 3.0 Pro引入Deep Think推理架構,提升多步驟複雜任務處理能力。
🌐 支持文本、圖像、音頻和視頻等多種輸入格式,可生成完整前端代碼。
🚀 谷歌計劃推出輕量級Flash變體版本,滿足移動設備和邊緣計算需求。
2、百度發佈全球領先文檔解析模型 PaddleOCR-VL,重塑OCR技術格局!
百度發佈的PaddleOCR-VL模型在文檔解析領域表現出色,憑藉其輕量高效、多語言支持和高精度識別能力,成爲OCR技術的新標杆。
【AiBase提要:】
🌍 支持109種語言,適用於多種文檔處理任務。
⚙️ 核心參數僅爲0.9B,實現高效計算與精準識別。
🚀 推理速度顯著提升,較其他主流模型表現更優。
3、AI視頻公司愛詩科技完成1億元B+輪融資:ARR突破4000萬美元,用戶超1億
愛詩科技在AI視頻生成領域取得了顯著進展,完成了1億元人民幣的B+輪融資,並實現了ARR突破4000萬美元和註冊用戶超過1億的里程碑。其產品策略和技術創新爲市場提供了強大的競爭力。
【AiBase提要:】
🚀 愛詩科技完成1億元B+輪融資,顯示出資本市場的認可與支持。
📈 年度經常性收入(ARR)突破4000萬美元,用戶數量達到1億以上。
💡 技術創新不斷,PixVerse V5版本提升生成效率和視頻質量,引入Agent創作助手功能。
4、Anthropic 推出 Claude “skills” 功能,提升 AI 工作效率
Anthropic 推出了 Claude AI 的新功能 'skills',旨在增強 AI 在工作場景中的實用性。該功能通過文件夾形式提供指令、腳本和資源,使 Claude 能夠更高效地處理特定任務,如 Excel 文檔或品牌指南。用戶還可以創建自定義技能,並在多個平臺上使用。此功能與 OpenAI 的 AgentKit 相呼應,標誌着 AI 行業向實用化邁進。
【AiBase提要:】
🌟 Anthropic 推出 Claude 'skills' 功能,提升 AI 在工作中的實用性。
🛠️ 用戶可以創建自定義技能,以便 Claude 更好地適應特定工作場景。
🚀 此舉與 OpenAI 發佈的 AgentKit 等新功能同步,顯示 AI 行業持續向實用化邁進。
5、Pinterest推出AI內容限制工具:用戶可自定義減少生成式AI圖像
Pinterest推出了新的內容控制工具,允許用戶限制信息流中AI生成內容的比例,以迴應用戶的不滿情緒。該平臺通過引入AI修改標籤和提供用戶可選的設置,試圖在AI創新與用戶體驗之間取得平衡。
【AiBase提要:】
🖼️ 用戶可以自定義減少生成式AI圖像的顯示比例。
🤖 Pinterest引入AI修改標籤,用於標識AI生成內容。
🌐 Pinterest在平衡AI技術與用戶體驗之間尋求折中方案。
6、全面開源的 LLaVA-OneVision-1.5,超越 Qwen2.5-VL 的多模態模型登場
LLaVA-OneVision-1.5 是一款開源多模態模型,具有處理圖像和視頻等多種輸入的能力,並在多個基準測試中表現出色,超越了 Qwen2.5-VL 模型。
【AiBase提要:】
🧠 LLaVA-OneVision-1.5 是一個全新的多模態模型,能夠處理圖像和視頻等多種輸入形式。
📈 訓練過程分爲三個階段,旨在高效提升模型的視覺與語言理解能力。
🏆 在基準測試中,LLaVA-OneVision-1.5 表現優異,超越了 Qwen2.5-VL 模型。
詳情鏈接:https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-1.5 https://huggingface.co/lmms-lab/LLaVA-OneVision-1.5-8B-Instruct
7、OpenAI視頻生成模型Sora 2上線微軟Azure平臺:定價每秒0.1美元,進入公共預覽階段
微軟宣佈OpenAI的Sora2視頻生成模型已在Azure AI Foundry國際版上線,進入公共預覽階段,標誌着生成式AI視頻工具開始商業化應用。
【AiBase提要:】
🎥 Sora2 是一款多模態視頻生成模型,支持文本、圖像和視頻輸入並生成新視頻內容。
💰 定價爲每秒0.1美元,採用按生成時長計費模式,適合企業用戶批量使用。
🌐 Sora2 僅在Azure AI Foundry國際版上線,中國區用戶暫時無法直接訪問。
8、旅行搜索引擎Kayak推出 “AI 模式” 旅行規劃與預訂更便捷
Kayak推出了全新的 'AI 模式',通過內置聊天機器人幫助用戶研究、規劃和預訂旅行。該功能利用ChatGPT技術提供更具上下文的搜索結果,並支持開放性問題以獲取旅行建議。
【AiBase提要:】
🌍 Kayak推出 'AI 模式',讓用戶可以通過聊天機器人方便地規劃和預訂旅行。
🗣️ 該功能支持詢問旅行建議和比較各種旅行服務,利用 ChatGPT 技術提供精準信息。
📅 'AI 模式' 初期僅支持英語,後續將擴展至更多語言及平臺,並加入語音請求功能。