歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://app.aibase.com/zh

1、谷歌Gemini 3.0 Pro開始小範圍推送:強化推理能力,正式發佈或在本月底

谷歌DeepMind團隊開始向部分用戶推送Gemini 3.0 Pro模型,該模型在推理能力和多模態處理上有所提升,並計劃在10月底正式發佈。

image.png

【AiBase提要:】

🧠 Gemini 3.0 Pro引入Deep Think推理架構,提升多步驟複雜任務處理能力。

🌐 支持文本、圖像、音頻和視頻等多種輸入格式,可生成完整前端代碼。

🚀 谷歌計劃推出輕量級Flash變體版本,滿足移動設備和邊緣計算需求。

2、百度發佈全球領先文檔解析模型 PaddleOCR-VL,重塑OCR技術格局!

百度發佈的PaddleOCR-VL模型在文檔解析領域表現出色,憑藉其輕量高效、多語言支持和高精度識別能力,成爲OCR技術的新標杆。

image.png

【AiBase提要:】

🌍 支持109種語言,適用於多種文檔處理任務。

⚙️ 核心參數僅爲0.9B,實現高效計算與精準識別。

🚀 推理速度顯著提升,較其他主流模型表現更優。

3、AI視頻公司愛詩科技完成1億元B+輪融資:ARR突破4000萬美元,用戶超1億

愛詩科技在AI視頻生成領域取得了顯著進展,完成了1億元人民幣的B+輪融資,並實現了ARR突破4000萬美元和註冊用戶超過1億的里程碑。其產品策略和技術創新爲市場提供了強大的競爭力。

image.png

【AiBase提要:】

🚀 愛詩科技完成1億元B+輪融資,顯示出資本市場的認可與支持。

📈 年度經常性收入(ARR)突破4000萬美元,用戶數量達到1億以上。

💡 技術創新不斷,PixVerse V5版本提升生成效率和視頻質量,引入Agent創作助手功能。

4、Anthropic 推出 Claude “skills” 功能,提升 AI 工作效率

Anthropic 推出了 Claude AI 的新功能 'skills',旨在增強 AI 在工作場景中的實用性。該功能通過文件夾形式提供指令、腳本和資源,使 Claude 能夠更高效地處理特定任務,如 Excel 文檔或品牌指南。用戶還可以創建自定義技能,並在多個平臺上使用。此功能與 OpenAI 的 AgentKit 相呼應,標誌着 AI 行業向實用化邁進。

image.png

【AiBase提要:】

🌟 Anthropic 推出 Claude 'skills' 功能,提升 AI 在工作中的實用性。

🛠️ 用戶可以創建自定義技能,以便 Claude 更好地適應特定工作場景。

🚀 此舉與 OpenAI 發佈的 AgentKit 等新功能同步,顯示 AI 行業持續向實用化邁進。

5、Pinterest推出AI內容限制工具:用戶可自定義減少生成式AI圖像

Pinterest推出了新的內容控制工具,允許用戶限制信息流中AI生成內容的比例,以迴應用戶的不滿情緒。該平臺通過引入AI修改標籤和提供用戶可選的設置,試圖在AI創新與用戶體驗之間取得平衡。

image.png

【AiBase提要:】

🖼️ 用戶可以自定義減少生成式AI圖像的顯示比例。

🤖 Pinterest引入AI修改標籤,用於標識AI生成內容。

🌐 Pinterest在平衡AI技術與用戶體驗之間尋求折中方案。

6、全面開源的 LLaVA-OneVision-1.5,超越 Qwen2.5-VL 的多模態模型登場

LLaVA-OneVision-1.5 是一款開源多模態模型,具有處理圖像和視頻等多種輸入的能力,並在多個基準測試中表現出色,超越了 Qwen2.5-VL 模型。

image.png

【AiBase提要:】

🧠 LLaVA-OneVision-1.5 是一個全新的多模態模型,能夠處理圖像和視頻等多種輸入形式。

📈 訓練過程分爲三個階段,旨在高效提升模型的視覺與語言理解能力。

🏆 在基準測試中,LLaVA-OneVision-1.5 表現優異,超越了 Qwen2.5-VL 模型。

詳情鏈接:https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-1.5 https://huggingface.co/lmms-lab/LLaVA-OneVision-1.5-8B-Instruct

7、OpenAI視頻生成模型Sora 2上線微軟Azure平臺:定價每秒0.1美元,進入公共預覽階段

微軟宣佈OpenAI的Sora2視頻生成模型已在Azure AI Foundry國際版上線,進入公共預覽階段,標誌着生成式AI視頻工具開始商業化應用。

【AiBase提要:】

🎥 Sora2 是一款多模態視頻生成模型,支持文本、圖像和視頻輸入並生成新視頻內容。

💰 定價爲每秒0.1美元,採用按生成時長計費模式,適合企業用戶批量使用。

🌐 Sora2 僅在Azure AI Foundry國際版上線,中國區用戶暫時無法直接訪問。

8、旅行搜索引擎Kayak推出 “AI 模式” 旅行規劃與預訂更便捷

Kayak推出了全新的 'AI 模式',通過內置聊天機器人幫助用戶研究、規劃和預訂旅行。該功能利用ChatGPT技術提供更具上下文的搜索結果,並支持開放性問題以獲取旅行建議。

image.png

【AiBase提要:】

🌍 Kayak推出 'AI 模式',讓用戶可以通過聊天機器人方便地規劃和預訂旅行。

🗣️ 該功能支持詢問旅行建議和比較各種旅行服務,利用 ChatGPT 技術提供精準信息。

📅 'AI 模式' 初期僅支持英語,後續將擴展至更多語言及平臺,並加入語音請求功能。