AI日報：百度搜索11%結果由AI生成；騰訊混元支持生成16s視頻；谷歌發佈開源視覺語言模型PaliGemma；Hugging Face承諾免費提供1000萬美元GPU計算資源

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://top.aibase.com/

1、李彥宏：百度搜索已有11%結果由AI生成

在百度2024年第一季度財報電話會上，百度創始人李彥宏深入探討了公司的業務表現和未來發展方向，強調人工智能技術對用戶體驗的推動和創新。儘管面臨宏觀經濟挑戰，百度仍致力於發展人工智能領域，取得成果並對未來充滿信心。

【AiBase提要:】
💡 百度一季度在線營銷收入同比增長3%，得益於搜索業務成熟。
💡 11%搜索結果通過生成式人工智能技術計算，提供更準確、有條理的答案，拓展用戶任務完成能力。
💡 百度在人工智能領域持續投入，尚未商業變現，但對長期前景充滿信心。

2、谷歌發佈開源視覺語言模型PaliGemma

谷歌推出了開源視覺語言模型PaliGemma，結合圖像處理和語言理解能力，支持多種視覺語言任務。該模型具有多任務支持、30億參數規模和SigLiP視覺編碼器與Gemma語言模型結合的特點。谷歌的貢獻推動了AI領域發展，爲研究人員和開發者提供強大工具。PaliGemma的開源特性意味着可以被廣泛使用、改進和集成到各種產品和服務中。

【AiBase提要:】
✨ 多任務支持: PaliGemma能處理多種視覺語言任務，應用場景廣泛。
🔑 參數規模: 包含30億參數，是大型多模態模型。
💡 模型架構: 結合了SigLiP視覺編碼器和Gemma語言模型，處理圖像和文本輸入。
詳情鏈接:https://huggingface.co/blog/paligemma

3、騰訊混元大模型支持生成16s視頻並推出AI智能體平臺騰訊元器

我對騰訊在生成式AI領域的最新成果——騰訊元器以及混元大模型的展示感到印象深刻。騰訊元器是一站式的AI智能體創作與分發平臺，爲企業提供了全新的解決方案，極大地擴展了智能體的應用範圍和影響力。騰訊混元大模型在視頻生成和3D生成領域展現出強大的實力，爲未來的AI應用開闢了新的可能性。

【AiBase提要:】
🚀 騰訊元器是一站式的AI智能體創作與分發平臺，爲企業提供全新解決方案，擴展了智能體的應用範圍和影響力。
💡 騰訊混元大模型參數規模達到萬億級別，採用混合專家模型（MoE）結構，在國內技術水平處於頂尖，並在某些中文能力方面與GPT-4相媲美。
🎥 騰訊混元大模型支持多種視頻生成方式，包括文生視頻、圖生視頻、圖文生視頻和視頻生視頻，已能夠生成長達16秒的視頻，同時展現了在3D生成領域的強大實力。
詳情鏈接:https://top.aibase.com/tool/tengxunyuanqi

4、ChatGPT增強數據分析功能，實現與數據表格的實時交互

ChatGPT最近推出了一系列改進的數據分析功能，包括文件上傳、實時表格交互、定製和下載演示圖表以及安全與隱私保護。這些功能的增強進一步擴展了ChatGPT在數據分析和可視化方面的能力，使其成爲一個更加強大的工具，能夠幫助用戶更有效地處理和分析數據，從而做出更明智的決策。

【AiBase提要:】
📂 文件上傳: 用戶可以直接從Google Drive和Microsoft OneDrive上傳文件，提高處理Google Sheets、Docs、Slides以及Microsoft Excel、Word和PowerPoint文件的效率。
📊 實時表格交互: ChatGPT能夠創建交互式表格，用戶可以全屏查看並實時跟蹤更新，深入分析數據或跟進問題。
🔒 安全與隱私: ChatGPT Team和Enterprise客戶數據不會用於模型訓練，Plus用戶可選擇退出訓練，保障數據安全和隱私。
詳情鏈接:https://openai.com/index/improvements-to-data-analysis-in-chatgpt/

5、周鴻禕稱留給谷歌的時間不多了建議所有產品開源對抗OpenAI

周鴻禕在谷歌I/O大會上對谷歌發佈的創新產品進行了深度點評，認爲谷歌應將所有產品開源以對抗競爭對手。他建議谷歌應充分發揮自身優勢，關注應用場景並在安卓系統中推廣，以獲取數十億用戶。通過用戶數據反饋推動產品改進的飛輪。

【AiBase提要:】
🔍 谷歌應將所有產品開源以應對競爭對手挑戰
💡 谷歌應充分發揮搜索、Chrome瀏覽器和安卓等優勢，關注應用場景並推廣
📈 通過用戶數據反饋推動產品改進的飛輪

6、Google Photos將推出Ask Photos功能動動嘴就能搜索照片和視頻

Google Photos即將推出名爲Ask Photos的實驗性功能，利用AI模型Gemini，用戶可以通過自然語言搜索查找照片和視頻，輔助完成相關任務。這將進一步增強Google Photos的搜索能力，讓用戶更便捷地管理他們的珍貴回憶，享受個性化體驗。功能預計將在未來幾周內推出。

【AiBase提要:】
🔍 自然語言搜索: 用戶可以通過自然語言問題搜索照片和視頻，無需記住具體關鍵詞或拍攝日期。
🧠 上下文理解和細節提取: Gemini AI模型能理解照片上下文和主題，提取細節信息。
🔄 動態調整和學習: Ask Photos可以根據用戶反饋進行動態調整和學習，提供更準確的結果。
詳情鏈接:https://blog.google/products/photos/ask-photos-google-io-2024/

7、OpenAI與Reddit合作，將用戶生成獨特內容整合至ChatGPT

OpenAI與Reddit宣佈戰略合作，旨在徹底改變在線社區互動體驗和推動AI創新。這一合作將爲用戶帶來全新的體驗，同時也爲AI和社交媒體融合創造新的可能性。

【AiBase提要:】
⭐ 合作旨在整合先進的AI功能和用戶生成的獨特內容，提升ChatGPT等AI工具的理解和展示能力。
⭐ Reddit向OpenAI開放Data API，使後者能夠獲取Reddit社區生成的豐富內容，推出個性化內容推薦等AI功能。
⭐ 合作標誌着社交媒體和人工智能融合的重要里程碑，爲用戶和版主帶來全新的體驗。

8、Hugging Face承諾免費提供1000萬美元GPU計算資源，幫助小型開發者對抗大型AI公司

Hugging Face承諾投入1000萬美元的GPU計算資源，旨在降低開發AI應用的門檻，對抗人工智能領域的中心化趨勢。通過分享計算資源，使每個人都能夠使用先進的人工智能技術。

【AiBase提要:】
🔸 Hugging Face投入1000萬美元GPU計算資源，支持小型開發者
🔸 旨在降低AI應用開發門檻，抗衡科技巨頭
🔸 通過ZeroGPU項目免費共享GPU計算資源，提高成本效益和能源效率

9、OpenAI CEO：GPT-5會很特別可能類似於一個 “虛擬大腦”

在接受採訪中，OpenAI CEO透露了關於GPT-4o和GPT-5的信息，揭示了這些多模態大模型的特點和應用前景。GPT-4o具有跨文本、視頻、音頻推理能力，低延遲和擬人化聲音特點，將帶來前所未有的用戶體驗。而GPT-5被描述爲一種非常特別的產品，可能會採用新的名稱和功能，更像是一種能處理各種任務的虛擬大腦。

【AiBase提要:】
🔹 GPT-4o是多模態大模型，具有跨文本、視頻、音頻推理能力，低延遲和擬人化聲音特點，提升工作效率和生活質量。
🔹 GPT-4o可在一個平臺上完成多種任務，如實時翻譯、語音交互和視頻分析，帶來巨大改變，特別適用於開發人員和專業人士。
🔹 GPT-5被描繪爲一種“虛擬大腦”，能夠幫助用戶處理各種任務，是一次巨大的嘗試，展示了OpenAI在人工智能領域的創新和突破。

10、馬斯克旗下 xAI 與甲骨文接近達成 100 億美元協議

馬斯克旗下的 xAI 公司與甲骨文接近達成100億美元協議，將成爲甲骨文最大客戶之一。這一舉動將加速 xAI 在人工智能領域的發展，提升其競爭力。

【AiBase提要:】
💰 馬斯克的 xAI 計劃投資100億美元租用甲骨文的 AI 服務器，成爲甲骨文最大客戶之一。
🚀 xAI 正在進行60億美元的股權融資，以支付雲計算服務成本，提升 Grok 模型的性能和效率。
💡 馬斯克計劃通過融資加速 GPU 租賃擴張，目標是在2025年前達到10萬個 GPU。

11、騰訊混元將發佈大模型C端App騰訊元寶

騰訊在騰訊雲生成式AI產業應用峯會上宣佈將推出面向C端用戶的全新App“騰訊元寶”，背後搭載着超萬億參數規模的通用大語言模型——混元大模型。該模型展現出卓越的中文理解、創作、邏輯推理和任務執行能力，爲用戶帶來高效經濟的智能體驗。

【AiBase提要:】
🚀 騰訊元寶是基於騰訊混元大模型的全新App，展現出超強的中文理解和創作能力。
💡 騰訊混元採用混合專家模型（MoE）結構，大幅提升了性能，降低了推理成本，爲用戶帶來更高效的體驗。
💬 騰訊混元在文本生成、數理邏輯和多輪對話等關鍵領域達到業界領先水平，爲中文用戶提供前所未有的智能體驗。