歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://top.aibase.com/

1、李彥宏:百度搜索已有11%結果由AI生成

在百度2024年第一季度財報電話會上,百度創始人李彥宏深入探討了公司的業務表現和未來發展方向,強調人工智能技術對用戶體驗的推動和創新。儘管面臨宏觀經濟挑戰,百度仍致力於發展人工智能領域,取得成果並對未來充滿信心。

【AiBase提要:】

💡 百度一季度在線營銷收入同比增長3%,得益於搜索業務成熟。

💡 11%搜索結果通過生成式人工智能技術計算,提供更準確、有條理的答案,拓展用戶任務完成能力。

💡 百度在人工智能領域持續投入,尚未商業變現,但對長期前景充滿信心。

2、谷歌發佈開源視覺語言模型PaliGemma

谷歌推出了開源視覺語言模型PaliGemma,結合圖像處理和語言理解能力,支持多種視覺語言任務。該模型具有多任務支持、30億參數規模和SigLiP視覺編碼器與Gemma語言模型結合的特點。谷歌的貢獻推動了AI領域發展,爲研究人員和開發者提供強大工具。PaliGemma的開源特性意味着可以被廣泛使用、改進和集成到各種產品和服務中。


image.png

【AiBase提要:】

✨ 多任務支持: PaliGemma能處理多種視覺語言任務,應用場景廣泛。

🔑 參數規模: 包含30億參數,是大型多模態模型。

💡 模型架構: 結合了SigLiP視覺編碼器和Gemma語言模型,處理圖像和文本輸入。

詳情鏈接:https://huggingface.co/blog/paligemma

3、騰訊混元大模型支持生成16s視頻 並推出AI智能體平臺騰訊元器

我對騰訊在生成式AI領域的最新成果——騰訊元器以及混元大模型的展示感到印象深刻。騰訊元器是一站式的AI智能體創作與分發平臺,爲企業提供了全新的解決方案,極大地擴展了智能體的應用範圍和影響力。騰訊混元大模型在視頻生成和3D生成領域展現出強大的實力,爲未來的AI應用開闢了新的可能性。

【AiBase提要:】

🚀 騰訊元器是一站式的AI智能體創作與分發平臺,爲企業提供全新解決方案,擴展了智能體的應用範圍和影響力。

💡 騰訊混元大模型參數規模達到萬億級別,採用混合專家模型(MoE)結構,在國內技術水平處於頂尖,並在某些中文能力方面與GPT-4相媲美。

🎥 騰訊混元大模型支持多種視頻生成方式,包括文生視頻、圖生視頻、圖文生視頻和視頻生視頻,已能夠生成長達16秒的視頻,同時展現了在3D生成領域的強大實力。

詳情鏈接:https://top.aibase.com/tool/tengxunyuanqi

4、ChatGPT增強數據分析功能,實現與數據表格的實時交互

ChatGPT最近推出了一系列改進的數據分析功能,包括文件上傳、實時表格交互、定製和下載演示圖表以及安全與隱私保護。這些功能的增強進一步擴展了ChatGPT在數據分析和可視化方面的能力,使其成爲一個更加強大的工具,能夠幫助用戶更有效地處理和分析數據,從而做出更明智的決策。

image.png

【AiBase提要:】

📂 文件上傳: 用戶可以直接從Google Drive和Microsoft OneDrive上傳文件,提高處理Google Sheets、Docs、Slides以及Microsoft Excel、Word和PowerPoint文件的效率。

📊 實時表格交互: ChatGPT能夠創建交互式表格,用戶可以全屏查看並實時跟蹤更新,深入分析數據或跟進問題。

🔒 安全與隱私: ChatGPT Team和Enterprise客戶數據不會用於模型訓練,Plus用戶可選擇退出訓練,保障數據安全和隱私。

詳情鏈接:https://openai.com/index/improvements-to-data-analysis-in-chatgpt/

5、周鴻禕稱留給谷歌的時間不多了 建議所有產品開源對抗OpenAI

周鴻禕在谷歌I/O大會上對谷歌發佈的創新產品進行了深度點評,認爲谷歌應將所有產品開源以對抗競爭對手。他建議谷歌應充分發揮自身優勢,關注應用場景並在安卓系統中推廣,以獲取數十億用戶。通過用戶數據反饋推動產品改進的飛輪。

【AiBase提要:】

🔍 谷歌應將所有產品開源以應對競爭對手挑戰

💡 谷歌應充分發揮搜索、Chrome瀏覽器和安卓等優勢,關注應用場景並推廣

📈 通過用戶數據反饋推動產品改進的飛輪

6、Google Photos將推出Ask Photos功能 動動嘴就能搜索照片和視頻

Google Photos即將推出名爲Ask Photos的實驗性功能,利用AI模型Gemini,用戶可以通過自然語言搜索查找照片和視頻,輔助完成相關任務。這將進一步增強Google Photos的搜索能力,讓用戶更便捷地管理他們的珍貴回憶,享受個性化體驗。功能預計將在未來幾周內推出。

【AiBase提要:】

🔍 自然語言搜索: 用戶可以通過自然語言問題搜索照片和視頻,無需記住具體關鍵詞或拍攝日期。

🧠 上下文理解和細節提取: Gemini AI模型能理解照片上下文和主題,提取細節信息。

🔄 動態調整和學習: Ask Photos可以根據用戶反饋進行動態調整和學習,提供更準確的結果。

詳情鏈接:https://blog.google/products/photos/ask-photos-google-io-2024/

7、OpenAI與Reddit合作,將用戶生成獨特內容整合至ChatGPT

OpenAI與Reddit宣佈戰略合作,旨在徹底改變在線社區互動體驗和推動AI創新。這一合作將爲用戶帶來全新的體驗,同時也爲AI和社交媒體融合創造新的可能性。


image.png

【AiBase提要:】

⭐ 合作旨在整合先進的AI功能和用戶生成的獨特內容,提升ChatGPT等AI工具的理解和展示能力。

⭐ Reddit向OpenAI開放Data API,使後者能夠獲取Reddit社區生成的豐富內容,推出個性化內容推薦等AI功能。

⭐ 合作標誌着社交媒體和人工智能融合的重要里程碑,爲用戶和版主帶來全新的體驗。

8、Hugging Face承諾免費提供1000萬美元GPU計算資源,幫助小型開發者對抗大型AI公司

Hugging Face承諾投入1000萬美元的GPU計算資源,旨在降低開發AI應用的門檻,對抗人工智能領域的中心化趨勢。通過分享計算資源,使每個人都能夠使用先進的人工智能技術。

【AiBase提要:】

🔸 Hugging Face投入1000萬美元GPU計算資源,支持小型開發者

🔸 旨在降低AI應用開發門檻,抗衡科技巨頭

🔸 通過ZeroGPU項目免費共享GPU計算資源,提高成本效益和能源效率

9、OpenAI CEO:GPT-5會很特別 可能類似於一個 “虛擬大腦”

在接受採訪中,OpenAI CEO透露了關於GPT-4o和GPT-5的信息,揭示了這些多模態大模型的特點和應用前景。GPT-4o具有跨文本、視頻、音頻推理能力,低延遲和擬人化聲音特點,將帶來前所未有的用戶體驗。而GPT-5被描述爲一種非常特別的產品,可能會採用新的名稱和功能,更像是一種能處理各種任務的虛擬大腦。

【AiBase提要:】

🔹 GPT-4o是多模態大模型,具有跨文本、視頻、音頻推理能力,低延遲和擬人化聲音特點,提升工作效率和生活質量。

🔹 GPT-4o可在一個平臺上完成多種任務,如實時翻譯、語音交互和視頻分析,帶來巨大改變,特別適用於開發人員和專業人士。

🔹 GPT-5被描繪爲一種“虛擬大腦”,能夠幫助用戶處理各種任務,是一次巨大的嘗試,展示了OpenAI在人工智能領域的創新和突破。

10、馬斯克旗下 xAI 與甲骨文接近達成 100 億美元協議

馬斯克旗下的 xAI 公司與甲骨文接近達成100億美元協議,將成爲甲骨文最大客戶之一。這一舉動將加速 xAI 在人工智能領域的發展,提升其競爭力。

【AiBase提要:】

💰 馬斯克的 xAI 計劃投資100億美元租用甲骨文的 AI 服務器,成爲甲骨文最大客戶之一。

🚀 xAI 正在進行60億美元的股權融資,以支付雲計算服務成本,提升 Grok 模型的性能和效率。

💡 馬斯克計劃通過融資加速 GPU 租賃擴張,目標是在2025年前達到10萬個 GPU。

11、騰訊混元將發佈大模型C端App騰訊元寶

騰訊在騰訊雲生成式AI產業應用峯會上宣佈將推出面向C端用戶的全新App“騰訊元寶”,背後搭載着超萬億參數規模的通用大語言模型——混元大模型。該模型展現出卓越的中文理解、創作、邏輯推理和任務執行能力,爲用戶帶來高效經濟的智能體驗。

【AiBase提要:】

🚀 騰訊元寶是基於騰訊混元大模型的全新App,展現出超強的中文理解和創作能力。

💡 騰訊混元採用混合專家模型(MoE)結構,大幅提升了性能,降低了推理成本,爲用戶帶來更高效的體驗。

💬 騰訊混元在文本生成、數理邏輯和多輪對話等關鍵領域達到業界領先水平,爲中文用戶提供前所未有的智能體驗。