歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解https://top.aibase.com/

1、百度宣佈文心大模型ERNIE Speed、ERNIE Lite全面免費

百度智能雲宣佈免費開放ERNIE Speed和ERNIE Lite兩大主力模型,ERNIE Speed爲高性能大語言模型,適合精調處理特定場景問題;ERNIE Lite爲輕量級大語言模型,適合低算力AI加速卡推理使用。

【AiBase提要:】

🚀 ERNIE Speed是百度 2024 年最新發佈的自研高性能大語言模型,通用能力優異。

💡 ERNIE Lite是百度自研的輕量級大語言模型,兼顧優異的模型效果與推理性能。

💻 ERNIE Speed和ERNIE Lite全面免費,立即生效。

2、阿里雲宣佈GPT-4級主力模型Qwen-Long API輸入費用暴跌97%

阿里雲宣佈將其GPT-4級主力模型Qwen-Long的API輸入價格大幅降低,爲用戶帶來極大的優惠和競爭力,使得購買文本處理能力變得更加經濟實惠。

【AiBase提要:】

🚀 API輸入價格降至每千tokens0.0005元,降幅達97%,用戶只需花費1塊錢即可購買200萬tokens。

💡 模型支持長達1千萬tokens的文本輸入,價格約爲GPT-4的1/400,成爲全球最具競爭力之一。

🌍 通義大模型通過阿里雲服務企業超過9萬家,通過釘釘服務企業超過220萬家,受到海內外中小企業和開發者的廣泛使用。

3、字節跳動豆包大模型價格清單公佈:25元起

本文介紹了字節跳動旗下火山引擎官網更新豆包大模型定價的信息。豆包大模型在性價比上具有優勢,主力模型價格降低了99%,性能價值比突出。豆包大模型家族包括多種成員,滿足不同用戶需求。計費模式靈活,後付費和預付費兩種方式滿足企業需求。

【AiBase提要:】

🔍 豆包大模型價格更新,起價僅25元,性價比優勢明顯。

💡 豆包大模型家族多樣化,包括Pro、Lite等多種模型,處理能力強大。

💰 計費模式靈活,後付費和預付費兩種方式滿足企業需求。

4、智譜開源新一代多模態大模型CogVLM2

智譜·AI最近推出了新一代多模態大模型CogVLM2,性能顯著提升,支持8K文本長度和1344*1344分辨率的圖像。CogVLM2在多個基準測試中表現優異,展現出強大的文檔圖像理解能力。技術架構優化,模型大小爲19B,性能接近或超過GPT-4V水平。推理時實際激活參數量約120億,推理效率顯著提高。


image.png


【AiBase提要:】

🚀 CogVLM2在OCRbench基準上性能提升32%,在TextVQA基準上提升21.9%。

💡 CogVLM2採用深度融合策略,視覺模態與語言模態緊密結合,保持語言處理優勢。

🔥 CogVLM2在多個多模態基準測試中取得優異成績,包括TextVQA、DocVQA、ChartQA等。

詳情鏈接:https://github.com/THUDM/CogVLM2

5、面壁智能推出最新一代端側多模態模型 MiniCPM-Llama3-V2.5

面壁智能推出的最新一代端側多模態模型 MiniCPM-Llama3-V2.5 具有超強的綜合性能,能夠在 OCR 方面取得 SOTA 成績,支持多種語言,實現了端側系統級多模態加速,展現出強大的多模態綜合能力,爲端側 AI 模型的發展帶來新的突破。

image.png


【AiBase提要:】

🚀 MiniCPM-Llama3-V2.5具有超強綜合性能,超越Gemini Pro和GPT-4V。

🔍 在 OCR 方面取得 SOTA 成績,精準識別難圖、長圖和長文本。

💡 首次實現端側系統級多模態加速,使圖像編碼速度提升150倍。

詳情鏈接:https://github.com/OpenBMB/MiniCPM-VMiniCPM

6、騰訊計劃投資月之暗面 估值或將達30億美元

騰訊計劃投資月之暗面,可能將其估值提升至30億美元。這一舉動顯示了騰訊在人工智能領域的戰略佈局和競爭意圖。中國人工智能產業的快速發展使得投資、競爭日益激烈,騰訊與月之暗面的合作將在業界引起關注。

【AiBase提要:】

🚀 月之暗面在人工智能大語言模型領域處於領先地位,吸引了騰訊等巨頭的關注。

💰 月之暗面創立僅一年多時間,已完成超過10億美元的融資,估值達25億美元。

📈 騰訊將加入人工智能領域的競爭,計劃投資其他大模型創業公司,強化競爭實力。

7、線條預處理器 Anyline新增Web UI適配

這篇文章介紹了 Anyline 最新的更新,爲 Web UI Controlnet 新增了適配,提升了用戶操作體驗。Chenlei Hu 計劃進一步簡化 Anyline 的使用方式,並考慮將其更深入地集成到 ComfyUI 中。用戶可以根據需求選擇合適的基礎模型,以獲得最佳效果。更新將 Anyline 的強大功能帶到了 Web UI 上,爲專業設計工作和日常圖像處理帶來便利。

image.png

【AiBase提要:】

🔍 高精度線條提取: Anyline 能準確提取圖像中的對象邊緣、細節和文本內容,輸出清晰邊緣和高保真度文本的線條圖。

🌐 廣泛的適用性: 用戶可以輸入任何類型的圖像,Anyline 都能快速處理,提供高質量的線條圖。

🔬 紋理字體識別優勢: Anyline 在輪廓準確度、物體細節、材質紋理和字體識別方面有明顯優勢,同時提供更好的降噪效果。

詳情鏈接:https://top.aibase.com/tool/anyline

8、Meta發佈類GPT-4o多模態模型Chameleon

本文介紹了Meta最近發佈的多模態模型Chameleon,該模型在多模態模型領域設立了新的標杆,具有早期融合、統一Transformer架構等創新特點。Chameleon在各種任務上展現出廣泛的能力,包括視覺問答、圖像標註、文本生成等。文章還提到Chameleon面臨的技術挑戰以及Meta團隊引入的架構創新和訓練技術。

image.png

【AiBase提要:】

🌟 Chameleon是一個早期融合的基於token的混合模態模型家族,能夠理解並生成任意順序的圖像和文本。

🔑 Chameleon模型在技術上面臨了重大挑戰,Meta的研究團隊引入了一系列架構創新和訓練技術。

💡 Chameleon模型在基準評估中全面超越了Llama2,在常識推理、閱讀理解、數學問題和世界知識領域都取得了顯著的效果。

詳情鏈接:https://arxiv.org/pdf/2405.09818Chameleon

9、微軟發佈AI工具 Recall,幫助你找到那些找不到的文件

微軟推出了Recall AI,爲C o p i l o t+ PC系列提供了“照片記憶”功能,讓用戶通過語音查詢文件、網站或電子郵件,並通過AI進行索引和搜索。這項功能可以幫助用戶更輕鬆地找到所需信息,而且數據保留在設備本地,不用擔心信息傳輸到雲服務器。

image.png

【AiBase提要:】

🔍 Recall AI爲C o p i l o t+ PC系列提供“照片記憶”功能,允許用戶通過語音查詢文件、網站或電子郵件,並通過AI進行索引和搜索。

🔍 Recall AI記錄用戶的屏幕操作,使用自然語言描述文件記憶,快速找到文檔最新版本,讓用戶更輕鬆獲取信息。

🔍 Recall AI僅適用於具有特定硬件要求的設備,如ARM64處理器、Snapdragon X Elite和X Plus等。

10、從零復現Llama3代碼庫爆火 Karpathy大神稱讚作者是個有品的人

這篇文章介紹了一個教你從頭開始實現Llama3的代碼庫在網絡上引起轟動的情況。知名AI專家Andrej Karpathy對該項目給予高度評價,稱讚作者Nishant Aklecha的詳細解釋和展示。文章詳細解釋了Llama3模型的實現過程,包括注意力機制、位置編碼等關鍵內容。

【AiBase提要:】

🔥 代碼庫爆火,吸引無數開發者關注,Karpathy點贊轉發評論

👨‍💻 作者Nishant Aklecha詳細解釋Llama3模型實現過程,包括注意力機制和位置編碼

🚀 納哥從頭實現Llama3,展示每行代碼功能,Karpathy稱讚詳細展開易理解

詳情鏈接:https://top.aibase.com/tool/llama3-from-scratch

11、AI 框架Ambient Diffusion:從圖像中獲取靈感,而非複製

德克薩斯大學奧斯汀分校的研究團隊開發了名爲Ambient Diffusion的框架,通過對無法辨認的圖像進行訓練,繞過AI模型複製他人作品的問題。這一框架不僅在藝術領域有用,還有潛力應用於科學和醫學領域,如黑洞成像和MRI掃描。研究團隊的創新爲人工智能發展提供了新思路。

image.png

【AiBase提要:】

🔍 Ambient Diffusion框架通過訓練擾亂後的圖像數據,解決AI模型複製作品的問題。

💡 該框架潛力巨大,可應用於藝術、科學和醫學領域,如黑洞成像和MRI掃描。

📝 初步實驗表明,Ambient Diffusion框架仍能生成高質量樣本,而不需要識別原始源圖像內容。

詳情鏈接:https://arxiv.org/abs/2305.19256

12、好萊塢女星斯嘉麗抨擊OpenAI抄襲她的聲音用於ChatGPT

斯嘉麗・約翰遜聲稱OpenAI在她拒絕爲ChatGPT提供聲音後,仍擅自模仿了她獨特的音調。OpenAI展示了與斯嘉麗・約翰遜在《Her》中扮演的人工智能助手極爲相似的合成語音,但突然禁用了這一新聲音。評論家批評OpenAI的行爲,讚揚斯嘉麗・約翰遜的立場。

【AiBase提要:】

⭐ 斯嘉麗・約翰遜聲稱OpenAI擅自模仿她的音調。

⭐ OpenAI展示了與斯嘉麗・約翰遜在《Her》中扮演的人工智能助手相似的合成語音。

⭐ 評論家批評OpenAI的行爲,讚揚斯嘉麗・約翰遜的立場。

13、英特爾推出新一代 Lunar Lake 芯片

英特爾計劃在今年第三季度推出 Lunar Lake 筆記本處理器,旨在爲 C opilot Plus PC 帶來全新的 AI 體驗。該芯片將提供比其前身 Meteor Lake 更高的三倍 AI 性能,預計在今年底前將搭載40多萬顆 Lunar Lake 芯片。這一舉措是英特爾在 AI PC 市場中的重要一步,旨在應對競爭對手的挑戰。

【AiBase提要:】

⭐ Lunar Lake 芯片將採用 CPU、集成的 Xe2GPU 和神經處理單元(NPU),提供比其前身 Meteor Lake 更高的三倍 AI 性能。

⭐ 英特爾計劃在今年底前向全球80多款新筆記本型號中搭載40多萬顆 Lunar Lake 芯片,以應對 AMD 的 Zen5和高通的 Oryon。

⭐ Lunar Lake 處理器的 NPU 將能夠執行超過40萬億次操作每秒(TOPS),遠高於 Meteor Lake 芯片的10TOPS。這將爲 AI PC 帶來更強大的性能和更豐富的應用體驗。