歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、百度宣佈文心大模型ERNIE Speed、ERNIE Lite全面免費
百度智能雲宣佈免費開放ERNIE Speed和ERNIE Lite兩大主力模型,ERNIE Speed爲高性能大語言模型,適合精調處理特定場景問題;ERNIE Lite爲輕量級大語言模型,適合低算力AI加速卡推理使用。
【AiBase提要:】
🚀 ERNIE Speed是百度 2024 年最新發佈的自研高性能大語言模型,通用能力優異。
💡 ERNIE Lite是百度自研的輕量級大語言模型,兼顧優異的模型效果與推理性能。
💻 ERNIE Speed和ERNIE Lite全面免費,立即生效。
2、阿里雲宣佈GPT-4級主力模型Qwen-Long API輸入費用暴跌97%
阿里雲宣佈將其GPT-4級主力模型Qwen-Long的API輸入價格大幅降低,爲用戶帶來極大的優惠和競爭力,使得購買文本處理能力變得更加經濟實惠。
【AiBase提要:】
🚀 API輸入價格降至每千tokens0.0005元,降幅達97%,用戶只需花費1塊錢即可購買200萬tokens。
💡 模型支持長達1千萬tokens的文本輸入,價格約爲GPT-4的1/400,成爲全球最具競爭力之一。
🌍 通義大模型通過阿里雲服務企業超過9萬家,通過釘釘服務企業超過220萬家,受到海內外中小企業和開發者的廣泛使用。
3、字節跳動豆包大模型價格清單公佈:25元起
本文介紹了字節跳動旗下火山引擎官網更新豆包大模型定價的信息。豆包大模型在性價比上具有優勢,主力模型價格降低了99%,性能價值比突出。豆包大模型家族包括多種成員,滿足不同用戶需求。計費模式靈活,後付費和預付費兩種方式滿足企業需求。
【AiBase提要:】
🔍 豆包大模型價格更新,起價僅25元,性價比優勢明顯。
💡 豆包大模型家族多樣化,包括Pro、Lite等多種模型,處理能力強大。
💰 計費模式靈活,後付費和預付費兩種方式滿足企業需求。
4、智譜開源新一代多模態大模型CogVLM2
智譜·AI最近推出了新一代多模態大模型CogVLM2,性能顯著提升,支持8K文本長度和1344*1344分辨率的圖像。CogVLM2在多個基準測試中表現優異,展現出強大的文檔圖像理解能力。技術架構優化,模型大小爲19B,性能接近或超過GPT-4V水平。推理時實際激活參數量約120億,推理效率顯著提高。
【AiBase提要:】
🚀 CogVLM2在OCRbench基準上性能提升32%,在TextVQA基準上提升21.9%。
💡 CogVLM2採用深度融合策略,視覺模態與語言模態緊密結合,保持語言處理優勢。
🔥 CogVLM2在多個多模態基準測試中取得優異成績,包括TextVQA、DocVQA、ChartQA等。
詳情鏈接:https://github.com/THUDM/CogVLM2
5、面壁智能推出最新一代端側多模態模型 MiniCPM-Llama3-V2.5
面壁智能推出的最新一代端側多模態模型 MiniCPM-Llama3-V2.5 具有超強的綜合性能,能夠在 OCR 方面取得 SOTA 成績,支持多種語言,實現了端側系統級多模態加速,展現出強大的多模態綜合能力,爲端側 AI 模型的發展帶來新的突破。
【AiBase提要:】
🚀 MiniCPM-Llama3-V2.5具有超強綜合性能,超越Gemini Pro和GPT-4V。
🔍 在 OCR 方面取得 SOTA 成績,精準識別難圖、長圖和長文本。
💡 首次實現端側系統級多模態加速,使圖像編碼速度提升150倍。
詳情鏈接:https://github.com/OpenBMB/MiniCPM-VMiniCPM
6、騰訊計劃投資月之暗面 估值或將達30億美元
騰訊計劃投資月之暗面,可能將其估值提升至30億美元。這一舉動顯示了騰訊在人工智能領域的戰略佈局和競爭意圖。中國人工智能產業的快速發展使得投資、競爭日益激烈,騰訊與月之暗面的合作將在業界引起關注。
【AiBase提要:】
🚀 月之暗面在人工智能大語言模型領域處於領先地位,吸引了騰訊等巨頭的關注。
💰 月之暗面創立僅一年多時間,已完成超過10億美元的融資,估值達25億美元。
📈 騰訊將加入人工智能領域的競爭,計劃投資其他大模型創業公司,強化競爭實力。
7、線條預處理器 Anyline新增Web UI適配
這篇文章介紹了 Anyline 最新的更新,爲 Web UI Controlnet 新增了適配,提升了用戶操作體驗。Chenlei Hu 計劃進一步簡化 Anyline 的使用方式,並考慮將其更深入地集成到 ComfyUI 中。用戶可以根據需求選擇合適的基礎模型,以獲得最佳效果。更新將 Anyline 的強大功能帶到了 Web UI 上,爲專業設計工作和日常圖像處理帶來便利。
【AiBase提要:】
🔍 高精度線條提取: Anyline 能準確提取圖像中的對象邊緣、細節和文本內容,輸出清晰邊緣和高保真度文本的線條圖。
🌐 廣泛的適用性: 用戶可以輸入任何類型的圖像,Anyline 都能快速處理,提供高質量的線條圖。
🔬 紋理字體識別優勢: Anyline 在輪廓準確度、物體細節、材質紋理和字體識別方面有明顯優勢,同時提供更好的降噪效果。
詳情鏈接:https://top.aibase.com/tool/anyline
8、Meta發佈類GPT-4o多模態模型Chameleon
本文介紹了Meta最近發佈的多模態模型Chameleon,該模型在多模態模型領域設立了新的標杆,具有早期融合、統一Transformer架構等創新特點。Chameleon在各種任務上展現出廣泛的能力,包括視覺問答、圖像標註、文本生成等。文章還提到Chameleon面臨的技術挑戰以及Meta團隊引入的架構創新和訓練技術。
【AiBase提要:】
🌟 Chameleon是一個早期融合的基於token的混合模態模型家族,能夠理解並生成任意順序的圖像和文本。
🔑 Chameleon模型在技術上面臨了重大挑戰,Meta的研究團隊引入了一系列架構創新和訓練技術。
💡 Chameleon模型在基準評估中全面超越了Llama2,在常識推理、閱讀理解、數學問題和世界知識領域都取得了顯著的效果。
詳情鏈接:https://arxiv.org/pdf/2405.09818Chameleon
9、微軟發佈AI工具 Recall,幫助你找到那些找不到的文件
微軟推出了Recall AI,爲C o p i l o t+ PC系列提供了“照片記憶”功能,讓用戶通過語音查詢文件、網站或電子郵件,並通過AI進行索引和搜索。這項功能可以幫助用戶更輕鬆地找到所需信息,而且數據保留在設備本地,不用擔心信息傳輸到雲服務器。
【AiBase提要:】
🔍 Recall AI爲C o p i l o t+ PC系列提供“照片記憶”功能,允許用戶通過語音查詢文件、網站或電子郵件,並通過AI進行索引和搜索。
🔍 Recall AI記錄用戶的屏幕操作,使用自然語言描述文件記憶,快速找到文檔最新版本,讓用戶更輕鬆獲取信息。
🔍 Recall AI僅適用於具有特定硬件要求的設備,如ARM64處理器、Snapdragon X Elite和X Plus等。
10、從零復現Llama3代碼庫爆火 Karpathy大神稱讚作者是個有品的人
這篇文章介紹了一個教你從頭開始實現Llama3的代碼庫在網絡上引起轟動的情況。知名AI專家Andrej Karpathy對該項目給予高度評價,稱讚作者Nishant Aklecha的詳細解釋和展示。文章詳細解釋了Llama3模型的實現過程,包括注意力機制、位置編碼等關鍵內容。
【AiBase提要:】
🔥 代碼庫爆火,吸引無數開發者關注,Karpathy點贊轉發評論
👨💻 作者Nishant Aklecha詳細解釋Llama3模型實現過程,包括注意力機制和位置編碼
🚀 納哥從頭實現Llama3,展示每行代碼功能,Karpathy稱讚詳細展開易理解
詳情鏈接:https://top.aibase.com/tool/llama3-from-scratch
11、AI 框架Ambient Diffusion:從圖像中獲取靈感,而非複製
德克薩斯大學奧斯汀分校的研究團隊開發了名爲Ambient Diffusion的框架,通過對無法辨認的圖像進行訓練,繞過AI模型複製他人作品的問題。這一框架不僅在藝術領域有用,還有潛力應用於科學和醫學領域,如黑洞成像和MRI掃描。研究團隊的創新爲人工智能發展提供了新思路。
【AiBase提要:】
🔍 Ambient Diffusion框架通過訓練擾亂後的圖像數據,解決AI模型複製作品的問題。
💡 該框架潛力巨大,可應用於藝術、科學和醫學領域,如黑洞成像和MRI掃描。
📝 初步實驗表明,Ambient Diffusion框架仍能生成高質量樣本,而不需要識別原始源圖像內容。
詳情鏈接:https://arxiv.org/abs/2305.19256
12、好萊塢女星斯嘉麗抨擊OpenAI抄襲她的聲音用於ChatGPT
斯嘉麗・約翰遜聲稱OpenAI在她拒絕爲ChatGPT提供聲音後,仍擅自模仿了她獨特的音調。OpenAI展示了與斯嘉麗・約翰遜在《Her》中扮演的人工智能助手極爲相似的合成語音,但突然禁用了這一新聲音。評論家批評OpenAI的行爲,讚揚斯嘉麗・約翰遜的立場。
【AiBase提要:】
⭐ 斯嘉麗・約翰遜聲稱OpenAI擅自模仿她的音調。
⭐ OpenAI展示了與斯嘉麗・約翰遜在《Her》中扮演的人工智能助手相似的合成語音。
⭐ 評論家批評OpenAI的行爲,讚揚斯嘉麗・約翰遜的立場。
13、英特爾推出新一代 Lunar Lake 芯片
英特爾計劃在今年第三季度推出 Lunar Lake 筆記本處理器,旨在爲 C opilot Plus PC 帶來全新的 AI 體驗。該芯片將提供比其前身 Meteor Lake 更高的三倍 AI 性能,預計在今年底前將搭載40多萬顆 Lunar Lake 芯片。這一舉措是英特爾在 AI PC 市場中的重要一步,旨在應對競爭對手的挑戰。
【AiBase提要:】
⭐ Lunar Lake 芯片將採用 CPU、集成的 Xe2GPU 和神經處理單元(NPU),提供比其前身 Meteor Lake 更高的三倍 AI 性能。
⭐ 英特爾計劃在今年底前向全球80多款新筆記本型號中搭載40多萬顆 Lunar Lake 芯片,以應對 AMD 的 Zen5和高通的 Oryon。
⭐ Lunar Lake 處理器的 NPU 將能夠執行超過40萬億次操作每秒(TOPS),遠高於 Meteor Lake 芯片的10TOPS。這將爲 AI PC 帶來更強大的性能和更豐富的應用體驗。