歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解:https://top.aibase.com/

1、微軟推設計神器Microsoft Designer

作爲一款集成人工智能技術的設計應用程序,Microsoft Designer讓設計變得更簡單、高效。用戶可以在任何設備上訪問這個強大的工具,無縫集成於Microsoft365應用,提供智能對象檢測、創新工具和圖像風格重塑等功能。

【AiBase提要:】

🚀 無縫集成於Microsoft365應用,便捷創建和編輯圖像和設計。

🔍 智能對象檢測功能,輕鬆擦除不需要的對象或創建背景虛化效果。

🎨 創新工具包括提示模板、個性化賀卡和邀請函的創建,以及圖像風格重塑和背景替換功能。

詳情鏈接:https://top.aibase.com/tool/microsoft-designer-sticker-creator

2、ElevenLabs發佈Turbo2.5模型:速度提升3倍,覆蓋中文等32種語言

在人工智能的世界裏,ElevenLabs推出的Turbo2.5模型再次突破語言界限。該模型不僅在性能和多語言支持方面表現卓越,速度提升3倍,延遲降低至300毫秒,爲動態互動提供更強大支持。用戶體驗方面,提供了豐富的語言選擇和便捷的轉換功能,同時確保數據安全和合規性。

【AiBase提要:】

🚀 Turbo2.5模型支持32種語言,速度提升3倍,延遲降低至300毫秒,爲動態互動提供更強大支持。

🌐 首次支持越南語、匈牙利語和挪威語的文本到語音轉換,豐富了語言庫,提高了英語文本到語音的速度。

🔊 提供廣泛的應用場景,包括會話式AI、教育、娛樂和內容創作,提供逼真的語音支持,如Praktika.ai、Kindroid和Aug X Labs的應用實例。

詳情鏈接:https://elevenlabs.io/api

3、蘋果AI發佈7億參數開源語言模型DCLM

蘋果公司與多家機構合作推出了7億參數的開源語言模型DCLM,該模型在訓練過程中使用了龐大的數據令牌,幫助理解和生成語言。DCLM提供了標準化的數據集優化工具,幫助研究人員進行有效實驗。新模型在重要測試中取得了顯著進展,同時降低了計算資源的需求。

【AiBase提要:】

🔑 蘋果AI與多家機構合作推出DCLM,創造了一個強大的開源語言模型。

🔑 DCLM提供標準化的數據集優化工具,幫助研究人員進行有效實驗。

🔑 新模型在重要測試中取得了顯著進展,同時降低了計算資源的需求。

詳情鏈接:https://huggingface.co/collections/mlfoundations/dclm-669938432ef5162d0d0bc14b

4、小米大模型小愛新增AI文檔問答、AI圖片編輯功能

小米公司宣佈小愛同學新增了「AI 圖片編輯」功能,用戶可進行背景轉換、風格轉換、路人消除、智能擴圖和圖片問答等操作。同時,「大模型小愛」還新增了「AI文檔問答」功能,提供更智能的文檔處理體驗。用戶需更新至V6.126版本體驗新功能。

image.png

【AiBase提要:】

✨ 小愛同學新增「AI 圖片編輯」功能,包括背景轉換、風格轉換、路人消除、智能擴圖和圖片問答。

🔍 用戶需更新至V6.126版本才能使用新功能。

📄 「大模型小愛」新增「AI文檔問答」功能,提供更智能的文檔處理體驗。

5、美圖AI視頻修復新技術,速度提升 10 倍,過曝也能搞定

視頻製作和圖像處理領域的關鍵技術之一是視頻的“去閃”技術。BlazeBVD作爲一種新型去閃算法,不僅能快速去除視頻中的閃爍現象,還保持視頻內容完整性和色彩真實性。它的出現革命性改變了視頻後期製作的方式。

image.png

【AiBase提要:】

🔍 BlazeBVD是一種自動化的視頻去閃技術,能有效提升視頻的時間一致性。

⚙️ BlazeBVD利用尺度-時間均衡方法處理視頻幀的直方圖,捕捉閃爍和局部曝光變化。

🚀 BlazeBVD在全局和局部去閃模塊、自適應時間一致性等方面展現卓越效果,速度提升達現有技術的10倍。

詳情鏈接:https://arxiv.org/html/2403.06243v1

6、百度沈抖:大模型應用進入爆發期

在2024中國聯通合作伙伴大會上,百度集團執行副總裁、百度智能雲事業羣總裁沈抖發表了關於深度擁抱人工智能+,加快發展新質生產力的演講。沈抖強調人工智能是創新的關鍵技術,大模型是人工智能的前沿陣地,並展示了大模型調用量的指數級增長。百度通過與企業合作,發現底層算力管理平臺的重要性,自主研發了百舸算力平臺,支持大模型的快速迭代。

【AiBase提要:】

🚀 大模型應用進入爆發期,企業將大模型應用於業務各個環節,而非僅等待爆款應用。

💡 一雲多芯成爲中國企業必然選擇,百度智能雲開放百舸算力平臺,共享“芯片選擇”的自由。

💻 百度基於文心大模型開發千帆工具鏈平臺,降低大模型的技術門檻和使用成本,推出千帆·行業增強版加速企業創新。

7、微軟研究人員SpreadsheetLLM項目

微軟研究人員最近發佈了名爲SpreadsheetLLM的創新研究,旨在解決大語言模型在解析電子表格時遇到的難題。該項目通過一種編碼框架,使得大語言模型能夠“讀懂”電子表格的內容,有望顯著提升電子表格的數據管理和分析效率,同時使用戶能夠用自然語言向AI提出問題,無需掌握複雜的公式和操作。

image.png

【AiBase提要:】

📊 電子表格對大語言模型的挑戰: 電子表格結構複雜且二維佈局,超出了大語言模型通常處理的線性輸入範圍。

🔍 SpreadsheetLLM技術解析: 微軟提出了SheetCompressor和Chain of Spreadsheet兩大核心技術,大幅提升了大語言模型對電子表格的理解能力。

🛠️ 對微軟AI工具的影響: SpreadsheetLLM有望增強微軟C opilot在Excel中的應用能力,但目前仍面臨生成數據準確性和計算資源消耗。

詳情鏈接:https://arxiv.org/html/2407.09025v1

8、谷歌2024年硬件大秀:Pixel9、Gemini以及新款可摺疊手機

谷歌將提前舉行大型硬件活動,宣佈Pixel9等新品,領先於蘋果iPhone16發佈。Gemini話題備受關注,新設備將引領Android領域AI功能。Android15帶來新功能和UI調整,Google Assistant的未來仍有懸念。Pixel Watch3和Pixel Buds Pro2也將亮相。

【AiBase提要:】

📱 谷歌將提前發佈Pixel9,領先蘋果iPhone16。

🌟 新設備將引領Android領域AI功能,Gemini話題備受關注。

🔍 Android15帶來新功能和UI調整,Google Assistant的未來仍有懸念。

9、Arcee AI發佈開源語言模型Arcee-Nova:基於Qwen2-72B 性能接近 GPT-4

Arcee AI最新推出的開源語言模型Arcee-Nova表現優異,接近GPT-4水準,標誌着重要里程碑,爲AI社區帶來新希望。Arcee-Nova結合Qwen2-72B-Instruct和定製調優模型,功能全面,廣泛應用於客戶服務、內容創作、軟件開發和教育等多個領域。

image.png

【AiBase提要:】

🌟 Arcee-Nova表現優異,接近GPT-4水準,爲AI社區帶來新希望。

💡 Arcee-Nova結合Qwen2-72B-Instruct和定製調優模型,功能全面。

📈 Arcee-Nova廣泛應用於客戶服務、內容創作、軟件開發和教育等多個領域。

詳情鏈接:https://udify.app/chat/s3i0GX51Rwrb4XRm

10、日本超市引入AI微笑監測系統

日本連鎖超市AEON引入了名爲“Mr Smile”的AI微笑監測系統,旨在提高員工的服務質量和顧客體驗。雖然系統在提升服務態度方面取得了顯著效果,但也引發了爭議和擔憂,涉及員工微笑的自然性和顧客騷擾問題。與其他行業做法相比,如麥當勞的“0元笑容”理念和福岡超市的慢速結賬通道,AEON的舉措受到了不同看法。

image.png

【AiBase提要:】

📈 AI微笑監測系統: AEON的“Mr Smile”系統通過分析450多種因素評估員工微笑和服務態度,旨在提升顧客體驗。

🔍 爭議與擔憂: 技術引發對員工騷擾的擔憂,部分人認爲強制微笑可能加劇員工苛責。

💡 行業對比: AEON與麥當勞的“0元笑容”理念相似,但面臨員工負擔增加批評。福岡超市的慢速結賬通道得到積極評價。

11、格靈深瞳開源視覺語言表示學習模型RWKV-CLIP

格靈深瞳開源了RWKV-CLIP模型,這是一個結合了Transformer和RNN優點的視覺語言表徵學習器。該模型通過圖文預訓練任務,使用從網站獲取的圖像-文本對擴展數據集,顯著提高了視覺和語言任務的性能。研究團隊引入了多樣化的描述生成框架,利用大型語言模型從基於網絡的文本、合成字幕和檢測標籤中合成和細化內容,以解決噪聲數據問題並提高數據質量。

【AiBase提要:】

🔍 模型結合了Transformer和RNN優點,通過圖文預訓練任務顯著提高了視覺和語言任務性能。

🔬 引入多樣化的描述生成框架,利用大型語言模型合成和細化內容,解決噪聲數據問題並提高數據質量。

🚀 RWKV-CLIP模型在輸入增強方面表現出色,實現了顯著的性能提升,並在多個下游任務中取得最先進的性能。

詳情鏈接:https://wisemodel.cn/models/deepglint/RWKV-CLIP

12、Neo4j LLM 知識圖譜AI生成器:將非結構化數據轉換爲知識圖譜

將雜亂無章的數據轉化爲有用的信息變得越來越重要,Neo4j推出了全新工具Neo4j LLM知識圖譜構建器,利用強大的機器學習模型將非結構化數據轉化爲結構化的知識圖譜,提高數據處理效率。工具靈活性高,用戶可自定義提取模式和清理數據,提供多種數據查詢技術,使數據分析更高效智能。

image.png

【AiBase提要:】

📊 強大的機器學習模型:基於OpenAI、Gemini等模型,處理各種數據格式,生成全面的知識圖譜。

⚙️ 靈活的數據提取:用戶可自定義節點和關係提取模式,進行數據清理,提高數據準確性和實用性。

🚀 高效的數據查詢:提供GraphRAG、Vector和Text2Cypher等多種技術,幫助用戶進行智能的數據分析和查詢。

詳情鏈接:https://top.aibase.com/tool/llm-graph-builder

13、OpenAI CEO承認“GPT-4O MINI”字母數字組合的命名方式存在問題

在OpenAI推出新一代GPT大語言模型GPT-4o Mini後,CEO山姆·奧特曼承認產品命名存在問題,引發廣泛關注和批評。他表示需要重新考慮命名方案,展現了對命名問題的重視。儘管面臨挑戰,OpenAI在其他項目中展現出創意的命名方式。未來是否會對現有命名體系進行全面改名,仍是未知數。

【AiBase提要:】

📢 山姆·奧特曼承認OpenAI的字母和數字組合命名方式需要改進。

🔍 OpenAI近期發佈的GPT-4o Mini被批命名繁瑣,引發CEO迴應。

💡 OpenAI的其他項目如Sora和DALL-E有更具創意的命名方式。

14、StockBot:AI驅動的實時股票數據聊天機器人,讓投資更智能

在信息爆炸的時代,投資者需要快速、準確的股票數據和新聞。StockBot是由Lama3-70B驅動的聊天機器人,運行在Groq上,能以閃電般的速度處理數據,通過Vercel生成式UI展示用戶友好的界面。它支持股票、外 匯、債券和加密貨幣,提供全面的市場分析,爲投資者提供強大的助手。

image.png

【AiBase提要:】

🤖 實時AI聊天: StockBot通過Llama370b支持的AI實現自然語言交互,提供即時股票信息和圖表。

📈 交互式股票圖表: 使用TradingView的實時小部件展示個性化、可定製的股票圖表和數據分析。

🚀 動態界面渲染: 根據用戶查詢動態渲染TradingView UI組件,提供最適合的金融界面。

詳情鏈接:https://github.com/bklieger-groq/stockbot-on-groq