AI日報：商湯Vimi視頻生成大模型開放內測；騰訊智影上線AI視頻功能；可直接生成6k圖像的生成器UltraPixel

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。

新鮮AI產品點擊瞭解：https://top.aibase.com/

1、商湯科技推出Vimi視頻生成大模型 C端應用Vimi相機開放內測

商湯科技在2024年世界人工智能大會（WAIC）上推出了Vimi視頻生成大模型，爲用戶提供精準的表情和肢體控制，支持多種驅動方式，穩定性突出且能生成高一致性的視頻內容。Vimi相機作爲首款C端應用，滿足廣大女性用戶的娛樂創作需求，支持多樣化的生成風格和個性化創作。

【AiBase提要:】
👩‍💻 Vimi模型利用商湯先進的大模型技術，能夠生成與目標動作一致的人物視頻，具有多年積累的面部跟蹤技術和精確控制能力。
🎥 Vimi能生成長達1分鐘以上的單鏡頭人物視頻，且畫面效果不會隨時間劣化，支持環境場景調整和逼真的視覺效果模擬。
📸 Vimi相機支持用戶上傳高清人物圖片生成數字分身和寫真視頻，提供多樣化的生成風格和趣味人物表情包。

2、限時免費！騰訊智影小程序上線「AI視頻」功能

智影小程序推出了名爲「AI視頻」的新功能，允許用戶一鍵轉換普通視頻爲風格化視頻，特別是動漫風格，提升視頻的吸引力。該功能目前限時免費，旨在幫助用戶提升視頻美感和趣味性。

【AiBase提要:】
🎥 一鍵式操作：快速上手，即使初學者也能製作專業級風格化視頻。
🎨 多種風格模板：提供多樣化模板，增強視頻美觀度和故事性。
🚀 提升視頻傳播力：風格化視頻易分享，吸引更多觀衆關注。

3、UltraPixel：超大分辨率圖像生成神器

UltraPixel是一款能夠生成超高分辨率圖像的黑科技，爲設計師和創作者帶來福音。通過Stable cascade訓練和微調，支持直接生成1K到6K分辨率的圖片。其技術手段包括隱式神經表示和尺度感知歸一化層，保持高度細節和真實感。同時，在最小空間內高效處理，參數利用率高達97%，提高訓練和推理效率。

QQ截圖20240709110659.jpg

【AiBase提要:】
🔍 UltraPixel支持直接生成1K到6K分辨率的圖片，細節精細到毛孔，清晰纖毫。
🚀 基於Stable cascade訓練和微調，即將開源，讓更多人體驗這份科技的魅力。
💡 通過低分辨率圖像中的豐富語義信息指導高分辨率圖像生成，降低複雜性，保持高度細節和真實感。
詳情鏈接:https://top.aibase.com/tool/ultrapixel

4、Groq推出閃電般快速的LLM引擎，僅四個月吸引28萬開發者

Groq公司最近推出了閃電般快速的LLM引擎，引起了廣泛關注。這款引擎每秒處理1256.54個標記，遠超GPU速度，展示了LLM聊天機器人的快速和靈活性。Groq提供免費的LLM工作負載服務，已有超過28萬開發者使用。CEO Ross預計到明年，全球一半推理計算將在Groq的芯片上運行。

【AiBase提要:】
🚀 Groq的LLM引擎每秒處理1256.54個標記，速度遠超GPU
🤖 Groq的引擎展示了LLM聊天機器人的快速和靈活性，吸引開發者和非開發者關注
💻 Groq提供免費的LLM工作負載服務，已有超過28萬開發者使用，預計全球一半推理計算將在其芯片上運行

5、無人車團隊推出電影級視覺AI特效Odyssey

無人車團隊跨足好萊塢，推出革命性電影級視覺AI特效Odyssey，顛覆電影、電視節目和視頻遊戲製作方式。Odyssey能生成好萊塢級別的故事鏡頭，突破視頻AI障礙，實現完全掌控視覺敘事核心層。靈感源自皮克斯，目標是用AI製作影視作品，解決AI可控性難題。

【AiBase提要:】
🎬 Odyssey實現完全控制視覺敘事核心層，生成高質量場景元素和方面
🌟 提出更強大的生成模型，訓練四個模型實現精細配置場景細節
🚗 團隊與自動駕駛汽車緊密相關，創始人在自動駕駛領域有豐富經驗
詳情鏈接:https://top.aibase.com/tool/odyssey

6、報道稱OpenAI內部論壇曾遭黑客入侵，機密被盜

近日，知名人工智能公司OpenAI的內部論壇遭到黑客攻擊，引發安全問題，員工擔憂安全漏洞可能被利用。公司發佈更新加密聊天記錄以提升數據安全性，成立安全與保安委員會加強安全措施。全球合作應對AI帶來的挑戰變得尤爲重要。

【AiBase提要:】
💡 OpenAI內部論壇遭黑客攻擊，公司安全性受到質疑，員工擔憂安全漏洞可能被利用。
💡 發現ChatGPT macOS應用程序存在安全漏洞，公司發佈更新加密聊天記錄以提升數據安全性。
💡 OpenAI成功阻止多起來自俄羅斯、以色列的祕密影響行動，成立安全與保安委員會加強安全措施。

7、Meta AI爲移動設備開發緊湊型語言模型MobileLLM

Meta AI研究團隊推出了MobileLLM，這是爲智能手機和其他資源受限的設備設計高效語言模型的新方法。該研究挑戰了有關有效AI模型規模的假設，取得了2.7%到4.3%的性能提升。MobileLLM的開發符合人們對更高效AI模型的需求，尚未向公衆開放，但已開源預訓練代碼。

【AiBase提要:】
🔑 MobileLLM是爲資源受限設備設計的高效語言模型，挑戰了大型模型的必要性。
🚀 MobileLLM的創新包括優先考慮模型深度、利用嵌入共享和分組查詢注意、採用直接塊權重共享技術。
💡 MobileLLM在基準測試任務上表現優異，3.5億參數版本在某些任務上與70億參數模型相當。

8、Poe社交平臺推出Previews功能

Poe社交平臺推出了名爲Previews的創新功能，爲用戶帶來前所未有的交互體驗，標誌着AI社交互動進入新紀元。Previews功能直觀易用，讓用戶在聊天界面中實時查看AI生成的Web應用並進行即時交互，提升了用戶與AI之間的互動質量。

【AiBase提要:】
🚀 AI社交互動進入新紀元，Previews功能讓用戶直觀操作AI生成的Web應用。
💡 Previews功能易用直觀，用戶輕鬆自然與AI進行即時交互。
💻 適用於大型語言模型，提供普通用戶接觸高級AI編程應用的機會，增加Poe平臺吸引力。

9、Xinsir開源Controlnet++模型支持Openpose、Canny等十多種條件控制

Xinsir最新發佈的Controlnet++開源模型具有多種控制條件，能夠生成高質量圖像，特別適用於需要精細編輯的設計師。該模型基於ControlNet架構，新增模塊支持超過十種不同的控制類型，提供了多種控制條件下的圖像生成示例。雖然目前無法在Web UI和Comfyui上使用，但其多功能性和高質量輸出使其成爲文本到圖像生成領域的一個重要突破。

【AiBase提要:】
🔧 Controlnet++支持Openpose和Canny等輸入，避免頻繁更換模型。
🧩 模型設計特點多種控制，使用相同網絡參數實現不同條件的圖像生成。
🚀 Controlnet++在SDXL實驗中表現優異，提供多種控制條件下的圖像生成示例。
詳情鏈接:https://top.aibase.com/tool/controlnet-

10、支付寶醫療大模型亮相中英文考試超GPT-4水平

支付寶的醫療大模型在中英文考試中表現超越了GPT-4，已在江浙滬一線醫院落地。該模型具備多模態能力，準確率達90%以上，可提供智能問答、病歷結構化和檢索等服務。支付寶聯合多家機構發起AI醫療共建計劃，致力於提升醫療效率和數據安全。