歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。
新鮮AI產品點擊瞭解:https://top.aibase.com/
1、震撼來襲!Stability AI的SD3.5L新增三大 ControlNet功能 生圖能力再升級
Stability AI 發佈了新版 Stable Diffusion3.5Large,新增三種 ControlNet 功能,分別是Blur、Canny和Depth,顯著提升了圖像生成能力。用戶可在不商業化的前提下免費使用該模型,尤其是年收入低於100萬美元的小型企業和創作者也可享受商業用途的免費使用權。
【AiBase提要:】
🌟 新增三種 ControlNet 功能:Blur、Canny和Depth,提升圖像生成能力。
💼 免費使用協議:個人和年收入低於100萬美元的企業可免費使用模型。
🔒 強調安全性:Stability AI 採取措施,防止模型被濫用。
詳情鏈接:https://stability.ai/news/sd3-5-large-controlnets
2、Kimi內測AI視頻生成功能:每天免費100秒創作空間
人工智能聊天工具Kimi正在內測其創新的AI視頻生成服務——Kimi創作空間,目前處於灰度測試階段,旨在爲用戶提供全新的創意表達方式。用戶可以利用12種預設風格模板和自定義創作功能,製作個性化的音樂視頻,每天還可免費生成100秒的視頻。
【AiBase提要:】
🎨 Kimi創作空間提供12種預設風格和自定義功能,讓用戶自由創作個性化視頻。
🎶 用戶每天可免費生成100秒的視頻,極大地提升了創作的靈活性。
💡 該功能支持詳細描述視頻場景,爲創意表達提供更多可能性,推動AI視頻生成技術的發展。
3、跨界無限!智譜AI發佈AutoGLM升級版,一句話操控全網APP
智譜AI近期發佈了AutoGLM的多個升級版本,包括瀏覽器版和電腦版,展現出強大的跨APP操作能力。用戶只需一句話即可在多個應用間自由切換和操作,極大提升了效率。
【AiBase提要:】
⚡ 跨APP操作能力:用戶只需一句話即可在多個應用間進行操作,極大提升了使用效率。
🖥️ GLM-PC語音操控:通過語音指令直接操控電腦,簡化工作流程,成爲打工人的救星。
🌟 AutoGLM全能助手:支持主流APP,用戶可以輕鬆完成點餐、搜索等任務,展現出AI的智能化和靈活性。
4、特斯拉 “Optimus ” 機器人升級:手部設計更靈巧、更敏感!
特斯拉公司對其人形機器人“Optimus”進行了重大的手部設計升級,新增22個自由度和柔軟的保護層,提升了機器人的靈活性和觸覺感應能力。這一創新將爲機器人在家庭、醫療和工業等領域的應用提供更多可能性,展示了特斯拉在機器人技術領域的持續探索。
【AiBase提要:】
🤖 新手部設計具備22個自由度,提升操作靈活性和精準度。
🛡️ 新增的保護層增強觸覺感應能力,安全處理精細物品。
⚙️ 所有驅動器集成於前臂,計劃年底前完成傳感器整合並減輕重量。
5、亞馬遜開發新型多模態語言模型 “Olympus” 或將亮相 AWS 大會
亞馬遜正在開發一種名爲“Olympus”的多模態大型語言模型,預計將在下週的AWS re:Invent大會上發佈。該模型不僅能處理文本,還能處理圖像和視頻,具有廣泛的應用潛力。
【AiBase提要:】
💡 新模型“Olympus”將處理文本、圖像和視頻,支持自然語言搜索特定視頻片段。
🚀 該模型預計將在下週的AWS re:Invent大會上正式發佈,可能作爲AWS Bedrock的一部分。
🔧 亞馬遜的AI戰略不僅包括軟件,還涉及硬件開發,推出了針對訓練和推理的專用芯片系列。
6、Rhymes AI推出革命性文本圖像視頻生成模型Allegro-TI2V
Rhymes AI最近推出的Allegro-TI2V模型,標誌着文本到視頻生成技術的重大進步。該模型不僅支持高達79.2K的上下文長度和720×1280的輸出分辨率,還具備高效的視頻生成能力,能夠滿足創作者在電影、遊戲和數字藝術等領域的需求。
【AiBase提要:】
🚀 Allegro-TI2V支持高達79.2K的上下文長度和720×1280的分辨率,視頻生成速度可達每秒15幀。
🎨 該模型引入了後續視頻生成和中間視頻生成兩種新模式,極大提升了視頻創作的靈活性與效率。
💻 Rhymes AI在Apache2.0許可下發布Allegro-TI2V,用戶可通過簡單安裝快速上手,應用前景廣泛。
詳情鏈接:https://huggingface.co/rhymes-ai/Allegro-TI2V
7、恐怖如斯!AI只需兩小時訪談,完美復刻一個人個性、85%準確率!
近期,研究團隊與谷歌DeepMind合作,開發出一種新型AI應用,能夠在僅兩小時的訪談後生成個性模擬,準確率高達85%。這一技術基於ChatGPT大語言模型,通過提問和記錄參與者的回答,深入瞭解個性特徵。
【AiBase提要:】
🔍 AI模型在兩小時訪談後生成個性模擬,準確率達到85%。
💡 該技術旨在降低社會學研究的成本與時間,提高調查的有效性和廣泛性。
🤖 模擬的個性被稱爲“代理人”,未來可能改善工作助手及個人機器人的人機互動體驗。
詳情鏈接:https://techxplore.com/journals/arxiv/
8、谷東科技發佈雙目全綵AI+AR眼鏡:無感佩戴+高清鏡頭
谷東科技推出的Star1和Star1S眼鏡代表了AI與AR技術的完美結合,提供了全綵顯示和強大的AI功能。這些眼鏡不僅在設計上考慮了佩戴舒適度,還在技術上實現了高清畫質和多模態AI系統的應用。Star1S作爲業內首款全綵雙目陣列光波導AR眼鏡,預計將於12月上市。
【AiBase提要:】
🖼️ Star1S是首款全綵雙目陣列光波導AR眼鏡,提供更高的佩戴舒適度和畫面清晰度。
🤖 搭載多模態AI系統,Star1S在多種環境下實現全天候長續航,滿足不同場景需求。
📱 支持與主流應用兼容,用戶可通過眼鏡直接接打電話、觀看視頻,功能接近智能手機。
9.ChatGPT 誕生兩週年,用戶數突破2億
ChatGPT 自2022年推出以來,經歷了快速發展,成爲日常生活中不可或缺的數字工具。用戶在短時間內激增,現已超過2億,每月訪問量達到31億。新版本 GPT-4o 和搜索功能的推出,提升了用戶體驗,但仍存在信息準確性和倫理問題。OpenAI 正在努力解決這些挑戰,以進一步優化其服務和用戶信任。
【AiBase 提要:】
🌐 ChatGPT 用戶數在兩年內激增,成爲家庭中重要的數字助手。
🔍 新推出的搜索功能改善了信息獲取方式,挑戰傳統搜索引擎。
⚖️ ChatGPT 仍面臨信息準確性和倫理問題,需進一步提升解決方案。
10、超速崛起!xAI僅用1年多就達到了500億美元的估值
埃隆·馬斯克的人工智能公司xAI在短短16個月內達到了500億美元的估值,超越了許多競爭對手。與OpenAI相比,xAI的迅速崛起展示了其在AI領域的強大潛力和市場吸引力。公司通過融資和技術創新,尤其是超級計算機的建設,進一步鞏固了其在行業中的地位。
【AiBase提要:】
🚀 xAI在成立16個月內達到了500億美元的估值,超越了多家競爭對手。
💰 近期完成了50億美元的融資,用於購買NVIDIA芯片,支持超級計算機建設。
🤖 聊天機器人Grok成爲市場強勁競爭者,通過社交媒體訓練提升其響應能力。