360智腦推出Light-IF系列模型顯著提升複雜指令遵循能力

AIbase基地

Published in AI News · 1 minute read · Aug 12, 2025

360智腦團隊宣佈推出全新的Light-IF系列模型，這一創新框架旨在顯著提升大型語言模型（LLM）在複雜指令遵循方面的能力。隨着人工智能技術的不斷進步，儘管LLM在數學、編程等領域已經展現出了卓越的推理能力，但在遵循複雜指令方面仍存在不足。爲了解決這一問題，360智腦團隊提出了以預覽-自檢式推理和信息熵控制爲核心的Light-IF框架。

Light-IF框架通過五個關鍵環節來提升模型性能:難度感知指令生成、Zero-RL強化學習、推理模式提取與過濾、熵保持監督冷啓動、熵自適應正則強化學習。這一框架的提出，旨在破解當前推理模型中存在的“懶惰推理”現象，即模型在思考階段僅複述指令而不主動檢查約束是否被滿足，導致指令執行不準確的問題。

微信截圖_20250812101839.png

在實驗中，Light-IF系列模型在SuperCLUE、IFEval、CFBench及IFBench四個中文和跨語言指令遵循基準上均取得了顯著提升。特別是32B版本的Light-IF-32B，其在SuperClue得分達到了0.575，比下一個最佳模型高出13.9個百分點。此外，參數規模僅爲1.7B的Light-IF-1.7B在SuperClue和IFEval上的表現甚至超過了Qwen3-235B-A22B等體量更大的模型。

360智腦團隊表示，Light-IF系列模型的推出，不僅爲開源社區提供了一套可復現的完整路線和配套的開源代碼，而且全系模型將陸續在Hugging Face上開放，供社區使用、對比與復現。同時，訓練中使用的冷啓動數據集也將同步在GitHub上開放。此外，360與SuperCLUE聯合推出的中文精確指令遵循測評基準SuperCLUE-CPIFOpen也將在Github上開放，便於研究者評測模型的中文精確指令遵循能力。

這一新模型的推出，標誌着360智腦在提升人工智能模型複雜指令遵循能力方面邁出了重要一步，爲人工智能技術的發展和應用開闢了新的可能性。

AI大模型的版權風暴：行業巨頭面臨7500億美元賠償風險

近年來，隨着人工智能技術的飛速發展，大型 AI 模型的訓練數據來源問題日益成爲業界關注的焦點。許多知名企業在構建其 AI 模型時，似乎都選擇了使用大量未授權的版權內容作爲數據。這一 “祕密配方” 引發了激烈的法律爭論，並將硅谷的科技巨頭們推上了風口浪尖。2023年，《紐約時報》首次向 OpenAI 和微軟提起訴訟，正式揭開了這場法律之戰的序幕。不久後，Meta 因其 Llama 模型涉嫌使用盜版書籍而面臨集體訴訟，而 Anthropic 也因爲其 Claude 模型的訓練數據受到指控。所有主要玩家幾

春晚明星再奪冠!宇樹 H1奪機器人史首枚1500米金牌

AIbase 報道:8月15日，在國家速滑館舉行的全球首個以人形機器人爲核心的綜合性競技賽事上，宇樹科技人形機器人 H1斬獲歷史首枚1500米賽金牌。這位“冠軍選手”正是曾登上春晚舞臺的同款 H1，也是宇樹成立後研發的首款人形機器人。宇樹科技創始人王興興在現場接受鳳凰網科技採訪時表示:“這次奪冠的機器人就是上春晚的機器人，一模一樣，非常標誌性。它是2023年的型號，當時最快能跑到3.3米每秒，現在肯定更快、距離也更長，這對行業來說是非常有記憶點的一件事。”本屆賽事吸引

OpenAI 高管對用戶對 GPT-4o 的熱情感到意外，重啓版本以應對反饋

近日，OpenAI 的 ChatGPT 負責人 Nick Turley 在接受 Decoder 主持人 Alex Heath 的採訪時，分享了關於新一代模型 GPT-5的看法。他表示，GPT-5的推出過程並不順利，導致公司決定重新開放用戶對舊版 GPT-4o 的訪問權限。這一決定的背後，反映了用戶對 GPT-4o 模型的強烈依賴和喜愛程度，這讓 Turley 感到意外。在採訪中，Turley 提到，儘管 GPT-5在性能上有了提升，但其 “較少阿諛奉承” 的特性並未得到用戶的廣泛認可。用戶在使用新版本時，感受到了較大的落差，這促使 OpenAI 迅速採取措施，恢復對 GPT-4o

騰訊雲推出AI開發工具CloudBase AI CLI 可減少80%編碼量

8月15日，騰訊雲宣佈推出CloudBase AI CLI，這是一款深度集成雲開發平臺的AI命令行工具，旨在爲專業開發者提供更高效、更便捷的開發體驗。CloudBase AI CLI的前身是今年5月發佈的CloudBase AI ToolKit，此次升級使其功能更加強大，能夠顯著提升開發效率。 CloudBase AI CLI的核心優勢在於其統一的命令行入口，通過簡單的“tcb ai”命令，開發者可以調用多種AI編程工具，如Claude Code、OpenAI Codex、aider和Qwen Code等。這些工具能夠根據開發者的自然語言描述生成代碼、優化代碼結構，並支持一鍵部署到騰訊雲開發平臺。通過這種方式，CloudBase AI CLI可以減少80%的編碼量，極大地提高了開發效率。該工具的另一個顯著特點是其全平臺通用性和多模型協作能力。無論開發者是在本地電腦、雲端服務器，還是在小程序開發

Arm 推出 AI 驅動技術，提升移動設備圖形質量

近年來，隨着技術的不斷髮展，現代 PC 和遊戲機用戶已經享受到機器在3D 圖形處理方面帶來的諸多優勢。現在，Arm 公司計劃將這些先進的技術引入移動設備領域，推出一系列基於人工智能的算法，旨在實時提升智能手機、平板電腦等移動設備的圖形質量。Arm 推出了一種全新的 “神經” 技術，該技術被稱爲 “業界首創”，力求在移動設備上實現接近 PC 級別的視覺效果。這一技術的第一個實際應用是 “神經超級採樣”（NSS），它是一種能夠顯著提升圖形效果的算法。據 Arm 的介紹，使用

蘋果研究團隊突破AI編程瓶頸:讓開源模型自學SwiftUI界面開發

AIbase報道 - 蘋果研究團隊在最新發布的論文《UICoder:通過自動反饋微調大型語言模型生成用戶界面代碼》中，展示了一項令人矚目的技術突破:成功訓練開源模型自主學習SwiftUI用戶界面開發。儘管大型語言模型在創意寫作和編程領域表現出色，但在生成"語法正確、設計良好的UI代碼"方面仍存在明顯短板。研究團隊指出，即使在精心策劃的數據集中，UI代碼示例極爲稀缺，在某些代碼數據集中佔比不足1%。研究團隊以開源編程模型StarChat-Beta爲基礎，採用獨特的自動反饋循環方法:數據生成:向模

360智腦推出Light-IF系列模型 顯著提升複雜指令遵循能力

Related AI News