360開源升級自研7B參數模型360Zhinao3-7B 各項能力全面提升

360集團宣佈開源升級了自研的7B參數模型360Zhinao3-7B，並已上線Github開源社區，可供免費商用。這一模型不僅在數學和科學領域表現出色，更在通用能力上展現了強大的潛力，尤其在端側應用上具有顯著優勢。

在本次升級中，360Zhinao3-7B模型僅通過增量訓練700B的高質量token，就取得了顯著的效果提升，這相比前代模型360Zhinao2-7B的10.1T token成本大幅降低，且不會增加模型的推理成本。

微信截圖_20250507081022.png

在數據篩選方面，360智腦團隊加大了篩選力度，離線訓練了多種數據篩選模型，對不同種類的數據進行分檔打分，顯著提升了數據質量。此外，他們還調整了數據配比，大幅增加了數學、代碼、指令等數據的佔比，降低了網頁和書籍的佔比，從而進一步提升了模型的指令遵循和推理能力。

360Zhinao3-7B模型還增加了長文本預訓練階段，將最大窗口長度從4k提升至32k，ROPE的base從1w改爲100w。在長文本預訓練階段，團隊增加了超長文本和長代碼的比例，進一步優化了模型的長文本處理能力。

在模型效果方面，360智腦團隊使用開源工具opencompass對模型進行了多維度評估。結果顯示，360Zhinao3-7B模型在10B尺寸附近的模型中，具備較強的競爭力。在微調階段，團隊採用了多種策略，包括蒸餾、強化學習等，進一步提升了模型的性能。在長思維鏈訓練中，360Zhinao3-7B模型經過四個階段的訓練，最終在數學和科學數據上展現了與從0訓練的7B推理模型相當的競爭力，同時在通用多輪對話、角色扮演及複雜指令遵循上表現更爲出色。

360智腦團隊表示，360Zhinao3-7B模型的開源，旨在推動AI技術的發展，爲開發者提供更強大的工具。該模型不僅適用於數學和科學領域，更在端側應用上具有廣泛的應用前景。

https://github.com/Qihoo360/360zhinao3

音樂界的sd?ACE-Step音樂生成模型發佈，20秒打造4分鐘完整歌曲

ACE-Step，一款由ACE Studio與StepFun聯合開發的音樂生成“基礎模型”，於近日正式亮相，被譽爲“音樂界的Stable Diffusion”。該模型以其驚人的生成速度和多樣化功能引發行業熱議，支持19種語言，可在短短20秒內生成一首長達4分鐘的完整音樂作品，效率比主流模型快15倍以上。核心功能亮點:從歌詞到完整歌曲一氣呵成ACE-Step以其強大的生成能力重新定義了AI音樂創作。其核心功能包括:歌詞驅動創作:輸入歌詞，模型自動生成旋律並演唱完整歌曲;風格化編曲:根據指定的風格標籤（如說唱、電子樂

思科與 Meta 攜手推出網絡安全新武器：Foundation-sec-8B 大模型

思科（Cisco）與 Meta 的合作爲我們帶來了一個令人振奮的新進展。他們共同發佈了名爲 Foundation-sec-8B 的開源大型語言模型(LLM)，該模型專門針對網絡安全領域，具有80億個參數。這一創新產品不僅展現了兩大科技巨頭的強強聯手，也預示着網絡安全技術的新紀元。Foundation-sec-8B 模型基於 Meta 最新的 Llama3.1架構，由思科新成立的研發團隊開發。團隊在訓練過程中，利用了精選的網絡安全數據集，使得該模型在應對各種網絡威脅時表現尤爲出色。這些威脅包括但不限於網絡攻擊、數據泄露和惡意

Reddit 將加強用戶驗證以防止 AI 假冒行爲

最近，Reddit 社區因一項研究實驗而震驚，研究團隊在 “Change My View” 子版塊發佈了一羣 AI 驅動的模仿人類的機器人。這一大規模實驗旨在探討 AI 的說服力，結果顯示，這機器人發佈了超過1700條評論，冒充諸如虐待倖存者或反對 “黑人的命也是命” 運動的爭議性身份。對於 Reddit 來說，這起事件如同一場小型噩夢。Reddit 一直以來的品牌形象與真實和真實性密切相關，用戶希望在這裏分享真實的觀點和經歷。如果這種以人類爲中心的生態系統被 AI 干擾，或用戶無法信任信息來源，可能會

360開源升級自研7B參數模型360Zhinao3-7B 各項能力全面提升

相關推薦

月之暗面 Kimi 長思考模型 API 正式發佈

音樂界的sd?ACE-Step音樂生成模型發佈，20秒打造4分鐘完整歌曲

騰訊元寶上線「對話分組」：全平臺同步完全免費、不限次數

思科與 Meta 攜手推出網絡安全新武器：Foundation-sec-8B 大模型

Reddit 將加強用戶驗證以防止 AI 假冒行爲

360開源升級自研7B參數模型360Zhinao3-7B 各項能力全面提升

相關推薦

月之暗面 Kimi 長思考模型 API 正式發佈

音樂界的sd?ACE-Step音樂生成模型發佈，20秒打造4分鐘完整歌曲

騰訊元寶上線「對話分組」：全平臺同步 完全免費、不限次數

思科與 Meta 攜手推出網絡安全新武器：Foundation-sec-8B 大模型

Reddit 將加強用戶驗證以防止 AI 假冒行爲

騰訊元寶上線「對話分組」：全平臺同步完全免費、不限次數