阿里通義Qwen3語言模型上線，開源實力再升級!

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 21, 2025

在全球人工智能領域，Qwen 系列大型語言模型迎來了新成員 ——Qwen3的發佈。今日，通義宣佈將 Qwen3開源，帶來了令人振奮的技術革新。

此次發佈的旗艦模型 Qwen3-235B-A22B 以其2350億個參數的規模在多個基準測試中展現出強大的競爭力，超越了 DeepSeek-R1、o1、o3-mini、Grok-3及 Gemini-2.5-Pro 等頂級模型。此外，Qwen3-30B-A3B 作爲小型 MoE 模型，其激活參數數量僅爲 QwQ-32B 的10%，但性能卻顯著提升，甚至是 Qwen3-4B 這樣的迷你模型也能與 Qwen2.5-72B-Instruct 相媲美。

此次開源的還有多個 Dense 模型，包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B，所有模型均在 Apache2.0許可下開放使用。用戶可以在 Hugging Face、ModelScope 及 Kaggle 等平臺上獲取到這些經過後訓練的模型，適用於各種開發和研究需求。針對不同的使用場景，推薦使用 SGLang 和 vLLM 等框架進行部署。

Qwen3模型支持兩種思考模式，分別是 “思考模式” 和 “非思考模式”。思考模式允許模型逐步推理，適合複雜問題，而非思考模式則提供快速響應，適合簡單問題。這樣的靈活設計使用戶能夠根據需求調節模型的 “思考” 深度。

在語言支持方面，Qwen3支持119種語言和方言，極大地拓寬了其國際應用的潛力。爲了提升預訓練的質量，Qwen3的數據集相比前一代 Qwen2.5幾乎翻了一番，達到了約36萬億個 token，涵蓋了多樣化的語言數據。

Qwen3的發佈將爲大型基礎模型的研究和開發帶來新的機遇，助力全球研究人員和開發者利用這一先進技術構建創新的解決方案。

劃重點:
🌟 Qwen3-235B-A22B 在基準測試中表現卓越，開創語言模型新局面。
🌍 Qwen3支持119種語言，滿足全球用戶需求，擴展國際應用。
🔧 模型開源，用戶可在多個平臺輕鬆獲取和部署，促進研究與開發。

音樂界的sd?ACE-Step音樂生成模型發佈，20秒打造4分鐘完整歌曲

ACE-Step，一款由ACE Studio與StepFun聯合開發的音樂生成“基礎模型”，於近日正式亮相，被譽爲“音樂界的Stable Diffusion”。該模型以其驚人的生成速度和多樣化功能引發行業熱議，支持19種語言，可在短短20秒內生成一首長達4分鐘的完整音樂作品，效率比主流模型快15倍以上。核心功能亮點:從歌詞到完整歌曲一氣呵成ACE-Step以其強大的生成能力重新定義了AI音樂創作。其核心功能包括:歌詞驅動創作:輸入歌詞，模型自動生成旋律並演唱完整歌曲;風格化編曲:根據指定的風格標籤（如說唱、電子樂

思科與 Meta 攜手推出網絡安全新武器：Foundation-sec-8B 大模型

思科（Cisco）與 Meta 的合作爲我們帶來了一個令人振奮的新進展。他們共同發佈了名爲 Foundation-sec-8B 的開源大型語言模型(LLM)，該模型專門針對網絡安全領域，具有80億個參數。這一創新產品不僅展現了兩大科技巨頭的強強聯手，也預示着網絡安全技術的新紀元。Foundation-sec-8B 模型基於 Meta 最新的 Llama3.1架構，由思科新成立的研發團隊開發。團隊在訓練過程中，利用了精選的網絡安全數據集，使得該模型在應對各種網絡威脅時表現尤爲出色。這些威脅包括但不限於網絡攻擊、數據泄露和惡意

Reddit 將加強用戶驗證以防止 AI 假冒行爲

最近，Reddit 社區因一項研究實驗而震驚，研究團隊在 “Change My View” 子版塊發佈了一羣 AI 驅動的模仿人類的機器人。這一大規模實驗旨在探討 AI 的說服力，結果顯示，這機器人發佈了超過1700條評論，冒充諸如虐待倖存者或反對 “黑人的命也是命” 運動的爭議性身份。對於 Reddit 來說，這起事件如同一場小型噩夢。Reddit 一直以來的品牌形象與真實和真實性密切相關，用戶希望在這裏分享真實的觀點和經歷。如果這種以人類爲中心的生態系統被 AI 干擾，或用戶無法信任信息來源，可能會

英偉達新開源模型 Llama-Nemotron 震撼發佈，推理性能超越 DeepSeek-R1

近日，英偉達正式推出了其最新開源模型系列 ——Llama-Nemotron，該系列模型不僅在推能力上超越了 DeepSeek-R1，更是在內存效率和吞吐量上實現了顯著提升。根據最新發布的技術報告，Llama-Nemotron 的訓練過程與衆不同，採用了合成數據監督微調與強化學習的方法，以全方位提升模型的推理能力。Llama-Nemotron 系列模型包括 LN-Nano8B、LN-Super49B 和 LN-Ultra253B。這些模型的性能在業界引發了廣泛關注，尤其是 LN-Ultra，它在推理任務中表現優異，能夠在單個8xH100節點上高效運行，同時支持最多128K 的上下