AI業界に新たな波が!アリババが最新傑作「通義千問QwQ-32B推論モデル」を発表し、全面的にオープンソース化しました。この期待の新モデルは、大規模な強化学習を経て鍛え上げられ、高度な数学演算、複雑なコード記述、一般的なAI能力において飛躍的な進歩を遂げ、業界のベンチマークであるDeepSeek-R1と正面から渡り合えるほどの性能を誇ります。


AI業界に新たな波が!アリババが最新傑作「通義千問QwQ-32B推論モデル」を発表し、全面的にオープンソース化しました。この期待の新モデルは、大規模な強化学習を経て鍛え上げられ、高度な数学演算、複雑なコード記述、一般的なAI能力において飛躍的な進歩を遂げ、業界のベンチマークであるDeepSeek-R1と正面から渡り合えるほどの性能を誇ります。

混元T1正式版は、大規模強化学習を基盤に、数学、論理推論、科学、コードなどの理系難問に対し、専門的な最適化を行いました。これにより、推論能力が大幅に向上しました。一般的なベンチマーク、例えば大規模言語モデル評価強化データセットMMLU-PROにおいて、混元T1は87.2点という優れた成績を収めました。
2月25日、Anthropic社は最新の推論モデルであるClaude 3.7 Sonnetを発表しました。このモデルは革新的な設計理念と大幅に向上したプログラミング能力により、瞬く間に業界の注目を集めています。Claude 3.7 Sonnetの最大の革新は、迅速な回答と深い思考能力を融合させ、人間の脳の思考様式を模倣することで、よりスムーズなユーザーエクスペリエンスを提供することです。
スタンフォード大学とワシントン大学のAI研究者らが、わずか50ドル以下の費用で訓練されたAI推論モデルs1を開発したと発表しました。金曜日に公開されたこの研究成果は、s1が数学とプログラミング能力テストにおいて、OpenAIのo1モデルやDeepSeekのR1モデルに匹敵する性能を示したことを明らかにしています。s1のコードとデータはGitHubで公開されており、他の研究者も利用可能です。研究チームによると、彼らは…
OpenAIは、最新の、そして最大の人工知能モデルであるGPT-4.5のChatGPT Plusユーザーへの展開を開始したと発表しました。同社によると、ChatGPT Plusのサブスクライバーは今後1~3日以内に段階的にこのモデルへのアクセス権を取得できるようになります。OpenAIのCEOであるサム・アルトマン氏は、容量の制約により、初期のユーザーアクセスは管理されたものとなり、ユーザーの期待値を調整する必要があると述べています。GPT-4.5はOpenAIの...
中国で開発されたAI製品Manusが、世界初の汎用人工知能体としてクローズドβテストを開始し、大きな話題となっています。その革新的な機能と性能が注目を集め、瞬く間に人気を博しています。