ゼロワン万物(リンイーワンワンウ)社は、Yi-9Bモデルのオープンソース化を発表しました。このモデルはYiシリーズの中で、コードと数学の能力が最も高く、実際のモデルパラメータは88億、デフォルトのコンテキスト長は4000トークンです。Yi-9Bは、総合能力、コード能力、数学能力のいずれにおいても優れた性能を示し、他のオープンソースモデルを凌駕しています。さらに、Yi-9Bは消費レベルのグラフィックカードにも容易に導入でき、使用コストが低く、開発者にとって使いやすいモデルです。同社は李開復(リー・カイフー)氏(创新工场(イノベーションワークス)董事長兼CEO)が創業し、これまでにYi-34BとYi-6Bという2つのオープンソースの大規模言語モデルを発表しており、学術研究に対して完全にオープンソース化し、商用利用についても無料で申請を受け付けています。
関連推奨
アントグループがオープンソースのRing-2.5-1Tを発表。世界初のミックスド線形アーキテクチャを持つトレル(1兆)パラメータの思考モデル登場
アリグループが世界初の1兆パラメータ思考モデル「Ring-2.5-1T」をオープンソース化。長文生成、数学推論、エージェントタスクで優れた性能を発揮し、特に長文生成ではメモリアクセスを10分の1以下に削減、処理速度を3倍以上向上させた。....
智譜がGLM-5を発表:コード生成からエンジニアリング構築へのAgentic Ready時代へ
智谱が新たな基盤モデルGLM-5をオープンソース化。コード生成から複雑なシステム開発までを自律的に遂行する能力を実現し、世界ランキングで4位、オープンソースモデルでは1位を獲得。Claude Opus4に匹敵する性能と優れたエンジニアリング能力を備える。....
アップルの論文が再び注目!Qwen3-Coderをカスタマイズした結果、UI生成能力がGPT-5を凌ぐことになる?
アップルチームはオープンソースモデルを改良し、UIデザイン分野でトップクラスの大規模モデルを凌駕しました。従来のAIによるコード生成はUIデザインにおいては不十分であり、人間からのフィードバックに基づく強化学習が粗いものだったためです。アップルは細かい調整を行うことで、小規模なモデルが特定のタスクにおいて逆転を果たし、開発者たちが抱えていたインターフェース開発の悩みを解決しました。
誰が誰の先生なのか?Mistral CEOがDeepSeekが自社アーキテクチャを参考にしたと語り、技術界で議論を呼ぶ
Mistral CEOが中国のDeepSeek-V3が自社アーキテクチャに基づくと主張し、AI革新の帰属を巡る議論を引き起こした。焦点はスパースMoE技術が借用か自主革新かにある。....
メイドゥーが LongCat-Flash-Thinking-2601 のオープンソースツール呼び出し機能をリリースし、性能はさらに向上
メイドゥーのLongCatチームは最新のAIモデルLongCat-Flash-Thinking-2601をオープンソース化しました。このモデルはスマートエージェント検索やツール呼び出し、推論などの主要な評価項目でオープンソースモデルの中で最高水準に達しました。その中心的な強みは優れたツール呼び出し能力であり、依存ツールが必要な複雑なタスクを効果的に処理でき、現実的なシナリオにおいて新しいツールへの適応コストを著しく低下させます。
