生成式AIは、「会話だけができる」質問応答ツールから、「袖をまくって働く」「スーパーデジタル従業員」として進化しています。6月8日、ユンジーシュエン(9678.HK)は新世代の汎用大言語モデルであるU2を正式に発表しました。個人、開発者、企業組織向けにカスタマイズされたネイティブなインテリジェントエージェント(Agent)として設計されたU2は、伝統的な大規模モデルが単一の対話に依存していた制約を完全に脱却し、技術の主軸を「高知能密度」と「高Token価値」の提供能力に固定しています。

実際の業務シナリオにおいて、従来のモデルは短いフローのテキスト生成にしか対応できず、複雑なシステム工学には対応できません。一方で、U2は、現実的なタスクに特化した連続的な実行ループを強化しています。複雑なオフィス作業、ソフトウェア工学、深い研究、そして複数ツールの協働など、高難度のシナリオにおいて、人間の専門家のように、全体的な抽象的なタスクを独自に分解し、100ステップを超える複雑なワークフローを継続的に推進できるようになりました。これにより、従来の「受動的対応」から「能動的実行」への飛躍を達成しました。

新モデルの発表に伴い、国内外の権威ある能力評価の最新結果も同時に公表されました。U2は複数の重要な次元で主流の大規模モデルの第1グループにランクインしました。非常に厳しいハードコアな知識と複雑な論理推論能力を試すGPQA Diamond評価では、U2は87.9という高いスコアを獲得し、GLM-5.1、Hy3preview、DeepSeek-V4-Flash(High)、MiniMax M2.7などの業界内で強力なライバルを上回る成績を収め、高度な専門的な問題に対しても極めて安定した性能を持っていることを証明しました。

論理的推論に加えて、U2は日常的な事務職の業務における出力品質にも驚くほど優れています。実際にオフィスや知識作業の出力能力を測定するGDPval評価では、このモデルは72.5という優れたスコアを記録しました。通常の暗記型の評価とは異なり、GDPvalは企業の生産環境での実際的な出力を重視しています。テスト結果によると、U2