Vectaraのランキングにおいて、OpenAI GPT-4は驚異的な97%の精度とわずか3%の幻覚率で首位に輝いています。
Vectaraはオープンソースモデルを用いて、大規模言語モデルの幻覚率を評価する方法を提供しており、企業がより信頼性の高い生成AIシステムを構築する上で役立っています。
一方、Googleのモデルはランキングで平均的な成績にとどまり、人工知能の発展と技術の安定性に関する議論を巻き起こしています。

Vectaraのランキングにおいて、OpenAI GPT-4は驚異的な97%の精度とわずか3%の幻覚率で首位に輝いています。
Vectaraはオープンソースモデルを用いて、大規模言語モデルの幻覚率を評価する方法を提供しており、企業がより信頼性の高い生成AIシステムを構築する上で役立っています。
一方、Googleのモデルはランキングで平均的な成績にとどまり、人工知能の発展と技術の安定性に関する議論を巻き起こしています。
中国の生成的AI競争はユーザー獲得の新段階に入っている。百度の「文心一言」の月間アクティブユーザー数は2億を突破し、初めて2億クラブに加わった国内大規模モデルとなった。アリババの「通義千問」はローンチから2か月で月間アクティブユーザー数が1億を突破し、急速な成長を見せている。百度は「全領域統合」の戦略を取り、AI機能を検索などのコア製品に全面的に統合し、応用の実現を加速している。
段階星辰がオープンソースで提供するマルチモーダル視覚言語モデルのStep3-VL-10Bは、10Bパラメータながら多数のベンチマークテストで優れた性能を発揮し、小規模モデルの知能レベルの不足という課題を解決しました。このモデルは視覚認識、論理的推論、数学コンテストなどの側面で同規模において最高の性能を達成し、パラメータ数が10〜20倍大きいオープンソースおよびクローズドソースのフラッグシップモデルをも上回っています。
ナビダは、模造サイトであるアンナアーカイブから500TBの電子書籍データを取得しようと試みたとして告発されている。このことは著者らによる集団訴訟を引き起こし、著作権侵害および極端な競争手段を取ったとして批判されている。
Zadarmaは2026年1月20日に、企業向けに24時間・多言語・高精度な電話応対とカスタマーサービスを提供する新たなAI音声インテリジェントエージェントを発表しました。このエージェントは自然な形で着信を受けて、複雑な意図を理解し、企業の知識ベースに基づいて正確な情報を提供できます。必要に応じて人工のカスタマーサービスへ転送することもでき、サービス効率と満足度を向上させます。これはZadarmaのクラウドPBXおよびCRMプラットフォームと深く統合されています。
バイドゥの文心アシスタントの月間アクティブユーザー数が2億を突破し、豆包、通義千問とならんで中国の三大2億規模のAIエントリーとされている。深層的な思考と長期記憶の能力を持ち、文脈に合わせてパーソナライズされた推薦を提供できる。ビデオ通話、AI創作、画像質問などのマルチモーダルサービスをカバーし、MCPツールを通じて情報を処理するだけでなく知的サービスへのアップグレードを実現している。