昆侖万維が独自開発した大規模言語モデル、GPT-3.5とLLaMA2を凌駕

昆仑万维の天工大規模言語モデル

昆仑万維は、自社開発の天工大規模言語モデルがBenchmark GSM8Kテストにおいて80％の正解率を達成し、GPT-3.5やLLaMA2-70Bを上回り、世界トップレベルに達し、GPT-4に迫る性能を示したと発表しました。

天工大規模言語モデルは、MMLU、C-EVAL、HumanEvalなど複数のデータセットにおいても優れた性能を発揮し、他の主要な大規模言語モデルよりも高い精度を達成しています。

推論能力においては、GPT-3.5やLLaMA2-70Bを上回り、GPT-3.5と比較して、天工大規模言語モデルはよりシンプルで分かりやすい解法を示します。

現在、天工大規模言語モデルは内部テスト段階にあり、今後も技術力の向上に努め、ユーザーと企業に強力なインテリジェントな支援を提供していきます。

成都ゲーム企業のAI分野進出、黒神話：悟空AI版の登場は間近か？

『黒神話：悟空』が世界中で巻き起こしたゲームブームは、ゲーマーたちの熱狂を呼び起こしただけでなく、ゲーム産業と人工知能技術の深い融合を促進しました。モバイルゲーム開発の重要な拠点である成都は、そのゲーム産業の強みを活かし、AIとゲームの融合による革新的な潮流を牽引しています。成都のゲーム企業、特にAIがまだ一般的になる前からこの分野に精通していた企業は、積極的に転換を図り、ゲームとAIの融合への道を模索しています。行者AI、昆侖万維、海藝AIなどの企業は、ゲーム業界での経験と蓄積を活かし、成功裏に転換を…

簡単チューニング！マイクロソフト、Phi-3小型言語モデル向けサーバーレスファインチューニング機能を提供開始

マイクロソフトは、Phi-3小型言語モデル向けのサーバーレスファインチューニング機能を発表しました。Azure AIプラットフォーム上で、開発者はモデルのパフォーマンスを容易に調整でき、基盤となるインフラストラクチャの管理は不要です。初期利用は無料です。30億パラメーターを持つPhi-3モデルは、企業開発者向けに設計されており、高いパフォーマンスと低コストを実現します。OpenAIのGPT-3.5と比較すると、パラメーター数は少ないものの、様々なアプリケーションにおいて同等の性能を発揮します。サーバーレスファインチューニングにより、操作が簡素化され、参入障壁が低くなり、小型から中型モデルのファインチューニングをサポートします。

Google、OpenAIのGPT-3.5-turboモデルへの攻撃に成功、コストはわずか150元

GoogleはOpenAIのGPT-3.5-turboモデルへの攻撃に成功、コストはわずか150元。攻撃方法はシンプルで、APIを介して2000回未満のクエリで投影行列全体と隠れ次元を取得可能。この攻撃は、大規模言語モデルもセキュリティ上の脅威にさらされる可能性があることを示している。OpenAIは同様の攻撃を防ぐため、モデルAPIを修正済み。

レポート発表：GPT-3.5の出力の60％が剽窃であることが判明

Copyleaksのレポートによると、GPT-3.5の出力が60％の確率で剽窃であることが判明しました。GPT-3.5は、異なる分野で異なる類似性スコアを示します。この剽窃問題は、OpenAIとニューヨークタイムズ間の法的紛争を引き起こしています。

AI業界に衝撃！マイクロソフトの論文がGPT-3.5のパラメータ数をわずか200億と暴露