マイクロソフトとUCバークレーの研究者らが、LLaMAをベースとした大規模言語モデル「Gorilla」を開発しました。これは、正確なAPI呼び出し生成において優れた性能を発揮します。
Gorillaは、幻覚問題の解決とドキュメント変更への適応という課題を克服し、GPT-4などの最先端LLMを凌駕しています。このモデルは、Torch Hub、TensorFlow Hub、Hugging Faceから取得した膨大なデータセットを用いてトレーニングされています。
Gorillaのコード、モデル、データ、デモはGitHubで公開されており、今後Kubernetes、GCP、AWS、OpenAPIなど、より多くの領域への対応を予定しています。
