科大訊飛の星火は、中国製の代表的な大規模言語モデルの一つで、画像生成、画像認識、バーチャルヒューマン動画生成、コード生成など、多くの機能をサポートしています。さらに、ドキュメントQ&A、PPT作成、履歴書作成などのプラグイン機能も提供しています。また、強力なコード生成、解釈、修正機能を備えており、開発者にとって使いやすいツールとなっています。
関連推奨
NotebookLMにナノバナナを統合し、動画生成の画像に使用可能
NotebookLMがNano Bananaの画像生成モデルを統合し、テキスト処理からマルチモーダル作成へ進化。メモを動画に変換可能に。Proユーザー向けに段階的に展開中。....
xAIがGrok Code Fast1を発表:高速でコスト効果の高いエフェクティブなプロキシコード生成モデル
xAIが2025年8月に発表したGrok Code Fast1は、開発者向けの効率的な言語モデルで、優れた推論能力とコード生成性能を備えています。GitHub Copilotなどで無料利用可能。....
アリババ・テンスフォースが新規のテキストから画像生成モデルQwen-Imageをオープンソース化
テンスフォースシリーズ初のオープンソースモデルとして、20億パラメータを持つマルチモーダルディフュージョントランスフォーマー(MMDiT)ベース画像生成モデルであるQwen-Imageをリリースしました。この革新的な成果は、複雑なテキストレンダリングや正確な画像編集において画期的な進展を遂げ、複数の公開ベンチマークテストにおいて優れた性能を示し、画像生成と編集分野で注目を集めています。Qwen-Imageは強力なテキストレンダリング能力を備えており、複数行のレイアウト、段落レベルのテキスト生成、細かい細部の表現をサポートしています。英語だけでなく中国語においても対応可能です。
混元オープンソース新方案 MixGRPO:トレーニング効率が大幅に向上し、パフォーマンスもより強力に
TencentのMixGRPOは、SDEとODEを組み合わせた新しい画像生成フレームワークで、訓練時間を50%短縮。高性能を維持しつつ効率化を実現。コードは公開済み。....
通義千問がマルチモーダル統一理解と生成モデルQwen VLoをリリース
最近、Qwen VLoマルチモーダル大規模モデルが正式にリリースされました。このモデルは画像の内容理解と生成において顕著な進展を遂げており、ユーザーに新たなビジュアルクリエーション体験を提供しています。紹介によると、Qwen VLoは従来のQwen-VLシリーズモデルの利点を引き継ぎつつ、全面的なアップグレードが行われています。このモデルは、世界を正確に理解するだけでなく、理解に基づいて高品質な再創作を行うことができ、実際に「認識から生成」への飛躍を実現しています。ユーザーは現在、Qwen Chat(chat.qwen.ai)で利用できます。
