騰訊の混元が、キーワードから画像を生成できる文から画像生成機能を公開しました。強力な中国語理解能力を備え、風景、人物、アニメなど、様々なスタイルの画像を生成可能です。
騰訊混元による文から画像生成機能は既に180以上の業務に導入されており、広告、ゲーム、コンテンツなどの分野で活躍が期待されています。
大規模言語モデル(LLM)の急速な発展に伴い、モデルのトレーニングと推論コストが研究とアプリケーションの焦点となっています。最近、テンセント混元チームは重要な研究を発表し、低ビット浮動小数点量子化トレーニングの「Scaling Laws」、つまり浮動小数点量子化トレーニングのスケーリング則について深く掘り下げました。この研究の中核は、モデルの精度を下げることで、性能を損なうことなく計算とストレージコストを大幅に削減する方法を探ることです。研究チームは...
Loomiは世界初のAIコンテンツ作成IDEをリリースし、クリエイターが直面する効率低下やコンテンツの適合性の難しさといった課題に対処することを目的としています。AI技術を活用して制作プロセスを最適化し、コンテンツ生産効率を向上させます。
アリババクラウドの通義ラボは、Qwen Code バージョン0.5.0をリリースしました。国内のAIプログラミングツールがコマンドラインツールからフルスタック開発エコシステムプラットフォームへと進化しました。新バージョンでは、コアなコーディング能力が強化され、プラグインの統合、プロジェクトの上下文理解、開発者の協力支援において新たな突破を遂げました。多ツール連携アーキテクチャを導入し、開発者のデジタル作業台を構築しています。
元宝プラットフォーム2025年のレポートによると、混元大モデルはAIの能力を多方面にわたって向上させました。プラットフォームでは「速い思考」と「深く考える」の2つのモードを提供しています。7割以上のユーザーが「速い思考」モードを選択しており、半数近くの問題が最初のホップで解決されます。一方、「深く考える」モードは複雑なシナリオに適しており、会話は通常3ホップ以上続くことが多く、半数近くが複数ステップの構造化されたコンテンツを出力します。画像インタラクションにおいては、5月に混元T1-Visモデルがリリースされました。
ソーシャルプラットフォームX(元Twitter)は、そのおすすめシステムを全面的にアップグレードし、xAIが開発したGrok大モデルによって駆動されていると発表しました。これは従来のルールから純粋なAIスマート推薦へと移行するものです。この変革により、世界中のユーザーにより正確でカスタマイズされたコンテンツ体験を提供することが目的とされています。これはソーシャルメディアアルゴリズムの進化における重要な節目と見なされています。Grokは1日に1億を超える投稿を処理し、新システムの核心的な処理能力を支えています。