騰訊の混元が、キーワードから画像を生成できる文から画像生成機能を公開しました。強力な中国語理解能力を備え、風景、人物、アニメなど、様々なスタイルの画像を生成可能です。
騰訊混元による文から画像生成機能は既に180以上の業務に導入されており、広告、ゲーム、コンテンツなどの分野で活躍が期待されています。
大規模言語モデル(LLM)の急速な発展に伴い、モデルのトレーニングと推論コストが研究とアプリケーションの焦点となっています。最近、テンセント混元チームは重要な研究を発表し、低ビット浮動小数点量子化トレーニングの「Scaling Laws」、つまり浮動小数点量子化トレーニングのスケーリング則について深く掘り下げました。この研究の中核は、モデルの精度を下げることで、性能を損なうことなく計算とストレージコストを大幅に削減する方法を探ることです。研究チームは...
OpenAI CEOサム・アルトマンがGPT-6を「GPT-6-7」に改名。Dictionary.comが「67」を2025年の流行語に選出したことと重なり、改名理由に謎が深まる。....
OpenAIのCEOであるサム・オルトマンが上場への懸念に応え、マスクとの論争を否定した。報道によると、同社は来年後半にIPOを申請する予定で、少なくとも600億ドルを調達し、1兆ドルの評価額を目指す可能性がある。これは歴史的かつ最大級のIPOの一つとなるだろう。
月の暗面が「Kimi Linear」を発表。混合線形アーキテクチャで、短長距離情報処理と強化学習において従来の全注意機構を上回る性能を実現。Kimi Delta Attentionがゲート機構を導入し、RNNのメモリ管理効率を向上。....
LightricksがAI動画生成モデルLTX-2を発表。20秒の4K高精細ナラティブ動画を生成可能で、音声と映像の同期、口の動きの一致を実現。拡散過程で映像と音声を同時生成する画期的な技術で、動画制作の効率を大幅に向上。....