騰訊の混元が、キーワードから画像を生成できる文から画像生成機能を公開しました。強力な中国語理解能力を備え、風景、人物、アニメなど、様々なスタイルの画像を生成可能です。
騰訊混元による文から画像生成機能は既に180以上の業務に導入されており、広告、ゲーム、コンテンツなどの分野で活躍が期待されています。
大規模言語モデル(LLM)の急速な発展に伴い、モデルのトレーニングと推論コストが研究とアプリケーションの焦点となっています。最近、テンセント混元チームは重要な研究を発表し、低ビット浮動小数点量子化トレーニングの「Scaling Laws」、つまり浮動小数点量子化トレーニングのスケーリング則について深く掘り下げました。この研究の中核は、モデルの精度を下げることで、性能を損なうことなく計算とストレージコストを大幅に削減する方法を探ることです。研究チームは...
マスク氏は政府医療システムの非効率性を批判し、AI診断とロボット手術による技術的解決策を提案。官僚主義を技術で代替し、効率的で普遍的な医療実現を提唱。....
OpenAI CEOサム・アルトマンは2023年、AIがAGI達成前に「超説得力」を獲得する可能性を警告。現在、AI駆動の社会的・感情的結びつきは法的・心理的論争を引き起こしており、研究はその本質的脅威が知能水準ではなく「遍在的な説得力」にあり、異常な結果を招く恐れがあると指摘。....
アリ健康の公式声明によると、健康Q&Aの結果には広告や商業ランキング、商業的干渉は含まれず、専門的で客観的な内容を保証。ユーザーにデマや商業的誇大宣伝に注意喚起。....
ByteDanceとNTUが開発したオープンソースフレームワーク「StoryMem」は、革新的な「視覚的記憶」メカニズムにより、単一ショット動画生成モデルをマルチショット長編動画生成ツールに進化させ、1分以上の自然なカット割りでキャラクターとシーンの一貫性を保つ物語動画を自動生成し、オープンソースAI動画技術の映画級ナラティブへの発展を促進します。....