このブログでも議論してきたように、人工知能は画像生成から文章作成まで、目覚ましい進歩を遂げています。しかし、真に人の心を動かす音楽を生み出すとなると、AIは大きな課題に直面しています。
画像出典:画像はAIによって生成され、画像ライセンスサービスプロバイダーMidjourneyによって提供されています。
このブログでも議論してきたように、人工知能は画像生成から文章作成まで、目覚ましい進歩を遂げています。しかし、真に人の心を動かす音楽を生み出すとなると、AIは大きな課題に直面しています。
画像出典:画像はAIによって生成され、画像ライセンスサービスプロバイダーMidjourneyによって提供されています。
AIビジュアル創作分野において、MOKIショートビデオツールは先日、待望の会員機能を発表し、VIDUと可灵AIという2つの大規模言語モデルとの連携を実現しました。これにより、クリエイターの創作体験がさらに豊かになります。今回のアップデートでは、既存の美图奇想大モデルに加え、新たにVIDUと可灵AI大モデルを追加することで、アニメーションシーン、モーションエフェクト、制御性においてカスタマイズされた最適化を提供し、様々なクリエイターのニーズに対応します。
上海のロボットスタートアップ企業である智元ロボットは、上海人工智能実験室、国家と地方が共同で建設したヒューマノイドロボットイノベーションセンター、上海クーパー社と協力し、汎用的なロボット大規模モデルの訓練を支援することを目的とした、100万実機データセットAgiBot Worldを正式にオープンソース化しました。これは、全世界初の、全領域の現実的なシナリオ、多様なハードウェアプラットフォーム、一貫した品質管理に基づいた100万実機データセットです。AgiBot Worldデータセットは、智元が独自に構築した大規模データ収集工場と応用実験基地で作成され、総面積は…
OpenAIは、AIシステムが安全規則を処理する方法を変えることでセキュリティを向上させる新しいAI安全対策を発表しました。この新しいoシリーズモデルは、良い行動と悪い行動を例を通して学習するだけでなく、特定の安全ガイドラインを理解し、積極的に推論することができます。OpenAIの研究では、ユーザーが暗号化されたテキストを通じて違法行為の指示を得ようとした際、モデルが情報を復号化しながらもリクエストを拒否し、違反する安全規則を具体的に参照した例が示されています。この段階的な推論は...
アメリカのテクノロジー企業Nvidiaは最近、イスラエルのソフトウェア企業Run:aiの買収を完了しました。両社の協力により、AIクラウドコンピューティングの管理効率がさらに向上します。買収額は公表されていませんが、報道によると約7億ドルとのことです。Nvidiaは、AIエコシステムをより幅広くサポートするために、Run:aiのソフトウェアをオープンソース化すると発表しました。Run:aiの中核ソフトウェアは、顧客がNvidia GPUリソースを効率的にスケジュールし、AI演算を最適化することを支援します。
北京快手科技有限公司は先日、同社が独自開発したビジュアル生成大規模モデル、可灵AI(Kling)APIが新たな能力アップグレードを実施したと発表しました。アップグレード後の可灵AI APIは、バーチャル試着とリップシンクの2つの機能において著しい進歩を遂げ、EC、広告マーケティング、エンターテインメント、AIツール分野の顧客に、より強力な技術サポートを提供します。
智元机器人は上海人工知能研究所などの機関と協力し、AgiBot Worldデータセットを正式に発表しました。これは、現実世界のシーンに基づいた世界初の百万級ロボットデータセットです。GoogleのOpen X-Embodimentと比較して、長期的データ規模は10倍、シーンのカバー範囲は100倍に拡大し、データ品質は産業レベルの基準に達しています。具象知能分野のImageNetモーメントと称賛されているこのオープンソースプロジェクトは、驚くべきロボット能力を示しています。リビングでの生け花から、台所の料理、スーパーでのレジ業務まで、幅広いタスクをこなすことができます。