【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、Stable Diffusion 3 APIリリース 性能はMidjourney v6に匹敵

【AiBase要約:】
🚀 Stability AIが最新のStable Diffusion 3とTurboバージョンのAPIサポートをリリースしました。
🔍 SD3モデルは、ユーザーのテキストプロンプトの理解と実行においてより正確になり、生成される画像はユーザーの期待に沿ったものになります。
🤝 公式発表では、SD3モデルは、テキストから画像生成の分野において、DALL-E 3やMidjourney v6などの業界をリードするモデルに匹敵するか、それ以上のパフォーマンスを示しています。
🚀 Stability AIとFireworks AIが協力して、高速で信頼性の高いAPIサービスを提供します。
APIドキュメント: https://top.aibase.com/tool/stable-diffusion-3-api
2、Microsoft、口パクソフトウェアVASA-1を発表 画像と音声だけでリアルな動画を作成可能に

【AiBase要約:】
🌟 最長1分間の動画を生成可能。口の動きが同期し、表情の微妙な違いや頭の動きも捉えます。
🌟 中国語など複数の言語に対応し、歌を歌うこともできます。
🌟 オンライン生成の遅延はわずか170ミリ秒。ライブ配信にも使用でき、EMOよりも優れた効果を発揮します。
プロジェクトアドレス: https://top.aibase.com/tool/vasa-1
論文アドレス: https://arxiv.org/abs/2404.10667
3、AI衣装交換MagicClothing:制御可能な衣装交換を実現

【AiBase要約:】
👗 制御可能な衣装駆動型画像合成:ユーザーは、衣装とテキストプロンプトの強度を調整することで、合成画像の効果を制御し、パーソナライズされた画像合成を実現できます。
🎨 複数のモデルに対応:さまざまな解像度のモデルウェイトを提供しており、ユーザーは適切なモデルを選択して画像合成を行い、高品質な結果を得ることができます。
💃 多様な用途:ファッションデザイン、芸術創作、小売業界など、さまざまな分野で活用でき、革新的で便利な制御可能な衣装駆動型画像合成技術を提供します。
4、Google、新しいコードモデルCode Gemmaを発表:パラメーターが小さく、性能が高く、ハードウェア要件が低い!

【AiBase要約:】
⭐️ Code Gemmaには、基本的な事前トレーニング、指示微調整、高速推論の3つのバージョンがあります。
⭐️ 5000億トークン以上を使用して大規模な事前トレーニングを行い、主要なプログラミング言語のコードを高速に生成できます。
⭐️ 複数の有名なテストプラットフォームで良好な成績を収めており、特にJava、JavaScript、Kotlinなどの言語で優れた効果を発揮しています。
詳細リンク: https://goo.gle/codegemma
5、ボストン・ダイナミクス、新しい電動化Atlasロボットを発表

【AiBase要約:】
🔌 電動化駆動:新しいAtlasは全電動システムを採用し、滑らかで静かな動作性能を提供し、エネルギー効率を向上させ、メンテナンスの必要性を削減します。
🤖 柔軟な動作:高性能電動アクチュエータにより、Atlasはより広範で柔軟な動作範囲を実現し、人間に近づき、複雑なタスクを実行できます。
🔄 モダンなデザイン:軽量でシンプルな外観、機能的な円形スクリーンヘッドにより、機能性が向上し、人と機械のインタラクション体験が向上します。
詳細リンク: https://bostondynamics.com/blog/electric-new-era-for-atlas/
6、InstantMesh:高速で高品質な3Dモデルを生成

【AiBase要約:】
⚡ 高速生成:InstantMeshは約10秒で画像から3Dメッシュへの変換を完了できます。
🌟 高品質出力:生成される3Dモデルは高品質で、専門家のニーズを満たします。
🔧 フィードフォワード型フレームワーク:フィードフォワード型フレームワークを採用し、高度な技術を組み合わせて3D作成プロセスを最適化します。
7、Kimiスマートアシスタントがアップグレード:ネットワーク接続による高速な応答、検索は引用のソースをサポート

【AiBase要約:】
🚀 モデルの能力が向上し、最初の文字の返答速度が向上し、論理推論能力、数学とプログラミング能力が向上し、翻訳の精度が向上しました。
🔍 よく使うフレーズ機能が追加され、ユーザーは複数のシナリオのプロンプトを追加して、作業の効率性を高めることができます。
🎤 音声入力と音声出力機能に対応し、音声によるコミュニケーションやさまざまな音声設定を提供します。
8、ZeST:画像のテクスチャを別の画像に移行

【AiBase要約:】
⚙️ 単一のテクスチャの移行と複数のテクスチャの編集をサポートします。
🔬 拡散アダプターを使用して、暗黙的なテクスチャ表現を抽出します。
💡 幾何学的および照明ガイダンス情報と組み合わせて、テクスチャの転送を実現します。
9、劉強東デジタル人初放送が記録を更新
【AiBase要約:】
🚀 ライブ配信初登場の視聴者数は2000万人を超え、取引額は5000万を超えました。
💡 AIデジタル人「采銷東哥」が自身の経験を共有し、ライブコマースの内容を解説しました。
💰 京東スーパーの注文数は10万件を突破し、100億元の農業補助プロジェクトが開始されました。
10、EU規制当局がMicrosoftによるOpenAIへの130億ドルの投資を承認
【AiBase要約:】
⭐️ Microsoftは、世界的な規制リスクを回避するために、他の人工知能企業との協力を積極的に模索しています。
⭐️ ハイテク投資に対する世界的な懸念から、複数の調査が開始されており、Microsoftは積極的に対応しています。
⭐️ Microsoftは、複数のパートナーとの連携を通じて、戦略的投資において非所有権の立場を取り、慎重に進めています。
11、バイトダンスの「AI宿題アシスタント」Gauthが米国教育アプリダウンロードランキングで2位に

【AiBase要約:】
🌟 Gauthは、Duolingoに次いで、米国の教育アプリ市場で2位のダウンロード数を記録しました。
🌟 中国の教育テクノロジー企業は、政策リスクの中で海外市場への進出に成功しました。
🌟 Gauthは、人工知能技術を利用して、さまざまな科目の問題解決、オンライン専門家のサポートなどのサービスを提供しており、ユーザーから好評を得ています。
