【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、Stable Diffusion 3 APIリリース 性能はMidjourney v6に匹敵

QQ截图20240418091243.png

【AiBase要約:】

🚀 Stability AIが最新のStable Diffusion 3とTurboバージョンのAPIサポートをリリースしました。

🔍 SD3モデルは、ユーザーのテキストプロンプトの理解と実行においてより正確になり、生成される画像はユーザーの期待に沿ったものになります。

🤝 公式発表では、SD3モデルは、テキストから画像生成の分野において、DALL-E 3やMidjourney v6などの業界をリードするモデルに匹敵するか、それ以上のパフォーマンスを示しています。

🚀 Stability AIとFireworks AIが協力して、高速で信頼性の高いAPIサービスを提供します。

APIドキュメント: https://top.aibase.com/tool/stable-diffusion-3-api

体験版アドレス: https://sdxlturbo.ai/stable-diffusion3

2、Microsoft、口パクソフトウェアVASA-1を発表 画像と音声だけでリアルな動画を作成可能に

image.png

【AiBase要約:】

🌟 最長1分間の動画を生成可能。口の動きが同期し、表情の微妙な違いや頭の動きも捉えます。

🌟 中国語など複数の言語に対応し、歌を歌うこともできます。

🌟 オンライン生成の遅延はわずか170ミリ秒。ライブ配信にも使用でき、EMOよりも優れた効果を発揮します。

プロジェクトアドレス: https://top.aibase.com/tool/vasa-1

論文アドレス: https://arxiv.org/abs/2404.10667

3、AI衣装交換MagicClothing:制御可能な衣装交換を実現

image.png

【AiBase要約:】

👗 制御可能な衣装駆動型画像合成:ユーザーは、衣装とテキストプロンプトの強度を調整することで、合成画像の効果を制御し、パーソナライズされた画像合成を実現できます。

🎨 複数のモデルに対応:さまざまな解像度のモデルウェイトを提供しており、ユーザーは適切なモデルを選択して画像合成を行い、高品質な結果を得ることができます。

💃 多様な用途:ファッションデザイン、芸術創作、小売業界など、さまざまな分野で活用でき、革新的で便利な制御可能な衣装駆動型画像合成技術を提供します。

詳細リンク: https://top.aibase.com/tool/magicclothing

4、Google、新しいコードモデルCode Gemmaを発表:パラメーターが小さく、性能が高く、ハードウェア要件が低い!

image.png

【AiBase要約:】

⭐️ Code Gemmaには、基本的な事前トレーニング、指示微調整、高速推論の3つのバージョンがあります。

⭐️ 5000億トークン以上を使用して大規模な事前トレーニングを行い、主要なプログラミング言語のコードを高速に生成できます。

⭐️ 複数の有名なテストプラットフォームで良好な成績を収めており、特にJava、JavaScript、Kotlinなどの言語で優れた効果を発揮しています。

詳細リンク: https://goo.gle/codegemma

5、ボストン・ダイナミクス、新しい電動化Atlasロボットを発表

image.png

【AiBase要約:】

🔌 電動化駆動:新しいAtlasは全電動システムを採用し、滑らかで静かな動作性能を提供し、エネルギー効率を向上させ、メンテナンスの必要性を削減します。

🤖 柔軟な動作:高性能電動アクチュエータにより、Atlasはより広範で柔軟な動作範囲を実現し、人間に近づき、複雑なタスクを実行できます。

🔄 モダンなデザイン:軽量でシンプルな外観、機能的な円形スクリーンヘッドにより、機能性が向上し、人と機械のインタラクション体験が向上します。

詳細リンク: https://bostondynamics.com/blog/electric-new-era-for-atlas/

6、InstantMesh:高速で高品質な3Dモデルを生成

image.png

【AiBase要約:】

⚡ 高速生成:InstantMeshは約10秒で画像から3Dメッシュへの変換を完了できます。

🌟 高品質出力:生成される3Dモデルは高品質で、専門家のニーズを満たします。

🔧 フィードフォワード型フレームワーク:フィードフォワード型フレームワークを採用し、高度な技術を組み合わせて3D作成プロセスを最適化します。

詳細リンク: https://top.aibase.com/tool/instantmesh

7、Kimiスマートアシスタントがアップグレード:ネットワーク接続による高速な応答、検索は引用のソースをサポート

image.png

【AiBase要約:】

🚀 モデルの能力が向上し、最初の文字の返答速度が向上し、論理推論能力、数学とプログラミング能力が向上し、翻訳の精度が向上しました。

🔍 よく使うフレーズ機能が追加され、ユーザーは複数のシナリオのプロンプトを追加して、作業の効率性を高めることができます。

🎤 音声入力と音声出力機能に対応し、音声によるコミュニケーションやさまざまな音声設定を提供します。

8、ZeST:画像のテクスチャを別の画像に移行

image.png

【AiBase要約:】

⚙️ 単一のテクスチャの移行と複数のテクスチャの編集をサポートします。

🔬 拡散アダプターを使用して、暗黙的なテクスチャ表現を抽出します。

💡 幾何学的および照明ガイダンス情報と組み合わせて、テクスチャの転送を実現します。

詳細リンク: https://top.aibase.com/tool/zest

9、劉強東デジタル人初放送が記録を更新

【AiBase要約:】

🚀 ライブ配信初登場の視聴者数は2000万人を超え、取引額は5000万を超えました。

💡 AIデジタル人「采銷東哥」が自身の経験を共有し、ライブコマースの内容を解説しました。

💰 京東スーパーの注文数は10万件を突破し、100億元の農業補助プロジェクトが開始されました。

10、EU規制当局がMicrosoftによるOpenAIへの130億ドルの投資を承認

【AiBase要約:】

⭐️ Microsoftは、世界的な規制リスクを回避するために、他の人工知能企業との協力を積極的に模索しています。

⭐️ ハイテク投資に対する世界的な懸念から、複数の調査が開始されており、Microsoftは積極的に対応しています。

⭐️ Microsoftは、複数のパートナーとの連携を通じて、戦略的投資において非所有権の立場を取り、慎重に進めています。

11、バイトダンスの「AI宿題アシスタント」Gauthが米国教育アプリダウンロードランキングで2位に

image.png

【AiBase要約:】

🌟 Gauthは、Duolingoに次いで、米国の教育アプリ市場で2位のダウンロード数を記録しました。

🌟 中国の教育テクノロジー企業は、政策リスクの中で海外市場への進出に成功しました。

🌟 Gauthは、人工知能技術を利用して、さまざまな科目の問題解決、オンライン専門家のサポートなどのサービスを提供しており、ユーザーから好評を得ています。

製品入口:https://top.aibase.com/tool/gauth