【AI日報】コーナーへようこそ!ここはあなたが毎日人工知能の世界を探究するためのガイドです。私たちはAI分野のホットなトピックをお届けし、開発者に焦点を当てて技術トレンドや革新的なAI製品の応用について詳しくお伝えします。

新しいAI製品はこちらでチェック:https://top.aibase.com/

1. アリによるモバイル端末向けの3Dデジタル人応用MNN TaoAvatarのオープンソース化:バーチャルカスタマーサービスやバーチャルMCとして使用可能

アリババ・グループはMNN TaoAvatarを通じて、高忠実度の3D仮想キャラクター生成とリアルタイムインタラクション機能をモバイルデバイスに導入し、ライブストリーム、仮想ソーシャル、ARアプリケーションに新たな可能性をもたらしました。

image.png

【AiBase要約:】

✨ MNN TaoAvatarは本格的な3D仮想キャラクターのリアルタイム生成と駆動をサポートし、モバイル端末上で90FPSで滑らかに動作します。

🌟 3Dガウススプラッシュ技術を使用してミリ単位での細かい制御を可能にし、仮想キャラクターの動きを自然に同期させます。

🌐 オープンソースエコシステムにより豊富なAPIやツールが提供され、複数の入力をサポートし、開発の障壁を下げ、技術の普及を加速します。

詳細リンク:https://github.com/alibaba/MNN

2. MiniMax Agentが登場!画像生成+多言語対応で長時間タスク処理がさらにスマートに

MiniMax公式は、そのAIプロダクティビティツールMiniMax Agentが重大なアップデートを受けたことを発表しました。新たにインテリジェントな画像検索、安定した画像生成、多言語サポート、多様なドキュメントエクスポート機能が追加され、ユーザーエクスペリエンスが向上しました。

image.png

【AiBase要約:】

🌟 新しいインテリジェント画像検索と生成機能が追加され、複雑なシーンやクリエイティブな表現をサポートし、デザイン、マーケティング、コンテンツ制作に最適です。

📚 反省モードが導入され、長時間タスクの処理能力が強化され、学術研究やコードデバッグなど深い推論が必要なシナリオに特に適しています。

🌍 新しく中国語、日本語、韓国語に対応し、Pythonの描画機能が最適化され、アジア言語のサポート不足を埋め、ローカライゼーションを向上させます。

詳細リンク:https://agent.minimax.io

3. ロンロンハオ氏のデジタルヒューマンライブがついに百度のECプラットフォームで初披露、「AI+IP」の新しい販売モデルを探求

有名なECブロガーであるロンロンハオ氏は、自身のデジタルヒューマンが百度のECプラットフォームでライブストリーム販売を開始することを発表しました。彼にとってこれが初めてのデジタルヒューマンライブであり、百度の技術支援のもと、「AI+トップIP」モデルの巨大な可能性を示しています。

image.png

【AiBase要約:】

ロンロンハオ氏のデジタルヒューマンライブは6月15日に百度ECプラットフォームで始まり、トップブロガーとデジタルヒューマン技術の最初の結合となります。

百度ECプラットフォームには既に10万人以上のデジタルヒューマンMCが存在し、デジタルヒューマンライブにより、運営コストが80%以上削減され、売上高が平均62%上昇します。

今回の試みは、ライブEC業界がよりスマート、効率的、コスト効率の高い方向に進むことを促進する可能性があります。

4. OpenAI社員の株式売却ラッシュ、総額30億ドルに達し、ソフトバンクが最大の買い手に

本記事では、OpenAI社員が過去数回にわたって累計で約30億ドル相当の株式を売却した現象を取り上げ、その背景や影響を分析し、ソフトバンクが最大の買い手であることを明らかにしました。

image.png

【AiBase要約:】

2021年以降、OpenAI社員が累計で約30億ドル相当の株式を売却しており、ソフトバンクが最大の買い手です。

株式売却の頻度が高いが、関心は衰えていないものの、退職加速のリスクもあります。

激しいAI人材競争の中で、OpenAIは大きなプレッシャーにさらされており、コアチームを留めることが重要な課題となっています。

5. OpenAI、ChatGPT Projectsを大規模アップデート:深層研究+音声モード

私はユーザーとして、ChatGPT Projectsの機能更新に非常に興奮しています。深層研究と音声モードの追加により、AIアシスタントがよりスマートで使いやすくなりました。特にクロスプラットフォームのコラボレーションやモバイルワークには顕著な改善が見られます。これにより、複雑なタスクをよりスムーズにこなすことができます。

image.png

【AiBase要約:】

深層研究サポート:外部データを組み合わせて正確な情報検索を行い、複雑なシナリオに適応します。

音声モード統合:音声インタラクションを通じてモバイルワークの利便性を向上させ、リアルタイムのコラボレーションをサポートします。

モバイル端末強化:ファイルのアップロードやリアルタイム共有を含むマルチモーダルインタラクションをサポートし、使用シナリオを拡張します。

詳細リンク:https://help.openai.com/en/articles/10169521-using-projects-in-chatgpt

6. Metaの新型モデルでロボットが未知環境で物体操作を実現

Metaが発表したV-JEPA2モデルは、ビデオと物理相互作用を利用して世界モデルを構築し、ロボットが動的な環境において予測や計画を行う能力を向上させます。特に物流や製造業に広く応用されます。

image.png

【AiBase要約:】

🔍 V-JEPA2モデルは、ビデオと物理相互作用を通じて世界モデルを構築し、ロボットの動的環境での操作能力を向上させます。

🤖 ゼロショットロボットプランニングをサポートし、陌生物体の操作が可能になり、追加のトレーニングが不要です。

📈 物流や製造業で広く応用され、ロボットの適応性を高め、再プログラミングの必要性を減少させます。

詳細リンク:https://ai.meta.com/vjepa/

7. AMDとOpenAIが強力なAIチップを共同発表:推論パフォーマンスが35倍向上

AMDとOpenAIは、最新のInstinct MI400とMI350シリーズAIチップを発表しました。MI350シリーズはAI計算性能が大幅に向上し、MI400シリーズは次世代の旗艦級AI計算ニーズに対応しています。さらに、ROCm7プラットフォームはAI開発者の効率をさらに向上させました。

image.png

【AiBase要約:】

🚀 MI350シリーズGPUは卓越したAI計算性能を提供し、メモリ帯域幅は8TB/sに達し、推論パフォーマンスが35倍向上します。

🌟 MI400シリーズは低精度計算を最適化し、FP4性能は40petaflopsに達し、UALink技術によりGPU間の接続がスムーズに行われます。

🌐 ROCm7プラットフォームは複数の最高級AIプラットフォームを統合し、推論パフォーマンスを3.5倍以上向上させ、開発者の効率を最大化します。

8. Imagen 4がGeminiに登場!チャットがギャラリーに変身、AI画像生成が新时代を迎えます

GoogleのGeminiプラットフォームは、最新版のImagen4画像生成モデルを統合し、複雑なディテールからテキストレンダリングまで全面的にアップグレードされました。また、チャット内で直接画像生成と調整が可能です。この機能はクリエイティブデザイン、マーケティング、教育など多くの分野で強力なサポートを提供します。

image.png

【AiBase要約:】

✨ ディテール表示が卓越:複雑な織物や動物の毛並みなどのディテールが鮮明でリアリスティックに表現され、専門的な写真撮影に匹敵します。

💬 インタラクション体験が向上:チャットで画像生成し、リアルタイムで調整が可能になり、創造的な効率が大幅に向上します。

🌟 多様な用途:デザイン、マーケティング、教育などで活用でき、2K解像度をサポートし、多岐にわたるニーズに応えます。

9. Google AIによる気候予測:従来のモデルの限界を超える、10キロ単位まで正確に

本記事では、Googleの研究者が物理学モデルと生成AIを組み合わせた新しい方法を紹介しています。動的なダウンサンプリング法とR2D2モデルを用いて、グローバルな気候予測を約10キロメートルの解像度まで向上させ、計算コストを大幅に削減しながら予測精度を高めています。

image.png

【AiBase要約:】

🌍 AI技術を利用して、グローバルな気候予測を地域ごとの10キロメートル解像度の予測に変換し、モデルと実際のニーズのギャップを縮小します。

⚡️ R2D2モデルは物理学とAIの利点を結び付け、予測精度を高め、未見の状況にも効果的に適用できます。

💰 新しい方法は計算コストを大幅に削減し、従来の高解像度シミュレーションのほんの一部しかかかりません。多くの分野で利用可能です。

詳細リンク:https://research.google/blog/zooming-in-efficient-regional-environmental-risk-assessment-with-generative-ai/

10. 発展の加速:Gartnerは生成AIアプリケーションが50%のデリバリータイム短縮を予測

Gartnerは、2028年までに80%の生成AI商業アプリケーションが既存のデータ管理プラットフォーム上で開発されると予測しており、これによりデリバリータイムが50%短縮されるでしょう。RAG技術の応用により、生成AIモデルの正確性と信頼性が大幅に向上し、データガバナンスのプロセスが簡素化されます。

image.png

【AiBase要約:】

🌟 2028年までに80%の生成AI商業アプリケーションが既存のデータ管理プラットフォーム上で開発され、デリバリータイムが50%短縮されるでしょう。

🚀 検索強化生成(RAG)は生成AIアプリケーション開発の重要な基盤となり、柔軟性と説明可能性を提供します。

🔍 Gartnerは企業に既存プラットフォームの変革可能性を評価し、RAG技術を統合してメタデータを保護するよう勧めています。