【AIニュース】へようこそ!ここは毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野の注目すべきコンテンツをお届けし、開発者に焦点を当てて、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。
新規AI製品クリックして詳細を確認:https://top.aibase.com/
1. 智譜がManusに似たPPT生成機能AI Slidesをリリースしました。無料で制限なく利用可能です。
智譜は新しいAI Slides機能をリリースしました。GLM-Experimentalモデルに基づいており、ユーザーが提供したテーマやドキュメントから迅速に高品質なPPTを生成できます。この機能は構造が明確で、データグラフが直感的であり、完全無料です。ユーザーはchat.z.aiで体験できます。
【AiBase要約:】
🌟 AI Slidesはテーマやドキュメントから迅速に高品質なPPTを生成できます。
📊 生成されたPPTは構造が明確で、データをグラフで示すことで理解しやすくなっています。
💻 chat.z.aiでAI Slides機能を無料で体験できます。
詳細リンク: https://chat.z.ai
2. 可靈AIがKetu 2.1モデルを発表:画像生成能力が大幅向上し、180種類のスタイルに対応
可靈AIは新たな画像生成モデル「Ketu 2.1」をリリースしました。指示に従う力、人像の美しさ、映画のような質などにおいて顕著な進歩があり、強力な文章生成能力も備えています。この新しいモデルは180種類以上のスタイルに対応しており、ユーザーにとって多様な創作選択肢を提供します。
【AiBase要約:】
🧪 新モデルは複雑な指示の理解に優れ、高品質な画像を正確に生成できます。
🎨 文章生成機能が強化され、180種類以上のスタイルに対応し、創作空間が広がります。
📈 可靈AIがKetu 2.1モデルをリリースし、画像生成能力が大幅向上しました。ユーザーは7日間無料で体験できます。
3. NVIDIAがDiffusionRendererを発表:動画から編集可能なリアルな3Dシーンを実現する新AIモデル
NVIDIAとそのパートナーがリリースしたDiffusionRendererは、動画生成と編集を組み合わせる画期的な技術です。3Dシーンの理解と操作を可能にし、神経逆レンダラーと神経前向レンダラーが協働して、動画のリアルさと適応性を向上させます。多数のタスクで優れたパフォーマンスを示しています。
【AiBase要約:】
🎥 DiffusionRendererは生成と編集機能を統合し、3Dシーンの創作に新たな可能性をもたらします。
🔄 神経逆レンダラーと神経前向レンダラーが協働して、動画のリアルさと適応性を向上させます。
🔧 実際の用途には動的照明、素材編集、オブジェクト挿入が含まれており、クリエイターが動画制作を簡単にできるようにします。
詳細リンク: https://youtu.be/jvEdWKaPqkc
4. 墨刀AIが大きなアップデート:考えを入力して30秒で高精細で編集可能なプロトタイプを作成
墨刀AIは新たなプロトタイプ生成機能をリリースしました。ユーザーは30秒で考えを入力して高精細で編集可能なプロトタイプを生成でき、複数回の対話による最適化と局所的な修正をサポートし、製品設計と検証の効率を向上させます。
【AiBase要約:】
🚀 30秒で編集可能なプロトタイプを生成し、マルチデバイス対応と複数回の対話による最適化をサポートします。
🎨 複数の画像入力をサポートし、スケッチや線画を自動的に解析してインターフェースを生成します。
🔧 ダブルモード編集と自動生成ドキュメントにより、デザイン即コードを実現し、さまざまなシナリオに対応します。
5. 10枚の写真をアップロードすると、AIが瞬時にファッションビデオになります!Higgsfield Soul IDが世界的に注目され、あなたのデジタルアイデンティティを変革します。
Soul IDはHiggsfield AIがリリースした革命的なAIツールで、10枚以上の個人写真をアップロードすることで、非常に個性的な仮想キャラクターを生成できます。主な機能には、リアルさと多様性の完璧な融合、多様なスタイルのプリセット、および自動提示語の最適化が含まれます。コンテンツクリエイターとファッションブログ運営者にとって強力な創作ツールを提供します。
【AiBase要約:】
📷 プライベートトレーニング:10枚以上の写真をアップロードすれば専用のAIキャラクターが生成されます。
🎨 多様なスタイルプリセット:60種類以上の高級スタイルプリセットが内蔵されており、一括切り替えが可能です。
💡 自動ヒントワード最適化:簡単な説明を入力すれば、AIが自動的に最適な条件を生成し、高品質な画像を出力します。
詳細リンク: https://higgsfield.ai/
6. グーグルDeepMindがGenAI Processorsをオープンソース化:ワンクリックでリアルタイムAIワークフローを構築
グーグルDeepMindはGenAI Processorsライブラリをオープンソース化しました。これは、非同期で組み合わせ可能な生成型AIワークフローを構築するために開発者に軽量かつ効率的なツールを提供するものです。このライブラリはマルチモーダルデータ処理をサポートし、Gemini APIベースのアプリケーションの開発効率を大幅に向上させます。
【AiBase要約:】
🔥 GenAI Processorsはモジュール式の設計により、複雑なAIワークフローの開発を簡素化します。
🚀 音声、動画、テキストなどのマルチモーダルデータの非同期処理をサポートし、リアルタイムアプリケーションの効率を向上させます。
🌟 オープンソースコミュニティとの協力により、ライブラリの機能がさらに拡張され、多くのシナリオやプログラミング言語をカバーします。
詳細リンク: https://github.com/google-gemini/genai-processors
7. グーグルVeo3に画像から動画への機能が追加され、7週間でユーザーが4,000万本以上の動画を作成
グーグルはAI動画生成分野で継続的に力を入れており、画像から動画への機能を追加し、コンテンツ認識機構を強化し、AIクリエイティブツールに対する市場の強い需要を示しています。
【AiBase要約:】
🖼️ グーグルはGeminiアプリケーションで画像から動画生成機能を追加し、AIクリエイティブツールの能力を拡張しました。
🎥 ユーザーは写真をアップロードして動画セグメントを生成し、説明の音声を追加し、作品をダウンロードまたは共有できます。
🔒 Veo3モデルで生成されたすべての動画には視覚的および不可視のデジタルウォーターマークが付いており、コンテンツの追跡可能性が確保されています。
8. Mistral AIがDevstral2507をリリース:コード中心の言語モデリングのために作られたモデル
Mistral AIはAll Hands AIと提携してDevstral2507シリーズモデルをリリースしました。これは、オープンソースのDevstral Small1.1と企業向けのDevstral Medium2507を含んでいます。これらのモデルはコード推論、プログラム合成、構造化タスクの実行に特化しており、大規模なソフトウェアコードベースでの実際の応用に適しています。Devstral Small1.1はSWE-Benchベンチマークで53.6%のスコアを達成し、Devstral Medium2507は61.6%のスコアを記録し、一部の商用モデルよりも優れた性能を示しています。
【AiBase要約:】
🌟 Devstral2507シリーズにはオープンソースのDevstral Small1.1と企業向けのDevstral Medium2507が含まれており、コード推論と自動化の能力を向上させるために設計されています。
🚀 Devstral Small1.1はSWE-Benchベンチマークで53.6%のスコアを達成し、Devstral Medium2507は61.6%のスコアを記録し、後者は一部の商用モデルよりも優れた性能を示しています。
💼 両モデルはコードエージェントフレームワークと統合可能で、ローカル開発から企業向けサービスまでの多様なシナリオに対応します。
詳細リンク: https://huggingface.co/mistralai/Devstral-Small-2507