【AI日報】へようこそ!ここは、人工知能の世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、Luma AIが驚異的なテキストから動画生成モデル「Dream Machine」を発表 Soraに匹敵するクオリティ

Luma AIが最新発表したテキストから動画を生成するモデル「Dream Machine」は無料で利用可能で、高品質な動画を生成できます。OpenAIのSoraに匹敵する品質を誇り、物理シミュレーションにも対応することで、動画のリアルさと一貫性を確保しています。生成効率の影響でユーザーエクスペリエンスが制限される可能性がありますが、提供されているサンプルで動画の効果を確認できます。国内の競合他社である快手(Kuaishou)の「可灵」も競争の中で頭角を現しており、テキストから動画を生成する分野の競争が激化することを示唆しています。

【AiBase要約:】

👉 Dream Machineはテキストと画像を入力して動画を生成できます。

👉 重力による落下、衝突、光の変化などの物理シミュレーションに対応しています。

👉 Dream Machineは無料で利用でき、生成される動画は、OpenAIのSoraに匹敵する品質、動作の一貫性、色彩、光と影、彩度、カメラワークなどを備えています。

その他の動画はこちら:https://mp.weixin.qq.com/s/DreeYriR9MdvdvvRQ7ZkAw

無料体験はこちら:https://top.aibase.com/tool/dream-machine

2、Stable Diffusion 3が正式にオープンソース化:超強力なテキストから画像生成モデルSD3-Mが登場

SD3-Mは強力なテキストから画像を生成するモデルで、20億個のパラメータを持ち、推論速度が速く、生成効果も優れています。Stability AIはSD3-Mの重みをオープンソース化し、ユーザーに無料トライアルの機会を提供しています。MMDiTアーキテクチャを採用し、画像品質、レイアウト、テキストプロンプトの理解などで顕著な改善が見られます。ユーザーはオンラインデモでSD3-Mの生成効果を体験できますが、現時点では学術研究のみに限定され、商業利用にはStability AIへの連絡が必要です。SD3-Mのオープンソース化は、ユーザーがテキストから画像を生成するモデルの応用可能性を探求する機会をもたらします。

image.png

【AiBase要約:】

⚙️ SD3-Mは20億個のパラメータを持ち、生成速度が速く、ハードウェア要件が低く、パフォーマンスは最大50%向上します。

🌟 SD3-Mは10億枚の画像で事前学習され、3000万枚の画像で微調整され、驚くほど素晴らしい生成効果を実現しています。

🔓 SD3-Mはオープンソースで無料トライアルできますが、現時点では学術研究のみに限定され、商業利用にはStability AIへの連絡が必要です。

詳細はこちら:https://top.aibase.com/tool/stable-diffusion-3-mediumSD3-M

3、Sunoが音声入力機能を正式発表 どんな音でも楽曲制作が可能に

Sunoは最近、ユーザーがどんな音からでも楽曲を制作できるエキサイティングな新機能を発表しました。この革新的な機能は、プロ版とプレミアム版のユーザー向けに提供され、音楽制作に新たな可能性をもたらし、AI技術が芸術創作分野における応用可能性を示しています。ユーザーはどこでもいつでもインスピレーションを捉え、日常生活の音を美しい音楽作品に変換できます。

【AiBase要約:】

🎶 音声入力機能はプロ版とプレミアム版のユーザー向けに提供され、様々な音を音楽作品に変換できます。

🔒 ユーザー権限は制限されており、プロ版とプレミアム版のユーザーのみが使用できます。

📻 Sunoはラジオ機能も発表しており、パーソナライズされたプレイリストを提供し、ユーザーは無限の音楽ストリームを楽しむことができます。

詳細はこちら:https://top.aibase.com/tool/suno-ai

4、MimicBrush:画像参照をアップロードし、元の画像の一部スタイルを再描画

MimicBrushは香港大学の研究チームが提案したゼロショット画像編集技術で、自己教師あり学習により画像編集を実現し、ユーザーが編集効果を正確に記述する必要がありません。その革新的な点は、参照画像を自動的に理解することで、編集の精度と効率を向上させる点にあります。

image.png

【AiBase要約:】

🎨 ゼロショット画像編集により、ユーザー操作が簡素化され、編集効果を記述する必要がありません。

🔍 MimicBrushモデルは自己教師あり学習により画像のセマンティック対応関係を捉え、編集効果の精度を向上させます。

🚀 実験結果から、MimicBrush技術は様々なテストケースで優れた性能を示し、編集効率が向上することが示されています。

詳細はこちら:https://top.aibase.com/tool/mimicbrush

5、TikTokのインフルエンサーがAIペイントで各地のグルメをモンスターに変身 6本の動画で再生回数1700万回

この記事では、TikTokのインフルエンサー「一条咸鱼微」がAIペイント技術を用いて、各地の伝統的なグルメをモンスターに変身させた独創的な作品を紹介し、大きな注目を集めています。生きたようなモンスターの姿を通して、インフルエンサーは中国各地の独特なグルメ文化を紹介し、巧みにインターネットミームを用いてユーモラスな要素を加えることで、地域文化への理解を深めています。作品は非常に独創的で、印象に残ります。

image.png

【AiBase要約:】

🎨 独創的な変身:各地のグルメが巧みにモンスターに変身し、生き生きとしていて面白い。

😄 ユーモラスな要素:インターネットミームを用いてユーモアを加え、思わず笑みがこぼれる。

🌏 地域文化:地域グルメの特徴を紹介し、中国各地の文化の魅力と多様性を体感できる。

6、人間がAIに勝利!人工知能画像コンテストで実写写真が3位に

この記事では、人工知能で生成されたものと偽装された写真がアート写真コンテストで3位を獲得した出来事を紹介し、人工知能と人間の芸術の境界線について人々の考えを促しています。写真家Miles Astrayの作品「FLAMINGONE」はフラミンゴの写真ですが、人工知能で制作されたように見えますが、実際は実写作品です。この記事では、人工知能が芸術創作における限界と、人間の創作の独特な価値を強調しています。

【AiBase要約:】

🤖 人工知能と人間の芸術の境界線:実写写真が人工知能で生成された作品と間違われた。

📷 写真家Miles Astrayの作品「FLAMINGONE」が大きな注目を集める。

🎨 人工知能アートの限界:人間の芸術作品に見られる感情や意図が欠けている。

7、900万人がハリー・ポッターのラップを視聴 ネットユーザー:「AIによるヒップホップ番組の視聴開始」

この記事では、ハリー・ポッターがヒップホップ歌手に変身した動画がインターネットで大きな話題になっている様子を紹介しています。動画では、ハリー・ポッターとハグリッドが全く新しい姿で登場し、活気に満ちたパフォーマンスを披露し、多くの視聴者の注目を集めています。作者はAI技術と芸術、エンターテインメントを融合させ、独創的で楽しい動画を制作し、新たな可能性を示しています。

【AiBase要約:】

🔥 動画ではハリー・ポッターとハグリッドがヒップホップ歌手として登場し、大きな注目を集めている。

💡 作者はAI技術を用いて音声を変更し、活気に満ちたラップパフォーマンスを制作した。

😂 動画のミクスチャーなスタイルはネットユーザーを爆笑させ、異分野コラボレーションと芸術表現の可能性を示している。

8、UizardがAIデザインエンジン「Autodesigner 2.0」を発表

Uizard社は、独自のモデル、Anthropic AIとOpenAIの技術、そしてStability AIの画像生成技術を組み合わせた、新しいAIデザインエンジン「Autodesigner 2.0」を発表しました。UIデザインのプロセスを簡素化し、デザイン効率と革新性を高めています。

image.png

【AiBase要約:】

🌟 テキストプロンプトによるデザイン生成:ユーザーはシンプルなテキストプロンプトで完全なUIデザインを生成でき、様々なアプリケーションシナリオに対応できます。

💬 会話型インターフェース:会話型インターフェースが導入され、ユーザーはデザインアシスタントとインタラクトしてデザインを生成したり、要素を追加したり、コンポーネントを変更したりできます。

🔄 リアルタイムデザインと反復:ユーザーはAIが生成したデザインをリアルタイムで確認し、編集し、デザインのニーズを迅速に満たすために反復処理できます。

詳細はこちら:https://top.aibase.com/tool/uizard

9、Andrew NgがAIエージェント機械翻訳プロジェクト「Translation Agent」をオープンソース化

Andrew Ngが最新でオープンソース化したAIエージェント機械翻訳プロジェクト「Translation Agent」は、反射型エージェントワークフローとLLM技術を利用して、高度にカスタマイズされた翻訳サービスを提供し、ユーザーは柔軟にトーン、地域特性、専門用語集を指定して翻訳できます。このプロジェクトのカスタマイズ性と柔軟性は、AIエージェントが機械翻訳分野で広く活用されることを促進します。

【AiBase要約:】

🤖 反射型エージェントワークフローを提供し、LLM技術を使用して翻訳を行い、反省し、改善策を提案することで翻訳の質を向上させます。

🔧 カスタマイズ性が高く、ユーザーは出力スタイルを変更したり、特殊な用語を処理したり、特定の地域や方言の言語使用を指定したりできます。

🌍 さまざまな言語ペアの翻訳に適用でき、プロンプトを調整し、さまざまなLLMを選択することで、より高品質な翻訳を実現できます。

10、サムスン、AIチップの提供を加速化へ

サムスン電子は、メモリチップ、ファウンドリ、チップパッケージングサービスを統合することでAIチップの生産を加速化し、2028年までにAIチップの需要が主要な成長ドライバーになると予測しています。2ナノメートルチップ製造技術を発表し、第2世代3ナノメートルチップの量産計画を発表しており、技術的な優位性を示しています。

【AiBase要約:】

🚀 サムスンはメモリチップ、ファウンドリ、チップパッケージングサービスを統合することで、AIチップの生産時間を約20%短縮します。

💡 2028年までに、世界のチップ業界の収益は7780億ドルに増加すると予想され、AIチップの需要が主要な成長ドライバーになります。

🔬 サムスンは2ナノメートルチップ製造技術を発表し、第2世代3ナノメートルチップの量産計画を発表しており、技術的な優位性を示しています。