【AI日報】へようこそ!ここは、AIの世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットなトピックをご紹介し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、美图、AI動画作成ツール「MOKI」を発表 ワンクリックでAI動画短編が生成可能に

美图公司は、AI動画制作ツール「MOKI」を発表しました。このツールは、ワンクリックでAI動画短編を生成する機能を備えており、AI分野における同社の深い取り組みと革新的な能力を示しています。実際の効果はユーザーの評価を待つ必要がありますが、市場はその可能性に注目しています。

【AiBase要約:】

⭐MOKIは美图公司が発表したAI短編動画制作ツールで、ネット小説短編、絵本、アニメーション短編、MVの4種類の動画形式に対応しています。

⭐MOKIは内蔵の動画生成モデルとワークフローにより、ユーザーがテキストプロンプトを入力するだけで、脚本、キャラクター、動画、音響効果の吹き替えなどを同時に生成できます。

⭐ワンクリックでAI動画短編を生成できる高い制御性を実現しており、7月31日に体験版が公開されます。

公式サイト:https://top.aibase.com/tool/moki

2、スタンフォード大学開発!口パク動画モデルPROTEUSで写真が歌って話す

スタンフォード大学とApparate Labsが共同で開発したAIモデルPROTEUSは、一枚の写真からリアルな仮想人物を生成し、リアルタイムで歌ったり話したりする機能を実現しました。このモデルは、リアルな人物のリアルタイム生成、高フレームレートのビデオストリーム、マルチモーダルインタラクションなどの特徴を持ち、パーソナルな仮想アシスタント、仮想ペット、カスタマーサービスなど、複数の分野で応用できます。PROTEUSのビジョンは、音声で制御可能な視覚的な表現を提供し、ユーザーに自然な仮想人物とのインタラクション体験をもたらすことです。

【AiBase要約:】

👩‍💻 リアルな人物をリアルタイムで生成し、複雑な表情や体の動きを表現します。

🎥 高フレームレートのビデオストリームに対応し、スムーズなインタラクション体験を実現します。

💬 音声、テキスト、画像など、さまざまなデータ形式に対応するマルチモーダルインタラクションです。

詳細リンク:https://apparate.ai/stream.html

3、FontStudio:様々なテクスチャとクールなフォント効果を簡単に作成

FontStudioは、美しいフォント効果を作成し、作品をより面白く、ユニークにするための新しい方法です。拡散モデル技術を使用して、不規則な形状のキャンバス上にフォント効果を生成し、セグメンテーションマスク技術を導入することで形状の一貫性を維持します。ユーザーの嗜好調査によると、FontStudioは多くの人に好まれ、市販のAdobe Fireflyなどの製品よりも優れているとされ、美的魅力を備えています。

image.png

【AiBase要約:】

🎨 美しいフォント効果を作成します。

🔍 拡散モデル技術を使用して不規則な形状のフォント効果を生成します。

🔗 セグメンテーションマスク技術を導入して形状の一貫性を維持します。

製品入口:https://top.aibase.com/tool/fontstudio

4、OpenAIの年間収益が34億ドルに急増 ChatGPTのサブスクリプション版が主な推進力に

OpenAIの最近の年間収益は34億ドルに達し、急速に成長しています。これは主にChatGPTのサブスクリプション版とMicrosoftとの提携によるもので、収益源は多様化しています。最近ではAppleとの提携により、ChatGPTをiPhone、iPad、Macのオペレーティングシステムに統合し、ユーザーエクスペリエンスを向上させています。

【AiBase要約:】

📈 OpenAIの年間収益は34億ドルに達し、急速に成長しています。

💡 主にChatGPTのサブスクリプション版とMicrosoftとの提携によるもので、収益源は多様化しています。

🤝 最近ではAppleとの提携により、ChatGPTをiPhone、iPad、Macのオペレーティングシステムに統合し、ユーザーエクスペリエンスを向上させています。

5、VideoLLaMA 2:動画をアップロードして指示に従ってリアルタイムで動画の内容を認識・解釈

人工知能技術の発展に伴い、VideoLLaMA2プロジェクトが誕生しました。これは、動画の大規模言語モデルの时空モデリングと音声理解能力を推進することを目的としています。このプロジェクトは、ユーザーが動画の内容をよりよく理解し、迅速かつ正確に認識するのに役立ちます。

image.png

【AiBase要約:】

🚢 高度なマルチモーダル言語モデルで、動画の内容理解能力を向上させます。

⏰ 高精度な时空モデリングで、動画内の動作やイベントの順序を認識します。

🔊 優れた音声理解能力で、動画内の音声内容を分析します。

詳細リンク:https://top.aibase.com/tool/videollama-2

6、ロボットが自分で運転できるようになった!東京大学が筋骨格型ヒューマノイドロボットMusashiを開発

Musashiは、自律運転能力を備えた筋骨格型ヒューマノイドロボットであり、自動運転分野の可能性を示しています。旋回速度や加速制御には制限がありますが、そのハードウェア設計とソフトウェアシステムの組み合わせは、将来のインテリジェントな運転体験に新たな視点を提供します。研究成果は論文で発表され、自動運転技術の発展の重要な基礎を築いています。

【AiBase要約:】

🤖 Musashiは筋骨格型ヒューマノイドロボットで、視覚認識と運転操作能力を備えています。

🚗 Musashiは小型電気自動車を運転でき、交通規則を遵守し、信号、歩行者、他の車両を認識します。

🔬 Musashiの動作原理は、人間の筋肉骨格構造を模倣したハードウェア設計と、学習に基づく複数のモジュールを組み合わせたソフトウェアシステムです。

詳細リンク:https://arxiv.org/pdf/2406.05573

7、ロード・オブ・ザ・リング+サイバーパンク2077!ユーザーがAIで制作した映画予告編が100万回再生を突破

この記事に非常に興奮し、驚嘆しました。あるユーザーがAI技術を利用して「Cyberlord of the Chips」という映画の予告編を作成し、「ロード・オブ・ザ・リング」と「サイバーパンク2077」を大胆に融合させ、全く新しいサイバーパンク風のミドルアースの世界観を表現しました。これは、AI技術が画像生成分野で急速に発展していることを示しており、技術の進歩と映画芸術の独自性に関する議論を引き起こしています。

image.png

【AiBase要約:】

🎥 AI技術で制作された映画予告編「Cyberlord of the Chips」は、「ロード・オブ・ザ・リング」と「サイバーパンク2077」の世界観を融合し、大きな注目を集めています。

🌟 Midjourney、Runaway、Elevenlabsなどのツールを使用して、指輪を破壊する旅を致命的なチップを探す冒険に再解釈し、サイバーパンク風のミドルアースの世界観を表現しています。

🔮 予告編の視覚効果は驚くほどで、ミドルアースの古城や広大な大地を、サイバーパンク風の高層ビルやネオンライトに変化させ、映画制作におけるAI技術の可能性を示しています。

8、テスラ株主が、マスク氏によるAI企業xAIへの資源移転を訴追

最近のデラウェア州での訴訟で、テスラ株主は、マスク氏と取締役会が、信託義務に違反して、競合するAI企業xAIに企業資源を移転したと主張しています。マスク氏はテスラをロボットとAIの強国として位置づけようとしており、株価は上昇していますが、株主は彼の行動が不公平であると考えています。株主はまた、マスク氏がNVIDIAのAIチップを移転したという報道にも言及しています。他の機関投資家も、マスク氏がインサイダー情報を用いて数十億ドルを不正に獲得したと主張しています。

【AiBase要約:】

🔍 テスラ株主が、マスク氏と取締役会によるxAIへの資源移転を訴追し、信託義務違反を主張しています。

💡 マスク氏はテスラをロボットとAIの強国として位置づけようとしており、株価は上昇していますが、株主は彼の行動が不公平であると考えています。

💰 株主は、マスク氏がNVIDIAのAIチップを移転したと主張しており、他の機関投資家もインサイダー情報を用いて数十億ドルを不正に獲得したと主張しています。

9、Spotifyが社内クリエイティブ機関を設立、生成AIによる音声広告をテスト

Spotifyは、ブランドがマーケティングキャンペーンをカスタマイズし、生成AI広告をテストするための社内クリエイティブ機関「Creative Lab」を設立しました。同社は、広告主がスクリプトとナレーションを作成するのに役立つ新しいAIツール「Quick Audio」の開発に取り組んでいます。広告主を引きつけ、AI技術を活用することで、Spotifyは広告マーケティングの効果を高めようとしています。

image.png

【AiBase要約:】

✨ Spotifyは社内クリエイティブ機関「Creative Lab」を設立し、ブランドがマーケティングキャンペーンをカスタマイズするのを支援します。

🤖 Spotifyは新しいAIツール「Quick Audio」を発表し、広告主がスクリプトとナレーションを作成するのを支援します。

🔗 ブランドはCreative Labチームと協力して、動画や音声広告を作成し、インタラクティブな広告形式を強化できます。

10、Mozilla Solo AIアップデート:ノーコードAIウェブジェネレーター

Mozillaは、コーディングの知識がなくてもウェブサイトを作成できる新しいAIツール「Solo AI」を発表しました。Solo 1.0バージョンではアニメーション効果が導入され、ウェブサイトの視覚的な魅力が向上し、欧州ユーザー向けのCookie通知バナーが追加されました。最大3つのテキストと画像のバナーセクションに対応し、文字数制限があり、最大30枚のカスタム画像をアップロードできます。Solo AIは、ウェブサイトの作成と公開を容易にし、ビジネスの発展を支援することを約束しています。市場にはすでにユーザーがウェブサイトを作成するのに役立つさまざまなAIツールがありますが、Solo 1.0はノーコードウェブサイト構築の新たな段階を象徴しています。

QQ截图20240614095156.png

【AiBase要約:】

🤖 Solo 1.0バージョンではアニメーション効果が導入され、ウェブサイトの視覚的な魅力が向上しています。

🍪 欧州ユーザー向けのCookie通知バナーが追加され、固定ヘッダーをトップに維持します。

🚀 最大3つのテキストと画像のバナーセクションに対応し、文字数制限があり、最大30枚のカスタム画像をアップロードできます。