【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、テンセント、新しいビデオ制御方法MOFA-Videoをオープンソース化 矢印でビデオの動きを制御可能に
MOFA-Videoは、テンセントが最近オープンソース化したビデオ制御技術で、ビデオアニメーション制作の概念を根本的に変え、創造的な革命を開きました。その多機能性により、ユーザーは矢印を使用してビデオコンテンツの移動方向を制御し、魔法のような体験を実現できます。同時に、MOFA-Videoは顔の表情を新しく生成された顔のビデオに移植し、新しいキャラクターと感情表現を生み出すこともできます。
【AiBase要約:】
🔹矢印でビデオコンテンツの移動方向を制御可能、モーションブラシのような操作性
🔹元のビデオの表情を新しく生成された顔のビデオに移植可能
🔹手動軌跡、人体マーカーシーケンス、音声駆動の顔アニメーションなど、あらゆる複雑なアニメーションシーンに対応可能
プロジェクトページ:https://top.aibase.com/tool/mofa-video
2、AIがeコマースライブコマースに進出!ライブコマース向け大規模言語モデルStreamer-Salesが登場
Streamer-Salesは、ライブコマースに革命的な変化をもたらす、最先端のライブコマース向けAIモデルです。商品コピーを自動生成し、リアルタイムで質問に回答することで、主播のインテリジェントなアシスタントとなります。このモデルは、主播コピーの一括生成、推論加速技術、RAG技術による正確なコピー生成、音声処理機能、デジタルヒューマンビデオ生成、リアルタイム情報検索などの機能を備えています。InternLM2アーキテクチャに基づいており、プロジェクトはオープンソース化されており、モデルのダウンロードリンクとオンライン体験プラットフォームを提供し、ライブコマース業界にインテリジェント化とパーソナライズされた新しい時代をもたらします。

【AiBase要約:】
🚀 Streamer-Salesは、ライブコマース向け最先端のAIモデルで、商品コピーを自動生成し、リアルタイムで質問に回答することで、販売効率を向上させます。
💡 推論加速技術とRAG技術により正確なコピーを生成し、モデルの動作速度とコピーの説得力を高めます。
🎙️ 音声処理、デジタルヒューマンビデオ生成、リアルタイム情報検索に対応し、効率的でインタラクティブで感情豊かなライブコマースソリューションを提供します。
詳細リンク:https://top.aibase.com/tool/streamer-sales
3、日本が人型ロボットAlter3を開発:GPT-4技術を採用、自撮りもマスター
東京大学とAlternative Machine社が共同で研究開発した人型ロボットシステムAlter3は、GPT-4技術を利用して、自然言語命令を直接ロボットの動作にマッピングできます。この研究成果は、基礎モデルとロボットシステムの組み合わせの可能性を示しており、まだ商業化されていませんが、ロボット研究の発展を促進しています。Alter3は、日常動作や模倣動作などの様々なテストで、強力な行動計画と実行能力を示しました。

【AiBase要約:】
💡 Alter3は、GPT-4技術を使用して推論を行う最新の人型ロボットで、自然言語命令を直接ロボットの動作にマッピングできます。
💡 研究者らはGPT-4技術のコンテキスト学習能力を利用して、ロボットが必要な動作手順を実行できるようにしました。
💡 ヒューマンフィードバックとメモリを追加することでAlter3の性能を向上させ、研究者らはロボットで恥や喜びなどの感情表現を模倣することに成功しました。
4、EvTexture:AIを使ってぼやけたビデオをワンクリックで高画質化
EvTexture技術は、高周波の動的詳細を捉えることで、ビデオのテクスチャ品質を飛躍的に向上させ、各フレームの画像をより鮮明でリアルなものにします。この技術はビデオ品質を向上させるだけでなく、視覚芸術に革命的な変化をもたらします。
【AiBase要約:】
👀 EvTexture技術は、高周波の動的詳細を捉えることで、ぼやけたビデオをより鮮明でリアルにします。
📷 EvTextureは、イベントカメラが記録した微妙な変化を利用し、葉や衣服の縞模様などの複雑なディテール処理に優れています。
⏰ EVTexture技術はより多くのディテール処理を導入していますが、ビデオ処理に必要な時間を大幅に増加させるわけではありません。
プロジェクトページ:https://top.aibase.com/tool/evtexture
5、Synthesiaが新しい2.0版を発表、インタラクティブなAIビデオと全身アバターを提供
Synthesiaは新しい2.0版を発表し、インタラクティブなビデオと全身アバターを導入し、企業がビデオ中心のコミュニケーションイニシアチブを迅速に実施するための包括的なスイートを提供します。新機能にはAIスクリーンレコーディングツールが含まれており、企業が操作ガイドの作成プロセスを簡素化します。更新されたアバターはより多くのボディランゲージを備えており、デジタルキャラクターのストーリーテリング能力を強化します。

【AiBase要約:】
⭐ Synthesiaが新しい2.0版を発表、インタラクティブなビデオと全身アバターを導入。
⭐ 更新されたアバターはより多くのボディランゲージを備え、デジタルキャラクターのストーリーテリング能力を強化。
⭐ 新しいインタラクティブなビデオ体験により、ユーザーはインタラクティブなビデオコンテンツを作成でき、AIスクリーンレコーディングツールの提供も開始。
詳細リンク:https://top.aibase.com/tool/synthesia
6、レコード会社がAI音楽生成会社SunoとUdioを著作権侵害で提訴
この記事では、複数の有名レコード会社が2つのAIスタートアップ企業を共同で提訴し、許可なく著作権で保護された音楽を使用して音楽生成モデルをトレーニングし、商業作品の著作権を侵害したと主張している事件について報じています。レコード会社は、被告に侵害を認め、AIサービスを停止し、高額な賠償金を支払うよう求めています。AI音楽生成会社は、その技術が変革的であり、模倣するためのものではないと主張していますが、レコード会社は著作権で保護された音楽を使用していると主張しており、法的紛争を引き起こしています。

【AiBase要約:】
⭐ レコード会社がAI音楽生成会社SunoとUdioを共同で提訴し、著作権で保護された音楽を使用してトレーニングを行い、商業作品の著作権を侵害したと主張。
⭐ レコード会社は、被告に侵害を認め、AIサービスを停止し、侵害作品1件につき15万ドルの賠償金を支払うよう求めている。
⭐ AI音楽生成会社は、その技術が変革的であり、模倣するためのものではないと主張していますが、レコード会社は著作権で保護された音楽を使用していると主張しており、法的紛争を引き起こしています。
7、ひどい!Metaが実際の写真を誤って「AI生成」とタグ付け
この記事では、多くの写真家がMetaが実際の写真を誤って「Made with AI」とタグ付けしたと不満を述べていることについて報告しています。この事件は、画像認識におけるAI技術の限界と誤判定の問題を浮き彫りにし、写真界でタグの正確性に関する議論を引き起こしています。

【AiBase要約:】
📸 写真家がMetaの誤ったタグ付けに遭遇
🖼 編集ツールで作成された写真が影響を受ける
🤖 Metaが生成AIツールを使用して誤ったタグ付けを行う
8、科学者もChatGPTに依存し始めている
この記事は、学術論文執筆におけるChatGPTなどのAIツールへの依存度とその影響、課題について明らかにしています。学術界は、大規模言語モデル(LLM)の使用において一定の進歩を遂げていますが、情報の正確性やバイアスの強化などの問題にも直面しています。LLMの使用を規制する明確な政策を策定し、学術論文の真実性と公正性を確保する必要があります。
【AiBase要約:】
⚙️ 学術論文執筆におけるChatGPTの普及率が徐々に増加しており、少なくとも10%の論文でLLMが使用されている
📊 LLMの使用には分野や国による違いがあり、コンピュータサイエンスとバイオインフォマティクス分野での使用率が最も高い
⚖️ 学術界は、LLMの使用を規制する明確な政策を策定し、科学研究の高品質と信頼性を確保する必要があります
9、マスク氏のxAI、NVIDIA、デルと協力してAIスーパーコンピュータを構築
イーロン・マスク氏の人工知能スタートアップ企業xAIは、デル、NVIDIA、Supermicroと協力して、世界最大のスーパーコンピュータになると言われているものを構築すると発表しました。このプロジェクトは、スタートアップ企業に大量の計算リソースを提供し、クラウドサービスへの依存を減らすことを目的としています。
【AiBase要約:】
⭐ xAIは、デル、NVIDIA、Supermicroと協力して、世界最大のスーパーコンピュータと言われるものを構築し、スタートアップ企業に大量の計算リソースを提供してトレーニングを支援します。
⭐ デルのAIファクトリーコンセプトは、液体冷却サーバーとNVIDIAの新しいBlackwell GPUを利用して、高強度のAIワークロードをサポートし、スーパーコンピュータのインフラストラクチャの一部となります。
⭐ xAIはNVIDIAから約30万台の新しいBlackwell B200を購入する計画で、60億ドルの資金調達を行い、評価額は240億ドルに達しています。また、テスラ用に確保されているNVIDIAチップの出荷も受けています。
10、姚班の天才チームによる新たな傑作!サボりゲー『大規模言語モデルを壊してみた』がひっそりと登場
忙しい仕事の日々の中で、リラックスできる方法を見つけることが多くの人々の新しい選択肢となっています。『大規模言語モデルを壊してみた』は、仕事中にこっそり休憩したい人向けに作られたゲームで、曠視科技の研究総責任者である范浩強氏が率いて開発されました。このゲームは、マルチモーダルとマルチエージェントなどの技術をサポートしており、多様なゲームプレイを提供し、プレイヤーは挑戦の中でリラックスできます。

【AiBase要約:】
⭐ 『大規模言語モデルを壊してみた』は、仕事中に休憩したい人向けに作られたリラックスゲームです。
⭐ 曠視科技の研究総責任者である范浩強氏が率いて開発され、野猫子工作室と階躍星辰の強力なサポートを受けています。
⭐ マルチモーダルとマルチエージェントなどの技術をサポートしており、実績リスト、ランキング、AI評価などの機能が追加され、プレイヤー体験が向上しています。
11、OpenAIがリモートコラボレーションプラットフォームMultiを買収
OpenAIは最近、リモートコラボレーションプラットフォームMultiの買収を含む一連の買収を行いました。この買収により、OpenAIはエンタープライズソリューション分野における地位をさらに強化し、ビデオコラボレーション分野における人工知能技術の適用を加速させます。
【AiBase要約:】
📈 OpenAIが買収を行い、リモートコラボレーションプラットフォームMultiを買収し、エンタープライズソリューションの能力を強化。
📹 Multiは、最大10人が同時に画面共有を行い、カスタムショートカットなどをサポートするビデオチャットコラボレーションプラットフォームを提供しています。
🤝 MultiチームはOpenAIに加わり、ビデオコラボレーション分野における人工知能技術の発展を加速させます。
詳細リンク:https://top.aibase.com/tool/multi
12、アップル、MetaのAIモデルをiPhoneに統合する計画を断念
プライバシー保護の擁護者であるアップルは、Metaと協力してそのAIモデルをiPhoneに統合する計画を断念することを決定しました。この行動は、アップルがユーザーのプライバシーを重視し、堅持していることを示しています。
【AiBase要約:】
🔍 アップルは、MetaとのAIモデル統合計画を断念し、プライバシーへの配慮と堅持を示しました。
📱 アップルは独自のAI機能スイートをリリースし、OpenAIと協力してiPhoneでChatGPTを呼び出します。
🌐 Metaは、デバイスへの直接統合ではなく、アプリケーションを通じてAIモデルを推進します。
