【AI日報】へようこそ!ここは、人工知能の世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットな話題を、開発者に焦点を当ててお届けします。技術トレンドの洞察、革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、GPT-4oに対抗!オープンソース大規模言語モデルMoshiが衝撃デビュー

Moshiは、音声認識と音声生成機能を備えたマルチモーダル大規模言語モデルです。将来的には、画像認識機能も搭載される可能性があります。Kyutaiラボが発表したMoshiは、AI技術への大胆な挑戦であり、オープンソース精神を示しています。ユーザーエクスペリエンスの面では、応答速度が速く、使いやすさが特徴です。ただし、言語サポートは改善の余地があります。Moshiの人間らしい会話トーンは、自然でスムーズな対話を可能にします。今後のアップデートでは、回答の正確性が向上する予定です。教育業界への影響も大きく、生徒への反復学習に役立つでしょう。より多くの類似製品が登場し、より多くの言語をサポートすることで、AI技術が人々の生活により身近なものになることを期待しています。

【AiBase要約:】

💡マルチモーダル機能:Moshiは音声による質問を理解し、リアルタイムで推論に基づいた回答を返します。音声モードは既に公開されており、GPT-4oの秋リリースよりも遥かに早いです。

💡地域制限なし:場所を問わずMoshiを使用できます。

💡モバイル対応:標準中国語のサポートはあまり良くありませんが、英語での質問には問題なく対応できます。

💡近日オープンソース化:KyutaiはMoshiを近日中にオープンソース化する予定で、コード、モデルウェイト、論文を公開する予定です。

詳細リンク:https://top.aibase.com/tool/moshi-chatMoshi

2、Google Pixel 9の新機能が公開:AI搭載、Microsoft Recallのようなスマート体験が間近に!

Google Pixel 9シリーズは、Add Me、Studio、Pixel Screenshotsなど、驚きのAI新機能を数多く搭載して発売予定です。これらの機能は、ユーザーの撮影体験を向上させ、創造的な表現を促し、プライバシー保護にも配慮した設計となっており、GoogleのAI技術に対する深い理解と革新的な応用を示しています。Pixel 9シリーズがデジタルライフにもたらす可能性に期待が高まります。

【AiBase要約:】

✨ Add Me機能:誰にとっても最高の表情を捉え、異なる写真の人物の表情を融合させ、全員が最高の状態で写るようにします。

🎨 Studio機能:スクリーンショットエディターアプリに統合され、ユーザーがステッカーを作成・再混合し、無限の創造性を解き放ちます。

🔒 Pixel Screenshots機能:プライバシー保護ソリューションを提供し、ユーザーが手動でスクリーンショットを撮影する場合のみ動作し、ローカルAI処理によりユーザーのプライバシーを安全に保護します。

3、AI検索Perplexity AIがPro Searchを発表:問題解決とコード実行能力の向上

Perplexityは最近、Pro Searchサービスの大幅なアップグレードを発表しました。新しいPro Searchは、より複雑なクエリを処理できるだけでなく、複数ステップの推論能力も備えており、ユーザーにより深く包括的な調査サポートを提供します。このアップグレードは、AIが情報検索と問題解決分野における巨大な可能性を示しており、将来のスマート調査ツールのための新しい基準を確立しています。

image.png

【AiBase要約:】

🔍 複雑なクエリ処理能力の向上:新しいPro Searchは高度な数学計算やプログラミング計算を実行し、より包括的な調査結果を提供します。

🧠 複数ステップ推論機能:Pro Searchは現在、複数ステップの推論を行い、段階的に目標を達成し、発見に基づいてスマートな行動を取ることができます。

🔢 向上した数学とプログラミング能力:Wolfram|Alphaエンジンを統合することで、Pro Searchは複雑な数学問題を解決する際の正確性と速度が大幅に向上しました。

4、CloudflareがAIボットによるウェブスクレイピングを一発で阻止する新手法を発表

Cloudflareは最近、AIボットがウェブサイトコンテンツをスクレイピングし、許可なくデータを機械学習モデルのトレーニングに使用することを阻止する新しい方法を発表しました。この取り組みは、インターネット上のコンテンツ制作者の安全を守ることを目的としています。

【AiBase要約:】

⭐️ Cloudflareは、AIボットによるウェブスクレイピングを一発で阻止する機能を発表し、ウェブサイトコンテンツが許可されていないAIボットによって使用されないようにします。

⭐️ 生成AIが盗難の温床と見なされており、多くの企業がAIボットによる無許可のコンテンツ使用を阻止するための対策を講じています。

⭐️ Cloudflareは、機械学習モデルを使用して偽装されたウェブスクレイピングボットを識別・阻止し、インターネット上のコンテンツ制作者の権利を保護します。

5、ElevenLabsがノイズ除去ツールVOICE ISOLATORを発表

ElevenLabsが発表したVOICE ISOLATORは、オーディオ愛好家にとって朗報となる新製品です。背景ノイズを除去し、クリアな会話を抽出することで、よりプロフェッショナルなオーディオ制作を可能にします。「Extract vocals」機能やサウンドエフェクト生成機能など、多くの機能を備え、オーディオ制作の効率と創造性を大幅に向上させます。ElevenLabsは、継続的なイノベーションを通じて、ユーザーに新たなオーディオ制作の可能性を提供しています。

【AiBase要約:】

🎵 背景ノイズを除去し、クリアな会話を抽出することで、よりプロフェッショナルなオーディオ制作を可能にします。

🔊 「Extract vocals」機能により、ボーカルを強調し、不要な背景ノイズを除去します。

🎶 サウンドエフェクト生成機能により、ユーザーは時間をかけてサウンドエフェクトを探す必要がなくなり、より多くの創造的な空間を提供します。

詳細リンク:https://elevenlabs.io/voice-isolator

6、商湯科技が制御可能な人物ビデオ生成アルゴリズムモデルVimiを発表

商湯科技は、画期的なVimi制御可能人物ビデオ生成大規模モデルを発表し、AI技術が複雑なシーンに高度に適応できること、そして商湯科技がビデオ生成技術において深い蓄積を持っていることを示しました。Vimiは卓越した制御性を持ち、従来技術を凌駕し、人物の表情や動作を正確に制御できます。同時に、細部まで精巧に処理され、没入型の視覚体験をサポートし、高品質なビデオを安定して生成します。

微信截图_20240704103219.png

【AiBase要約:】

✨ Vimiは前例のないビデオ生成の柔軟性を達成し、多様な入力を受け入れ、人物の生成目標動作と一致するビデオを正確に制御できます。

🌟 Vimiは従来の画像表情制御技術の限界を突破し、繊細な表情と動作の制御を実現し、論理的で生き生きとした自然なビデオコンテンツを生成します。

💡 Vimiは1分間の高品質ビデオを安定して生成し、画面品質を常に維持し、卓越した能力と一貫性を示しています。

詳細リンク:https://www.wjx.cn/vm/mhSxfGv.aspx

7、AIもダンスが大好き?MimicMotionが新技術を発表 どんな動きでも任意の長さの動画を生成可能に

MimicMotionが発表した新技術「Confidence-aware Pose Guidanceを用いた高品質な人体モーションビデオ生成」は、業界に衝撃を与えました。この技術は、信頼度感知姿勢誘導を用いて高品質な人体運動ビデオを生成し、ビデオ品質を向上させます。手部精緻化メカニズムによりディテールが強化され、任意の長さのビデオを柔軟に生成でき、幅広い用途と明るい将来性があり、ビデオ制作やモーションキャプチャ分野で重要な役割を果たすでしょう。

【AiBase要約:】

🌟 信頼度感知姿勢誘導を用いて高品質な人体運動ビデオを生成します。

🔍 手動精緻化メカニズムはディテールに焦点を当て、特に手の訓練を強化します。

🎥 任意の長さのビデオを柔軟に生成し、幅広い用途があります。

詳細リンク:https://top.aibase.com/tool/mimicmotion

8、ChatGPT Macクライアントに会話が平文で保存されるセキュリティ問題

OpenAIが最近リリースしたChatGPT Macクライアントには、セキュリティ上の脆弱性があり、会話が平文でコンピューターに保存されるため、悪意のある攻撃者によってアクセスされる可能性があります。同社は、セキュリティを強化するために、会話記録を暗号化するアップデートをリリースしました。

image.png

【AiBase要約:】

🔒 会話がプレーンテキスト形式でコンピューターに保存されており、セキュリティリスクがあります。

🚫 悪意のある行為者やアプリケーションが、ChatGPTの会話とその中のデータに簡単にアクセスできます。

🔑 OpenAIはアップデートをリリースし、チャットログを暗号化してセキュリティを向上させました。

9、Googleの新施策:AIで生成された政治広告の情報開示

Googleは、広告主が政治広告にAI生成コンテンツが含まれているかどうかを開示する手順を簡素化する新しい施策を実施しています。「修正または合成されたコンテンツ」チェックボックスを選択すると、Googleが自動的に開示情報を生成し、広告の透明性と信頼性を高めます。

【AiBase要約:】

✨ Googleは、広告主が政治広告にAI生成コンテンツが含まれているかどうかを開示する手順を簡素化し、広告の透明性を高めます。

🔍 広告主が「修正または合成されたコンテンツ」チェックボックスを選択すると、システムが自動的に開示情報を生成し、広告主の負担を軽減します。

💡 開示情報は、モバイルデバイスのフィード、YouTube Shorts、ストリーミング広告に表示されます。その他の形式の広告については、広告主が開示情報を提供する必要があります。

10、頑固か、それとも信念か?任天堂が生成AIのゲーム内使用に反対

任天堂の古川俊太郎社長は、ゲームにおける生成AIの使用について、知的財産権侵害の懸念を表明し、独自性の維持を強調しました。任天堂は十分な創造性と経験を持っており、生成AIツールに頼る必要はないと考えています。生成AIで作成されたコンテンツは個性に欠けており、任天堂が重視する独創性と創造性とは一致しません。今後、任天堂は生成AIの使用を慎重に検討し、社内の創造性と経験に頼っていくでしょう。

【AiBase要約:】

⭐ 任天堂はゲーム内での生成AIの使用に反対し、知的財産権侵害を懸念しています。

⭐ 古川社長は、任天堂には独自のゲーム体験を生み出すための十分な創造性と経験があると強調しています。

⭐ 生成AIで作成されたコンテンツは個性に欠けており、任天堂は独創性と創造性を重視しています。