【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用を理解するお手伝いをいたします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1.Google DeepMindがGenie2を発表、ワンクリックで無限の仮想世界を生成
Google DeepMindが最近発表したGenie2モデルは、自然言語による指示で多様かつ論理的に一貫した仮想世界をリアルタイムで生成し、強力なAIトレーニングとインタラクションの可能性を示しています。Genie2は複雑な3D環境を作成できるだけでなく、ユーザーとの長時間のインタラクションもサポートし、AIトレーニングのシナリオを大幅に豊かにします。
【AiBase要約:】
🌍 Genie2は自然言語による指示で、複雑な3D環境を含む多様な仮想世界をリアルタイムで生成できます。
🤖 このモデルは、ユーザーとAIエージェントが1分間にわたってインタラクションすることをサポートし、AIトレーニングのシナリオを大幅に豊かにします。
📸 単一の画像プロンプトから出発して、Genie2は完全なインタラクティブな世界を迅速に構築でき、実写写真を使用して仮想シーンを生成することもできます。
詳細リンク:https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/
2.驚きの音声合成!Fish AudioがFish Speech1.5を発表、5つの言語を追加、リアルタイムシームレス会話機能も搭載予定
Fish Audioが最近発表したFish Speech1.5音声合成モデルは、複数の点で著しい進歩を遂げました。5つの新しい言語をサポートするだけでなく、リアルタイムシームレス会話機能も備えており、ユーザーはより簡単にインタラクションできます。このモデルは100万時間以上の多言語トレーニングを経ており、高品質の音声合成出力を生成でき、匿名のTTS-Arenaで2位を獲得しています。
【AiBase要約:】
🎤 ゼロショットおよび少ショット音声合成:わずか10~30秒の音声サンプルで高品質の音声を生成できます。
🌍 多言語サポート:英語、日本語、韓国語、中国語など、複数の言語をサポートし、言語の壁を打ち破ります。
⚡ 高精度と高速性:高性能ハードウェアでリアルタイムの音声合成を実現し、エラー率はわずか2%です。
詳細リンク:https://fish.audio/zh-CN/
3.AppleとBaiduの協業か?中国版iPhoneに文心4.0モデル搭載の可能性
AppleとBaiduが協業し、BaiduのAI大規模言語モデルErnie4.0を中国版iPhoneに統合することで、ユーザーのAI体験を向上させる計画です。適合プロセスでいくつかの課題に直面していますが、Appleはまだ必要なテストと調整を行う時間があり、Apple Intelligenceの予定通りのリリースを確保できます。
【AiBase要約:】
🤖 AppleとBaiduが協業し、AI大規模言語モデルErnie4.0を中国版iPhoneに統合します。
📈 Appleは使用料を支払い、iPhoneユーザーのAI体験向上を目指しています。
📱 iPhone16シリーズはAI機能の面で遅れを取っており、市場への適応を加速させる必要があります。
4.バイトダンスのAIアシスタント「豆包」、指定文字付き画像のワンクリック生成に対応
バイトダンス傘下のスマートAIアシスタント「豆包」は最近、テキスト生成画像機能を大幅にアップグレードしました。ユーザーはワンクリック操作で、指定テキストを含む画像を生成できるようになりました。この新機能は、「豆包」大規模言語モデルチームの努力によるもので、大規模言語モデルとデジタル画像技術を統合し、中国語データの学習能力を最適化し、漢字生成能力を強化しました。
【AiBase要約:】
🆕 新機能により、ユーザーは指定テキスト付き画像をワンクリックで生成でき、操作性が向上しました。
🔍 「豆包」は大規模言語モデルとデジタル画像技術を統合することで、中国語の学習と漢字生成能力を最適化しました。
🚀 このアップグレードは、「豆包」がAI技術応用分野における深い探求を示しており、今後のさらなる発展が期待されます。
5.百度:文心一言、中国の生成AI製品におけるネットユーザー利用率で第1位
2024年6月現在、中国の生成AIユーザー数は2億3000万人に達し、「文心一言」は11.5%の利用率で第1位となりました。「文心」大規模言語モデルの1日あたりの呼び出し回数は15億回に達し、処理トークン数は1兆7000億を超え、技術と応用における急速な発展を示しています。会話型製品は市場シェアの62%を占め、「文库」AI機能の使用回数は28億回を超え、インテリジェントプラットフォームは多くの企業や開発者を魅了しています。
【AiBase要約:】
📈 ユーザー規模:2024年6月現在、中国の生成AI製品ユーザー数は2億3000万人に達し、総人口の16.4%を占めています。
💡 文心一言:百度の「文心一言」は、中国のネットユーザー利用率で11.5%のシェアで第1位となり、1日あたりの呼び出し回数は15億回に達しています。
🛠️ 幅広い用途:会話型製品は市場シェアの62%を占め、「文库」AI機能の使用回数は28億回を超え、インテリジェントプラットフォームは15万社の企業を引き付けています。
6.ChatGPTの週間アクティブユーザー数が3億人を突破
OpenAIのCEOであるサム・アルトマンは、『ニューヨーク・タイムズ』のDealBookサミットで、ChatGPTの週間アクティブユーザー数が3億人を突破したと発表し、その強力な市場の魅力とユーザーの依存性を示しました。2022年のリリース以来、ChatGPTのユーザー数は爆発的に増加しており、現在では1日に10億件以上のメッセージが送信されています。
【AiBase要約:】
🌟 ChatGPTの週間アクティブユーザー数が3億人を突破し、強力な市場の魅力を示しています。
📈 1日に10億件以上のメッセージがChatGPTを通じて送信されており、ユーザーの依存性が高まっています。
🛠 OpenAIは、AI検索エンジンや新しいインターフェースなど、新しい機能を継続的に導入してユーザーエクスペリエンスを向上させています。
7.OpenAIが「12日間のライブイベント」を発表、新技術が公開されるもGPT-5は未発表
OpenAIは最近、Xプラットフォームで、新技術と革新的なプロジェクトを紹介する12日間のライブイベントを開始すると発表しました。GPT-5に関する議論は依然として活発ですが、OpenAIは、その後継モデルは今年中に発表されないことを明確にしています。CEOのサム・アルトマンは、Orionモデルに関する噂を否定し、さらに多くの技術革新を発表することを約束しました。
【AiBase要約:】
🔍 OpenAIは明日から12日間のライブイベントを開始し、新技術と革新的なプロジェクトを紹介します。
🚫 OpenAIはGPT-5が今年中に発表されないことを明確にし、CEOはOrionモデルに関する報道は虚偽であると述べています。
📊 O1モデルは約20万トークンの処理をサポートし、画像分析機能も備えています。Soraビデオモデルも期待されています。
8.AppleのCEOティム・クック氏、AppleのAI課金は検討したことがない:AIは基本機能
AppleのCEOであるティム・クック氏は最近のインタビューで、AppleがAI機能の課金を検討したことがないと明確に述べました。彼は、AIはスマートデバイスの基本機能であり、マルチタッチと同様に不可欠な部分であると強調しました。この発言は、AppleのAIサービスが有料になる可能性に関する憶測を効果的に鎮めました。
【AiBase要約:】
💡 クック氏は、AppleはAI機能を課金しないと述べ、AIは基本機能であると考えています。
📈 Appleの戦略の中心はハードウェアからサービスに移行していますが、AIサービスは無料です。
🗣️ クック氏は退職問題に関心を示し、Appleとの緊密な関係を強調しています。
9.マスク氏、Colossus AIスーパーコンピューターを10倍に拡張する計画
イーロン・マスク氏の人工知能企業xAIは最近、Colossus AIスーパーコンピューターの能力を10倍に拡張するという野心的な計画を発表しました。この拡張はテネシー州メンフィスに設置され、100万個以上のGPUを統合して、増大する計算需要に対応します。
【AiBase要約:】
🌟 イーロン・マスク氏は、Colossus AIスーパーコンピューターを10倍に拡張する計画で、100万個以上のGPUを統合する予定です。
💼 この拡張は、メンフィス地域に新たな雇用機会を生み出し、地域経済の発展を促進します。
🚀 xAIは、計算能力を強化することで市場競争力を高め、人工知能技術の革新を推進することを目指しています。
10.朱嘯虎氏、月之暗面と循環智能の株主決議に関する仲裁問題への対応
朱嘯虎氏は、月之暗面の創業者と循環智能の間の仲裁事件について対応を行い、このプロジェクトは循環智能内部で開発されたものであり、正式な株主決議を得ていないと強調しました。この事件は、株主決議の遅延と利益相反の複雑さを明らかにし、中国のスタートアップ企業が分割プロセスにおける法的および倫理的な責任を示しています。
【AiBase要約:】
📈 月之暗面は循環智能内部で開発されたプロジェクトであり、現在も株主の正式な決議を得ていません。
⚠️ 楊植麟氏と張宇韜氏は、投資家の同意を得ずに資金調達を開始し、強い反発を招きました。
💼 張予桐氏は利益相反を隠蔽したとして解雇され、この事件はスタートアップ企業における株主の責任の複雑さを示しています。
11.生成AIがクリエイターの収入を脅かす:今後5年間で350億豪ドルの損失の可能性!
最近のグローバル経済調査レポートは、生成AIの急速な発展が、音楽や映画のクリエイターの収入に深刻な脅威を与えることを明らかにしました。国際作家作曲家協会(CISAC)が委託した調査によると、2028年までにクリエイターの収入リスクは350億豪ドルに達すると予想されています。音楽クリエイターは24%の収入損失に直面し、映画クリエイターは最大21%の損失に直面しています。
【AiBase要約:】
📉 クリエイターの収入損失:生成AIにより、音楽クリエイターの収入は24%、映画クリエイターの収入は21%減少する可能性があります。
💰 市場拡大:AI生成サービスの市場は、48億豪ドルから1030億豪ドルに拡大すると予想されています。
⚖️ 政策への要望:専門家やクリエイター団体は、政府がクリエイターの権利と収入の安全を確保するための措置を講じるよう求めています。
12.AWPortraitCNモデル発表:中国の赤ちゃんのための審美眼を考慮した画像生成技術
AWPortraitCNはFLUX.1-devをベースにした画像生成モデルで、中国人の外見の特徴と審美眼により適合した肖像画を生成することに特化しています。このモデルは様々な肖像画でトレーニングされており、優れたパフォーマンスと簡単な操作性を備えています。ユーザーはShakker AIプラットフォームを通じて高品質の肖像画を簡単に生成でき、人工知能技術の民主化を促進します。
【AiBase要約:】
🎨 AWPortraitCNモデルは中国市場向けに設計されており、人物肖像の生成を最適化しています。
📸 多様なタイプの肖像画でトレーニングされており、リアルで繊細な効果を実現しています。
🌐 ユーザーはオンラインで体験でき、オープンソースとオープンサイエンスの発展を促進します。
モデルアドレス:https://huggingface.co/Shakker-Labs/AWPortraitCN