AIデイリーニュース：アリババが最新数学モデルQwen2-Mathをオープンソース化、Doubaoに音楽機能追加、Appleが高度なAIサービスを導入予定、Googleのロボットがパリ五輪に挑戦

【AI日報】へようこそ！ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題を、開発者に焦点を当ててお届けします。技術トレンドの洞察、革新的なAI製品の応用を理解するお手伝いをいたします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、アリババが最新数学モデルQwen2-Mathを発表 GPT-4oを凌駕する数学能力

アリババクラウドが発表したQwen2-Mathシリーズの大規模言語モデルは、数学分野で強力な解法能力を示し、オープンソースとクローズドソースの両方のモデルを上回り、AI数学界のダークホースとなりました。このモデルは、精心設計された数学専門の語料庫で深く事前学習されており、特にQwen2-Math-Instructモデルは革新的なトレーニング方法を採用することで、数学の解法能力が向上しています。今後、チームは多言語対応版のリリースとモデルの継続的な最適化を計画しています。Qwen2-Mathの登場は、AIの数学分野への応用における新たな可能性を切り開き、教育、研究、工学などの分野で重要な役割を果たすでしょう。

【AiBase要約:】
⚙️ Qwen2-Mathシリーズモデルは強力な数学解法能力を示し、オープンソースとクローズドソースのモデルを上回り、AI数学界のダークホースとなりました。
📚 Qwen2-Mathは、精心設計された数学専門の語料庫で深く事前学習されており、特にQwen2-Math-Instructモデルは革新的なトレーニング方法により数学解法能力が向上しています。
💡 アリババクラウドチームは、多言語対応のQwen2-Mathバージョンをリリースし、より複雑な数学問題を解決するためにモデルを継続的に最適化する計画です。
詳細リンク:https://top.aibase.com/tool/qwen2-math

2、バイトダンスのAIアシスタント「豆包」アプリとPC版に音楽生成機能が登場

最近、バイトダンス傘下の豆包AIアシスタントは音楽生成機能を追加しました。ユーザーは簡単に独自の楽曲を作成できます。このサービスは、様々な音楽スタイルと感情状態を提供し、ユーザーの感情表現ニーズに応えることを目指しています。豆包は、音楽を通じて創造性を刺激し、ユーザーが自分のストーリーを共有し、音楽制作の旅を始められるようにしたいと考えています。

【AiBase要約:】
🎶 豆包アプリまたはPC版で独自の楽曲を生成できます。曲風、雰囲気、ボーカルを選択でき、歌詞は200字以内です。
🎵 フォーク、ヒップホップ、R&Bなど11種類の音楽スタイルと様々な感情状態を選択できます。男性ボーカルまたは女性ボーカルを選択できます。
🎤 ワンクリックで完全な歌詞を生成し、生成された楽曲とカバーをダウンロードして共有できます。音楽生成機能は現在も改良中であり、豆包はユーザーが音楽でストーリーを共有し、創造性を刺激することを推奨しています。

3、簡単操作！ChatGPTが無料ユーザーにDALL-E3による画像生成を毎日2枚まで許可

OpenAIは、無料ユーザーがDALL-E3モデルを使用して毎日最大2枚の画像を生成できることを発表しました。ユーザーにより多くの創作の可能性を提供します。DALL-E3はChatGPTで生成されたプロンプトを使用して画像を作成できるため、ユーザーはより簡単に始めることができます。この新機能は段階的に導入されており、一部のユーザーはすでに便利な創作体験をしており、より多くのクリエイターのインスピレーションを刺激しています。

【AiBase要約:】
🌟 ChatGPTの無料ユーザーは毎日2枚のDALL-E3画像を生成できます！
🎨 DALL-E3はChatGPTで生成されたプロンプトを使用して、画像作成をより簡単にします。
📅 この機能は段階的に導入されており、一部のユーザーはすでにこの新機能を体験できます。

4、アップルがネスト型拡散モデルMDMを発表

アップルが発表した最新のネスト型拡散モデル（MDM）は、その強力な技術革新能力を示しています。ネスト型の概念を通じて、画像とビデオのシームレスな生成を実現し、画像品質と生成効率を向上させ、AI画像生成分野に新たな技術トレンドをもたらしました。

【AiBase要約:】
🎨 MDMはネスト型拡散モデルを採用し、異なる解像度での画像処理を実現し、高品質な画像を生成します。
🧠 MDMの中核アーキテクチャであるNestedUNetはネスト型の概念を強化し、小規模な入力データを段階的に処理することで、学習と生成の効率を向上させます。
✨ MDMは高解像度画像生成において優れた性能を示し、ゼロショット汎化能力を備えており、AI画像生成技術の応用範囲を拡大します。
詳細リンク:https://top.aibase.com/tool/ml-mdm

5、GPT-4oが深夜に突然奇声を発する？OpenAIが32ページの安全報告書を発表

新しい「レッドチーム」レポートで、OpenAIはGPT-4oモデルの長所とリスクに関する調査結果を記録し、GPT-4oのいくつかの奇妙な癖を明らかにしました。レポートは、様々な緩和策と安全対策によってより安全になったAIモデルの全体像を描いています。

【AiBase要約:】
🔍 GPT-4oは、高い背景ノイズ環境下でユーザーの音声を模倣します。
🔊 GPT-4oは、不快な非言語的な音や効果音を生成します。
🎵 GPT-4oは、著作権侵害の可能性があります。
詳細リンク:
https://openai.com/index/gpt-4o-system-card/
https://techcrunch.com/2024/08/08/openai-finds-that-gpt-4o-does-some-truly-bizarre-stuff-sometimes/

6、バイトダンスの豆包大規模モデルがリアルタイム音声通話をサポート

バイトダンス傘下のクラウドサービスプラットフォームである火山引擎は、豆包大規模モデルがリアルタイム音声通話の新機能をサポートしたと発表しました。火山引擎が提供する会話型AIリアルタイムインタラクションソリューションは、音声テキスト変換とテキスト音声変換のプロセスを簡素化し、効率的な音声データの収集、処理、伝送を実現し、優れたインテリジェントな会話と自然言語処理能力を提供します。火山引擎の大規模モデルマルチモーダルリアルタイムインタラクションサービスは、主要なAIバーチャルキャラクターチャットアプリケーションにAIリアルタイム音声機能を提供し、全く新しいインタラクティブ体験をもたらします。

【AiBase要約:】
🔥 火山引擎はリアルタイム音声通話の新機能を提供し、音声テキスト変換とテキスト音声変換のプロセスを簡素化し、効率的な音声データ処理と伝送を提供します。
🚀 火山引擎RTCはオーディオ3A処理技術に基づき、「ダブルトーク」現象を解決し、音声認識の正確性とリアルタイム性を確保します。
💡 火山引擎は柔軟で多様な接続方法を提供し、様々な企業のニーズを満たし、企業に革新的なAIリアルタイム音声ビデオ体験をもたらします。

7、アップルが高度なAIサービス「Apple Intelligence」をリリースか

アップルは、新しいApple Intelligenceサービスのリリースを計画しており、これは人工知能分野における大胆な試みとなります。このサービスは、月額最大20ドルでユーザーに提供される可能性があり、アップルのAI技術への自信とサービス分野への拡大意欲を示しています。公式発表はまだありませんが、実現すれば、ユーザーはより高度でパーソナライズされたAIサービスを利用でき、アップルのテクノロジーサービス市場におけるリーダーシップを強化することになります。

【AiBase要約:】
🚀 アップルは新しいApple Intelligenceサービスのリリースを計画しており、月額料金は最大20ドルになる可能性があります。
💡 アップルは人工知能技術のコストをユーザーに転嫁する意図があり、AI技術への自信を示しています。
💰 既存のApple Oneサービスパッケージに統合され、アップルのテクノロジーサービス市場におけるリーダーシップをさらに強化する可能性があります。

8、グーグルのロボットがパリ五輪に挑戦卓球のフォアハンド、バックハンドを巧みに使い分け、プロコーチに勝利

卓球愛好家として、グーグルのロボットAgentの卓球試合でのパフォーマンスに驚嘆しました。このロボットは高度なスキルを備えているだけでなく、人間の選手と激しい競争を繰り広げ、ロボット技術の巨大な可能性を示しています。

【AiBase要約:】
🏓 グーグルは、人間の競技レベルに達した最初のロボットAgentを発表し、卓球の競技に挑戦しています。
🔥 ロボットは大量の卓球状態データの学習を通じて、フォアハンドトップスピン、バックハンドのターゲティングなどのスキルを習得し、高速運動とリアルタイムの正確性を示しています。
🤖 ロボットは、異なるスキルレベルの選手との試合で一定の成果を収め、人間の対戦相手と直接競争する能力を示しています。
詳細リンク:https://sites.google.com/view/competitive-robot-table-tennis/home

9、逐次動力最新の人型ロボットCL-1が宅配ステーションでの荷物の搬送を可能に

逐次動力社が発表した最新の人型ロボットCL-1は、優れた自律歩行能力とタスク実行能力を示し、インテリジェントロボット分野の発展を牽引しています。同社はAラウンド資金調達を完了し、資本市場からの承認を得ており、アリババなどの巨大企業からの投資も注目を集めています。CL-1は、安定した把持と荷物の搬送能力を成功裏に実証し、中国のインテリジェントロボットの競争力強化を示唆しています。今後、逐次動力はスマート製造や物流分野でより大きな役割を果たし、イノベーションと変革をもたらすことが期待されます。

【AiBase要約:】
🤖 CL-1は優れた自律歩行能力とタスク実行能力を示しています。
💰 逐次動力はAラウンド資金調達を完了し、数十億人民元の資金を獲得しました。
🚚 CL-1は安定した把持と荷物の搬送を行い、中国のインテリジェントロボットの競争力強化を示唆しています。

10、雷軍氏：Xiaomiフラッグシップデバイスの国際版にGoogle AI大規模モデルGoogle Geminiを搭載

雷軍氏は、Xiaomiフラッグシップデバイスの国際版にGoogle AI大規模モデルGoogle Geminiを統合すると発表しました。よりスマートで直感的なユーザーエクスペリエンスを提供することを目指しています。この取り組みにより、Xiaomiスマートフォンは高度なマルチモーダルAI能力を備え、ユーザーエクスペリエンスと機能性が向上します。

【AiBase要約:】
🔍 Google Geminiは高度なマルチモーダルAIモデルであり、画像、音声、ビデオを深く理解し、数学的推論能力も備えています。
🚀 Geminiは、自然画像理解、音声処理、数学的推論など、多くの分野で優れた性能を発揮し、OpenAIのGPT-4モデルを凌駕しています。
📱 Xiaomi 15シリーズの国際版にはGoogle Gemini AI大規模モデルが搭載され、10月の発売が予定されており、ユーザーに最新のAI技術体験を提供します。

11、新たな血液！OpenAIがカーネギーメロン大学の教授を理事会メンバーに任命

OpenAIは最近、カーネギーメロン大学のZico Kolter教授を理事会メンバーに任命したと発表し、同社の将来の発展に新たな活力を注入しました。Kolter教授は、安全委員会で重要な役割を果たし、プロジェクトの安全性と意思決定プロセスを支援します。彼の参加はOpenAIの使命に合致しており、技術開発の安全保障を強調しています。

【AiBase要約:】
🧑‍🏫 OpenAIはカーネギーメロン大学のZico Kolter教授を理事会メンバーに任命しました。
🔒 Kolter教授は理事会の安全委員会に加わり、プロジェクトの安全に焦点を当てます。
🌐 Kolter教授の研究分野はOpenAIの使命と高度に合致しており、将来の技術開発の安全保障を示唆しています。

12、Google Cloudの調査によると、86％の企業が生成AIにより6％の収益増加を実現

最近、Google CloudとNational Research Groupが共同で行った調査によると、生成AIを使用している企業は顕著な投資収益率を得ていることがわかりました。企業は1年以内にリターンを見ており、収益は6％以上増加しており、AIは事業成長の原動力となっています。しかし、一部の従業員は生産性が向上していないと考えており、関連するトレーニングが不足しています。企業は包括的な戦略を策定し、従業員のトレーニングを重視する必要があります。

【AiBase要約:】
🌟74％の企業が生成AIを使用して1年間の投資収益率を見ています。
📈86％の企業が6％以上の収益増加を報告しています。
🧠63％の企業がAIを事業成長の重要な原動力と考えています。

AIデイリーニュース：アリババが最新数学モデルQwen2-Mathをオープンソース化、Doubaoに音楽機能追加、Appleが高度なAIサービスを導入予定、Googleのロボットがパリ五輪に挑戦

関連推奨

AIアプリケーションの最後の一マイルを打通する：アリババクラウドのMeoo CLIが正式にオープンソース化

ワンクリックで本番環境にデプロイ：アリババクラウドが秒悟 Meoo CLI オープンソースツールを発表

通義千問の新しい大規模モデルが5月20日のアリババクラウドカンファレンスで発表される予定

ハンセイ・エレクトロニクスとアリババクラウドがAIフルスタック全面協力契約を締結

アリババクラウド AI マンガドラマソリューション：ショートドラマ制作が知的化の新時代を迎える！