【AI日報】へようこそ!ここは毎日人工智能世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。

新しいAI製品クリックして詳細を確認https://app.aibase.com/zh

1. メイドゥー傘下の「光年以外」タビットブラウザが公開テストを開始:マルチモデルAIエージェントを統合し、全自動ウェブページ実行をサポート

タビットブラウザのリリースは、ブラウザがトラフィックの入口から個人オフィスの脳としての実行能力を持つものに変化することを示しており、AI技術の普及と生産性の再構築に新たな方向性を提供しています。

image.png

【AiBase要約:】

🧠 マルチモデルAIエージェントを統合し、ウェブページの自動操作を実現。

🔄 システム間データの流れとフォームの自動入力をサポート。

💡 「スキル(Skill)」と「スクリプト(Script)」機能を導入し、ユーザーの効率を向上。

2. 一言で音色を即座に調整!アリババ通義が音声二モデルを発表:自然言語コントロールの「FreeStyle」をサポート

アリババ通義ラボは、音声生成モデルの二つを革命的なものとして発表しました。これらのモデルは自然言語指示によって音色やシーンを制御でき、音声創作の効率と品質を著しく向上させます。

image.png

【AiBase要約:】

🎙️ Fun-CosyVoice3.5は多言語音声生成と細かい制御をサポートし、音声表現の正確さと自然さを向上。

🎧 Fun-AudioGen-VDは説明に基づいて「人物+シーン」の一体化された音声を生成し、環境の没入感を高めます。

💡 両方のモデルは「FreeStyle」指令をサポートし、ユーザーは自然言語で音声スタイルを正確に制御したり、複雑な音声シーンを作成できます。

3. 閉鎖型モデルの独占を打ち破れ!Notionに初のオープンソース重みモデルMiniMax M2.5が導入:国産の光と協力し、AIワークフローを再構築、主打は「究極のコストパフォーマンス」

Notionは初のオープンソース重みモデルMiniMax M2.5を導入し、長期間にわたる閉鎖型モデルの独占を打ち破りました。これにより、ユーザーにはよりコストパフォーマンスの良い選択肢が提供されます。MiniMax M2.5は性能と推論速度において優れた表現を見せ、リアルなオフィスシーンでの深く最適化されています。Notionの「全能ワークステーション」の特性と非常に適合しています。この取り組みはNotion 2026年の核心戦略である「モデル不可知論」を反映しており、ユーザーはタスクのニーズに応じてモデルを自由に切り替えることができます。これにより、AGI時代における「個人と企業のデジタル脳」としての地位をさらに強化しています。

image.png

【AiBase要約:】

🧠 Notionに導入された初のオープンソース重みモデルMiniMax M2.5は、ユーザーにとってよりコストパフォーマンスの良い選択肢を提供します。

🚀 MiniMax M2.5は性能と推論速度において優れた表現を見せ、一部の閉鎖型プロフェッショナルモデルを上回ることもあります。

🔄 Notionはオープンソースモデルを導入することで、「モデル不可知論」の戦略を実現し、ユーザーはタスクのニーズに応じてモデルを自由に切り替えることが可能です。

4. クリエイティブを一元化!グーグルがFlow AIツールをアップグレード:動画、絵画、エフェクトをすべて融合

グーグルはFlow AIツールを大幅に機能拡張し、画像生成技術WhiskとImageFXを統合し、クリエイターに統一されたAIクリエイティブスタジオを提供しています。

image.png

【AiBase要約:】

✨ 一元的なワークフロー:ユーザーは同じ画面で画像生成からアニメーション制作までを行うことができます。

🖼️ ImageFX駆動:グーグル最新のDALL-Eレベルの画像モデルを利用して高品質な素材を生成。

🎨 動的編集:アニメーション作成機能を強化し、より細かい動作フローとエフェクト表現をサポート。

5. アリババ大規模モデルブランドが正式に「千問(Qianwen)」に名称変更:ブランドマトリクスの全面統合を実現

アリババはAI業務の中心ブランドを「千問」として統一することを発表し、そのAI戦略がさらに焦点を当てていることを示しています。「千問」大規模モデルは技術と市場の面で強く、オープンソースモデルは世界中の開発者コミュニティで最も活発であり、同時に「千問」アプリのユーザー活用度も顕著に増加し、国民レベルのAIアシスタントへの進化の兆しが見えています。

image.png

【AiBase要約:】

🧠 千問大規模モデルは技術性能が優れ、数多くのモデルがHugging Faceの世界的オープンソース大規模モデルランキングの上位四つを占めています。

📱 千問アプリのユーザー活用度が高く、春節期間中の日間アクティブユーザー数は7352万で、前年比で940%の増加となっています。

🌐 アリババはブランド統合を通じて、オープンソースエコシステムとC端市場でのリーダーシップを強化し、国内の大規模モデルを世界のトップレベルに近づけています。

6. サムソンが2030年に「AI工場」へ向けて歩み出す:Agentic AIがコアの脳となる

サムソンは、2030年までに全世界の生産システムを「AI工場」にアップグレードすることを発表し、Agentic AIをコアの駆動力として、原材料から製品に至るまでの全工程の自律化を実現します。

image.png

【AiBase要約:】

🧠 AI工場は全工程の自律化を実現し、生産効率と一貫性を向上。

🔄 デジタルツイン技術を使って仮想工場と実際の生産ラインをリアルタイムで同期。

🤖 高リスク作業は、デジタルツイン技術を組み合わせた環境安全ロボットによって行われます。

7. OpenAIがGPT.comというトップドメインを買収した疑い、現在ChatGPT公式サイトにリダイレクトされている

OpenAIはGPT.comというトップドメインを買収した疑いがあり、これは生成型AI分野でのブランド地位をさらに強化するものです。このドメインは現在ChatGPT公式サイトにリダイレクトされており、以前にChat.comを買収した時の処理と非常に似ています。この行動は、OpenAIがブランド資産を防御的に保護しているだけでなく、生態系全体のエントリーポイントを構築し、長期的な戦略的意図としてユーザーの意識占有を深化させていることを示しています。

image.png

【AiBase要約:】

✅ OpenAIがGPT.comドメインを買収した疑いがあり、ブランドの護城河を強化。

🔄 GPT.comは現在ChatGPT公式サイトにリダイレクトされ、以前のChat.comの買収方法と一致。

🌐 OpenAIは戦略的なドメイン買収を通じて、エコシステム全体のエントリーポイントを構築し、ユーザーの意識占有を深化。

8. 長時間動画検索の難題を克服!北京大学とOceanBaseが共同でLoVR基準を開発:WWW 2026に登録され、「全動画+セグメントレベル」のスマート検索新方式を始動

LoVR基準の発表は、長時間動画のマルチモーダル検索評価が新しい段階に入ったことを示しており、従来の短時間動画検索では長時間動画の複雑な意味関連性に対応できない問題を解決し、今後の動画検索エンジンやAIカットアシスタントの信頼性ある基盤を提供しています。

image.png

【AiBase要約:】

🎥 全粒度対応:全動画およびセグメントレベルの検索をサポートし、多様なニーズに対応。

📊 大規模かつ高品質なラベリング:大規模モデルによる自動データ生成により、低コストで拡張可能。

🧠 実際の状況モデリング:長時間動画検索の困難を描写し、評価の正確性を向上。