【AI日報】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品:クリックして詳細を見るhttps://top.aibase.com/

1、ビットテクノロジーがエンド・トゥ・エンド同時通訳モデル「Seed LiveInterpret 2.0」をリリース

ビットテクノロジーのSeedチームは最新の研究成果として、「Seed LiveInterpret 2.0」をリリースしました。このモデルは中英語の同時通訳品質で業界トップレベルに達し、低遅延とリアルタイム音声再現機能を備えており、言語間コミュニケーションの自然さとスムーズさを大幅に向上させています。

image.png

【AiBaseの要約:】

🚀 Seed LiveInterpret 2.0は、人間の同声通訳に近い翻訳精度を持ち、遅延が極めてわずかで、3秒で完了します。

🎙️ 音声サンプルを事前に取得する必要なく、リアルタイムで「本物の声」の音声翻訳を合成できます。

📊 専門的な評価において、Seed LiveInterpret 2.0は中英語相互翻訳タスクで優れたパフォーマンスを示し、他のシステムよりもはるかに高いスコアを得ました。

詳細リンク:https://arxiv.org/pdf/2507.17527

2、ミーターサーチ API のリリース:料金は3セントでマルチモーダル検索機能を提供

ミーターアイサーチはその検索APIを正式リリースし、Bing Search APIの代替として開発者に新しい選択肢を提供しています。このAPIの料金は1回の検索につき0.03元で、マルチモーダル検索をサポートしており、利用制限がないため、迅速に接続することが可能です。

image.png

【AiBaseの要約:】

✅ ミーターアイサーチ APIが正式リリースされ、開発者向けの新しい検索代替案が提供されています。

💡 1回の検索ごとに0.03元の料金で競争力があり、マルチモーダル検索をサポートしています。

🚀 開発者は即時にテストし、複雑な申請プロセスなしで効率的に接続できます。

3、Lovart AI リリース版のグローバルリリース:全フローのスマートデザインで創造体験を再定義

記事では、Lovart AIのリリース版のグローバルリリースについて紹介しています。これは最初のAIデザインエージェントとしての革新性を強調し、自然言語のインタラクションと全フローのデザイン能力を通じて、デザイン業界の基準を再定義しています。また、新しい機能であるChatCanvasと中国市場向けの「星流エージェント」についても触れ、デザイン業界への影響を指摘しています。

image.png

【AiBaseの要約:】

🎨 Lovart AIは自然言語のインタラクションと全フローのデザイン能力を通じて、高品質なビジュアル資産生成サービスを提供します。

🧠 新機能のChatCanvasは、複数の会話ラウンドとレイアウト、カラーパレットのリアルタイム調整をサポートし、創造効率を向上させます。

🇨🇳 中国市場向けに最適化された「星流エージェント」は中国語の意味と国風の美的感覚をサポートし、地元のクリエイターが効率的に創作できるようにします。

4、リー・ムー(李沐)チームがHiggs Audio v2をリリース:音声合成の新たな時代を開く

リー・ムー(李沐)チームが公開したHiggs Audio v2は音声合成分野での大きな進歩であり、多言語対話生成、リズムの自動調整、音声クローンなどの機能を備えています。このモデルは1000万時間以上の音声データで訓練され、さまざまなテストで優れた性能を示し、業界の基準となっています。

image.png

【AiBaseの要約:】

🔥 Higgs Audio v2は多言語対話生成と音声クローンをサポートし、複雑なタスクを実現します。

📊 EmergentTTS-Evalテストでは、Higgs Audio v2は感情と質問カテゴリで優れたパフォーマンスを示しました。

🚀 リアルタイムの音声チャットやオーディオコンテンツの作成に対応し、バーチャルアーティストや音声アシスタントなど様々なシーンで使用できます。

5、Sora2が登場:OpenAIが生成型AI動画分野で再び中心になる

記事では、OpenAIがテキストから動画へのモデルSoraの後継であるSora2を開発していることを紹介しています。また、グーグルのVeo3の普及状況についても言及しており、生成型AI動画分野の競争がさらに激しくなることを示しています。

image.png

【AiBaseの要約:】

🚀 OpenAIはSora2の開発を積極的に進めています。

💡 Sora2はまだ公開されていませんが、今後の数週間でさらなる情報が明らかになるでしょう。

🌐 グーグルのVeo3は大学生に無料で提供されており、Google Cloudでも体験できます。

6、OpenAIとOracleがStargateプロジェクトを拡大:数千人の雇用を生み出す

OpenAIはOracleと新たな協議を結び、Stargateプロジェクトの米国のデータセンター容量を4.5ギガワットに拡大し、全体の容量は5ギガワットを超えました。これは、OpenAIが2029年までに10ギガワットを達成する重要な一歩です。このプロジェクトは、米国が世界中の人工知能発展の主導権を握ることを目指し、多くのテクノロジーや国際投資家を引きつけました。

image.png

【AiBaseの要約:】

🔥 Stargateプロジェクトの容量は5ギガワット以上に拡大し、目標は2029年に10ギガワットに達することです。

🤝 OpenAIとOracleをはじめとする多くのテクノロジーや企業がプロジェクトを推進し、10万人以上の雇用を生み出す見込みです。

💰 このプロジェクトには190億ドル以上の資金が投入され、多くの国々の投資家が参加しています。

7、Google PhotosにAI機能追加:写真を瞬時にアニメに変換、1クリックで動画を作成

Google Photosは、静止画を動画に変換する機能や、写真を異なる芸術スタイルに変換するクリエイティブツールなどを含む多数のAIベースの新機能をリリースしました。これらの機能は、ユーザーの創造体験を向上させ、実験的な方法で製品を改善していくものです。

image.png

【AiBaseの要約:】

📷 写真を動画に変換する機能はVeo2モデルを使用し、静止画を6秒で動的動画に変えることができます。

🎨 Remix機能はImagen AIによって駆動され、通常の写真をアニメやマンガなどの芸術スタイルに変換できます。

📌 Google Photosアプリに「作成」タブが追加され、さまざまなクリエイティブツールが統合され、ワンストップの創造体験が提供されます。

8、YouTube Shortsに新AIエフェクトをリリース:写真が瞬時に動画に!

YouTubeはShortsのクリエイターに対して、画像から動画への変換やAIエフェクトといった革命的な生成型AI機能を開放しました。これらのツールは静止画を動画に変換し、多様なクリエイティブオプションを提供することで、制作のハードルを大幅に下げ、コンテンツの魅力を向上させます。

image.png

【AiBaseの要約:】

📷 画像から動画への機能により、静止画が6秒以内で生き生きとした動画になります。

🎨 AIエフェクトは描き文字やセルフィーなどの簡単な素材を美しい芸術作品に変えることができ、クリエイターのインスピレーションを刺激します。

🎥 新世代のVeo3動画生成器は音声を同時に生成し、より完成度の高い創作ソリューションを提供します。

9、グーグルがAeneasモデルをリリース:古代文書の解読に新たな道を開く

グーグルがリリースしたAeneasモデルは、古代の碑文の解読に新しい方法を提供し、歴史学者が碑文の復元、鑑定、年代の特定を速く行うことを可能にし、他の古代言語や資料にも拡張可能な力を備え、歴史研究の効率と深さを大きく向上させます。

image.png

【AiBaseの要約:】

🧠 AeneasモデルはグーグルDeepMindによってリリースされ、歴史学者が古代文書を理解するための目的で設計されました。

🗣️ このモデルは古代文書の類似性を分析し、文書の空白部分を埋め、歴史研究者の負担を軽減します。

📜 Aeneasは文書を「歴史的な指紋」として変換し、歴史学者が広範囲な文脈の中で碑文を解釈するのを助けます。

詳細リンク:https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

10、GitHub Sparkが登場:一言でWebアプリを作成、AI開発の新時代へ!

GitHub Sparkは自然言語処理技術を活用し、開発者だけでなく非開発者も簡単にカスタマイズされたWebアプリケーションを構築できるようにし、プログラミングのハードルを顕著に低下させ、マイクロアプリケーションの開発に新たな可能性をもたらします。

image.png

【AiBaseの要約:】

🌟 GitHub Sparkは自然言語でニーズを説明することで、完全なWebアプリケーションを迅速に生成できます。

🚀 全マネージド実行環境を提供し、1クリックでデプロイおよびPWA互換性をサポートし、開発プロセスを簡略化します。

🔧 複数のモデルを選択できる機能を備え、GitHubエコシステムと深く統合され、開発効率を向上させます。

詳細リンク:https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-cop ilot-pro-subscribers/

11、Huawei M-Pencil Proのリリース:699元、小藝スマートアシスタントを素早く呼び出せる

Huaweiは新世代のペンHUAWEI M-Pencil Proをリリースし、価格は699元で、16384段階の圧力感知、サイド回転機能、さまざまなペン先の選択を備え、AI機能のショートカットやスタークロックの正確な検索機能をサポートし、クリエイターにより便利で現実的な創作体験を提供します。

image.png

【AiBaseの要約:】

✨ HUAWEI M-Pencil Proは16384段階の圧力感知を備え、力の変化を正確に感知し、創作の現実感を向上させます。

💡 ペンの末尾にあるスマートボタンは、HarmonyOSの星環デザインのバイブレーションランプを採用し、小藝スマートアシスタントを素早く呼び出すことが可能です。