【AI日報】へようこそ!ここは毎日あなたが人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて技術トレンドや革新的なAI製品の応用についてご説明します。
新規のAI製品クリックして詳細:https://app.aibase.com/zh
1、ビットテックがLance 3Bを開発:一つの「脳」で画像と動画の理解と生成を同時に処理
ビットテックは独自の統一マルチモーダル大規模モデルであるLanceをオープンソース化しました。3Bパラメータですべての機能をカバーし、理解モデルと生成モデルの間の技術的な壁を破りました。Lanceは共通の文脈と能力の分離並列設計を通じて、画像、動画の理解・生成およびマルチモーダル編集の統合を実現しています。

【AiBaseのポイント:】
✨ 共通の文脈と能力の分離並列設計により、マルチモーダルタスクの統合が実現されています。
🚀 3Bパラメータで全機能をカバーし、従来モデルの技術的な高墙を突破しました。
🔧 オープンソースとしてApache2.0ライセンスで公開され、一般的な計算力でも動作可能で、導入コストを下げます。
2、智譜がGLM-5.1高速版を発表:400 tokens/sで世界最大のAPI速度記録を更新
智譜はGLM-5.1高速版APIをリリースしました。400 tokens/sの速度で世界のAIモデルAPIの速度上限を更新し、最高性能と極めて遅延のない両立を実現しました。システムレベルのエンジニアリング最適化によりモデル性能を向上させ、AIアプリケーションの効率的な発展を推進します。

【AiBaseのポイント:】
🧠 智譜のGLM-5.1高速版APIは400 tokens/sの出力速度を達成し、世界のAIモデルAPIの速度上限を更新しました。
🚀 最上位の性能と極めて低い遅延の両立を実現し、業界慣習を打ち破りました。
🔧 システムレベルでのエンジニアリング最適化により、推論エンジン、スケジュールシステム、インフラストラクチャ層の協調的最適化を実施し、モデル性能を向上させました。
3、CapCutとGeminiが提携:AIクリエイティブツールのスマート連携
CapCutとGoogle Geminiアプリが提携し、ユーザーはGeminiアプリ内で直接CapCutの高度なクリエイティブおよび編集機能を呼び出すことができます。この提携により、AIツールのコンテンツ作成分野における普及と革新がさらに促進されます。

【AiBaseのポイント:】
🚀 CapCutとGoogle Geminiアプリが提携し、Geminiアプリ内でCapCutの高度なクリエイティブおよび編集機能を直接呼び出せます。
💡 この提携により、よりスムーズで効率的なAIクリエイティブ体験を提供し、アプリ間の切り替えコストを低減します。
🌟 CapCutは今後の創作方法がより対話的で直感的になり、スマートな統合を実現すると述べています。
4、OpenAIがChatGPT for PowerPointを発表:一言でPPTを作成し、バグも自動検出
OpenAIはChatGPT for PowerPointプラグインをリリースしました。ユーザーは簡単な指示で迅速にPPTの内容を作成・最適化でき、スマートな分析と修正機能を備えているため、オフィス作業の効率を大幅に向上させます。

【AiBaseのポイント:】
✨ 無料で誰でも利用可能なChatGPT for PowerPointプラグイン。
💡 新しいPPTの作成、ページのワンクリック修整や潤色、さらには「レビュー」も可能です。
🔒 主な操作には確認プロセスが導入されており、すべての変更がコントロール可能です。
5、WordPress 7.0正式リリース:AIをネイティブに統合し、スマートサイト構築の新時代へ
WordPress 7.0が正式リリースされ、AI機能をネイティブに統合し、ウェブサイト構築がスマート化されました。新しいバージョンでは、コンテンツ作成、バックエンドインターフェース、モバイル体験の面で全体的なアップグレードが行われ、ユーザーにとってより効率的でスムーズなサイト構築と編集体験を提供します。

【AiBaseのポイント:】
🧠 AI機能をネイティブに統合し、コンテンツ作成効率を向上させます。
🎨 バックエンドインターフェースの現代化により、ユーザー体験を最適化します。
📱 モバイル端末のカスタマイズ機能を強化し、レスポンシブ編集能力を向上させます。
6、Spotifyと环球音楽がAIカバー曲とミックスを共同リリース:著作権の「降格攻撃」が登場
Spotifyと环球音楽がAIカバー曲とミックス機能を共同リリースし、音楽著作権分野において大きな変革をもたらしました。この機能は合法的な認可に基づいており、ユーザーに対して新たな創作方法を提供し、アーティストの利益を保証する合理的な収益分配メカニズムを採用しています。この取り組みはSpotifyの市場競争力を強化し、他のAI音楽プラットフォームに強い挑戦を提示します。

【AiBaseのポイント:】
🎧 Spotifyと环球音楽がAIカバー曲とミックスに関する契約を締結し、ファンに合法的な創作ツールを提供します。
⚖️ 「知情同意、敬意の署名、適切な報酬」の黄金三原則を強調し、他社の著作権侵害モデルとは異なります。
📈 AI戦略によりSpotify株価が13%上昇し、音楽著作権分野における強力な影響力を見せています。
7、400tokens/sで世界記録を更新!智譜とTileRTがGLM-5.1高速版APIを共同リリース
智譜はGLM-5.1高速版APIをリリースし、400tokens/sの速度で世界記録を更新しました。また、最高性能と極めて遅延のない両立を実現し、AIプログラミングやリアルタイムインタラクションなどのシーンに革命的な向上をもたらします。

【AiBaseのポイント:】
🚀 GLM-5.1高速版APIの出力速度は400tokens/sに達し、世界のAIモデルAPIの速度上限を更新しました。
🧠 国産の大規模モデルで初めて最高性能と極めて遅延のない両立を実現しました。
🔧 TileRT高性能推論エンジンはシステムレベルの最適化により、高負荷状況下での尾遅延を顕著に低下させました。
8、本番で勝負!メイドゥンのLongCat-Video-Avatar1.5をオープンソース化:主流のクローズドモデルを全面的に打ち負かす
メイドゥンのロングキャット大規模モデルチームは商用級のデジタル人ビデオ生成モデルLongCat-Video-Avatar1.5をオープンソース化しました。このバージョンは唇の同期、物理的合理性、長時間動画の安定性などにおいて全面的な向上を遂げており、複数の技術アップグレードによりモデルの商業応用価値とユーザー体験を顕著に向上させました。

【AiBaseのポイント:】
🧠 音声特徴抽出符号器をWav2Vec2からWhisper-largeにアップグレードし、音素の変化と発音のリズムの捉え具合を向上させました。
🔄 GRPO技術を導入し、手部と連続性の対齊を最適化し、手部の歪みや動作の不連続問題を解決しました。
🚀 DMD技術を採用し、推論効率を15倍向上させ、10秒の動画生成に約1分しかかかりません。
詳細リンク:https://github.com/meituan-longcat/LongCat-Video
