AIbase【AIニュース】コラムへようこそ!
毎日3分で当日のAIの大事件を知り、AI業界のトレンドや革新的なAI製品の応用を理解しましょう。
より多くのAI情報はこちら:https://www.aibase.com/zh
1. ベイドゥが文心大モデル4.5シリーズを大幅オープンソース化し、10種類の新モデルが登場!
ベイドゥは文心大モデル4.5シリーズを正式にリリースし、完全にオープンソース化しました。さまざまなパラメータ設定を持つ10種類の新しいモデルを含み、飛 paddleフレームワークで訓練および推論を行い、FLOPs利用率は47%です。テキストとマルチモーダルのベンチマークテストで優れた性能を発揮し、開発者がカスタマイズして導入できるためのワンストップガイドとツールを提供しています。Hugging FaceやGitHubなどのプラットフォームにアップロードされています。
体験アドレス:https://yiyan.baidu.com
Hugging Face:https://huggingface.co/baidu)
GitHub:https://github.com/PaddlePaddle/ERNIE
2. 通義千問が多モーダル統一理解・生成モデルQwen VLoをリリース
Qwen VLoという多モーダル大規模モデルがリリースされました。Qwen-VLシリーズに基づいてアップグレードされ、段階的な生成方式を採用しており、世界を正確に理解し高品質に再創造します。オープンな指示編集と生成をサポートし、多言語指示機能を持ち、画像とテキストの入出力が可能です。現在はプレビュー段階で、体験アドレスはQwen Chatプラットフォームです。
体験アドレス:chat.qwen.ai
3. アリババOvis-U1が衝撃的なリリース:多モーダルAI三つ合わせ、オープンソースで世界中の開発者を支援
アリババ国際AIチームはOvis-U1という多モーダル大規模モデルをリリースしました。3億パラメータで構成され、多モーダル理解、テキストから画像生成、画像編集の機能を統合しています。イノベーティブなアーキテクチャ設計を使用し、Python3.10などの技術スタックに基づいて構築されており、トレーニング中にコンプライアンスチェックアルゴリズムが導入されています。コードモデルの重みなどが公開されており、多分野での応用をサポートしています。
プロジェクト:(https://huggingface.co/AIDC-AI/Ovis-U1-3B)
4. ハウエイがパンゴ7B密集型と72Bミックス・オブ・エキスパートモデルをオープンソース化
ハウエイがパンゴ7B密集型モデルと72Bミックス・オブ・エキスパートモデル、および昇騰推論技術をオープンソース化しました。昇騰エコシステム戦略を実践し、大規模モデル技術の研究と産業応用を推進します。関連するモデルの重みとコードがオープンソースプラットフォームにアップロードされ、開発者などにダウンロード・使用・フィードバックを呼びかけています。
5. 一枚の画像だけで話題の動画が作成可能!美圖MOKI「AIクリエイティブ広告」限定無料
美圖MOKIは「AIクリエイティブ広告」機能をリリースしました。ユーザーは画像をアップロードしテンプレートを選択することで、プロ級の動画を作成できます。7つの主要な動画生成モデルを統合しており、体験アドレスはwww.moki.cnで、クリエイティブから完成までのすべてのプロセスを完了できます。
体験アドレス:www.moki.cn
6. Gemini2.5Pro APIが無料に戻る、開発者コミュニティが熱烈に反応
グーグルのGemini2.5Pro APIがGoogle AI Studioの無料層に再度組み込まれました。このモデルは多モーダルおよび推論能力が強く、さまざまな入力タイプをサポートしています。今回の無料回帰により開発者にイノベーションの機会が与えられ、無料計算リソースが倍増し、コミュニティからの反応も活発です。
7. 豆包「深く調べる」機能が豆包アプリ、ウェブ版、PC版でテスト開始
豆包アプリなどでの「深く調べる」機能のテストが開始されました。膨大な深い情報を統合し、研究报告や視覚化されたウェブ結果を生成でき、ユーザーが数分でカスタマイズされたレポートを得られます。また、ワンクリックでポッドキャスト形式への転換も可能です。
8. 小米「AI百宝箱」内側テスト終了、7月5日からサービス終了予定
小米「AI百宝箱」の内側テストが終了し、7月5日にサービス停止予定です。内側テストではデータフィードバックが収集され、これはプロジェクト放棄ではなく、データ整理などの戦略的計画のためです。小米はAI分野において継続的に投資し、多層で全シナリオのAIエコシステムを構築しています。
9. 新たなオープンソースAIシステムOmniGen2が登場:GPT-4oのように画像とテキスト生成を融合
北京人工知能研究院がOmniGen2オープンソースシステムをリリースしました。テキストと画像生成・編集に焦点を当てており、独立したデコードパスを使用し、Qwen2.5-VL-3Bトランスフォーマーに基づいており、カスタム拡散トランスフォーマーを使用しています。反省メカニズムがあり、いくつかのベンチマークテストで優れた性能を発揮しています。Hugging Faceプラットフォームにリリースされます。
プロジェクト:https://huggingface.co/OmniGen2/OmniGen2
10. 知乎「直答」が知識ベース機能をアップグレード、コミュニティコンテンツと深く統合して没入型AI質問応答体験を構築