【AIデイリーニュース】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野のホットな情報を紹介し、開発者に焦点を当て、技術のトレンドや革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品クリックして詳細を確認https://top.aibase.com/

1、火山エンジンが豆包の最新画像編集・通訳モデルを発表し、エージェント開発の実装を加速

火山エンジンは厦門でのイベントで、豆包シリーズの新しいモデルおよびAIクラウドネイティブサービスのアップグレード成果を発表しました。これは画像編集モデル3.0、同声通訳モデル2.0、大規模モデル1.6シリーズを含みます。また、コツのコア機能のオープンソース化と企業独自モデルのホスティング方案を提供し、開発者がエージェントを作成し、AIアプリケーションを実装することを支援しています。

image.png

【AiBase要約:】

🔥 豆包・画像編集モデル3.0は自然言語指令の処理能力を向上させ、映像制作や広告マーケティングに適しています。

🎙️ 豆包・同声通訳モデル2.0は低遅延の音声同期生成を実現し、地方話や口語にも対応します。

🚀 豆包大規模モデル1.6シリーズはコード、推論、数学能力を最適化し、遅延とコストを削減しています。

2、通義千問がQwen3-30B-A3B-Instruct-2507非思考モードモデルをオープンソース化

Qwen3-30B-A3B-Instruct-2507の新バージョンは非思考モードにおいて優れた性能を発揮し、トップクラスの閉鎖型モデルに匹敵し、多くの分野で顕著な改善を遂げています。同時に多言語と長文処理をサポートしており、開発者や研究者にとって便利なオープンソースプラットフォームを提供しています。

image.png

【AiBase要約:】

🧠 新バージョンQwen3-30B-A3B-Instruct-2507は非思考モード下で3Bパラメータのみをアクティブ化し、Gemini2.5-Flash(non-thinking)やGPT-4oなどのトップクラスの閉鎖型モデルと同等の性能を発揮しています。

🌐 一般的な能力が大幅に向上し、指示の遵守、論理的推論、テキスト理解、数学、科学、プログラミングおよびツールの使用など多くの方面をカバーしています。

📚 長文理解能力は256Kに達し、多言語の長尾知識をより広範囲にカバーし、グローバルなシナリオに適しています。

3、OpenAIが新たな学習アシスタントChatGPT Studyをリリース

OpenAIは新たなChatGPT Study学習モードをリリースし、学生や教育者に対してよりパーソナライズされ、インタラクティブな学習体験を提供することを目的としています。この機能にはインタラクティブなヒント、ステップバイステップの返答、パーソナライズされた教育および知識ポイントのチェックが統合されており、さまざまな教科に対応し、すべてのユーザーが利用可能です。

image.png

【AiBase要約:】

🚀 ChatGPT Studyは学生や教育者向けにパーソナライズされ、インタラクティブな学習体験を提供します。

📚 四つの主要な機能を統合しており、インタラクティブなヒント、ステップバイステップの返答、パーソナライズされた教育および知識ポイントのチェックがあります。

🌐 この機能は無料版、Plus、Pro、Teamのすべてのユーザーに利用可能であり、OpenAIが教育テクノロジーに進出していることを示しています。

4、中国がHYPIR画像復元大規模モデルを発表、古い写真を1.7秒で8K高精細画像に変換

HYPIR画像復元大規模モデルのリリースにより、中国の人工知能分野におけるイノベーション能力が示され、文化継承、映画修復、科学研究、医療など多くの分野に革命をもたらしています。

image.png

【AiBase要約:】

🧠 HYPIR画像復元大規模モデルは1.7秒で古い写真を8K超高精細画像に復元できます。

📄 HYPIRは文字の保真性に優れ、文字内容を高精度で復元できます。

🚀 HYPIRのリリースは画像復元技術の新しい時代を開くものです。

5、GoogleがNotebookLMに動画概要機能を追加し、学習体験を向上

GoogleはNotebookLMに動画概要機能を追加し、複雑な情報をナレーション付きスライドに変換することで、ユーザーに直感的な学習体験を提供しています。この機能はユーザーがアップロードした資料から情報を抽出し、今後は多言語サポートの拡張を予定しています。

image.png

【AiBase要約:】

📹 新機能:GoogleがNotebookLMに動画概要機能をリリースし、学習体験を視覚的に強化します。

📄 データ抽出能力:この機能はユーザーがアップロードした資料から情報を抽出し、ナレーション付きスライドを自動生成します。

🌍 今後の拡張:動画概要機能は多言語をサポートし、将来は表現形式をさらに豊かにしていく予定です。

6、GoogleがImagin4を静かにアップデート!GPT-4oを上回り、AI画像生成の王者が再び登場?

Googleはテキストから画像生成されるモデルImagin4を大幅にアップデートしました。アップデート後のImagin4Ultraは、信頼性の高いArtificial Analysis画像競技場ランキングで第3位にランクインし、OpenAIのGPT-4oやSeedream3.0と並んで世界のトップ画像生成モデルの一つとなりました。画像品質、複雑なヒントの処理、価格の利点、生成速度などにおいて突出しています。

image.png

【AiBase要約:】

🖼️ Imagin4Ultraは画像の細部、リアルさ、スタイルの一貫性において優れており、性能が大幅に向上しています。

💰 Imagin4標準版とUltra版の価格はGPT-4oよりもはるかに安いため、コストパフォーマンスが優れています。

⚡ Imagin4Ultraは1枚の画像の生成平均時間はわずか9.5秒で、多くの競合製品よりも効率が優れています。

7、昆仑万维がマルチモーダル統一事前学習モデルSkywork UniPicをオープンソース化

昆仑万维がリリースしたSkywork UniPicマルチモーダル統一事前学習モデルは、画像理解、テキストから画像生成、画像編集の能力を統合しています。大規模なデータでエンドトゥエンド事前学習を行い、優れた汎用性と移行性を示しています。このモデルは性能が突出しており、特にコンシューマー向けグラフィックカードでもスムーズに動作し、技術の応用ハードルを大幅に低下させています。

image.png

【AiBase要約:】

🧠 MARコーデッカーとSigLIP2メインネットワークがタスク間で深く協調しています。

🖼️ 画像理解、生成、スタイル転換などの複雑な操作をサポートしています。

🚀 1.5Bパラメータ規模で大型統一モデルの性能に近づいています。

詳細リンク:https://huggingface.co/Skywork/Skywork-UniPic-1.5B

8、理想i8の発売、最初のスマートドライバー大規模モデル搭載、価格は32.18万元から!

理想自動車は新しく六人乗り純電SUV「理想i8」をリリースし、3つのバージョンを提供し、価格はそれぞれ32.18万元、34.98万元、36.98万元です。この車は技術配置に誠意があり、全車種にダブルモーター4WDシステム、自社開発の5Cバッテリー、レーザーレーダーが標準装備され、世界初のVLAドライバー大規模モデルを搭載し、車両の安全性とスマート化レベルを向上させています。

image.png

【AiBase要約:】

🚗 理想i8にはダブルモーター4WDシステムが搭載され、最大出力は400kW、トルクは660Nmです。

🔋 自社開発の5Cバッテリーは2つの容量を提供し、航続距離はそれぞれ670kmと720kmです。

🤖 世界初のVLAドライバー大規模モデルを搭載し、自然言語の相互作用をサポートし、スマート操作体験を向上させています。

9、Googleが英国でAI検索モードをリリース、複雑な質問への回答体験を向上

Googleは英国で新しいAI検索モードをリリースし、ユーザーがより複雑な質問を提示し、正確なAI駆動の回答を得ることを支援します。このモードはGemini2.5モデルに基づき、クエリ拡張技術を用いてネットワークコンテンツを深く掘り下げ、テキスト、音声、または画像による質問など、さまざまなインタラクティブな方法をサポートしています。

image.png

【AiBase要約:】

🧠 AIモードはGoogle最新のGemini2.5モデルに基づき、複雑な複数部分の質問を処理できます。

🔍 クエリ拡張技術によってユーザーの質問を複数のサブテーマに分解し、ネットワークコンテンツを深く掘り下げます。

📱 音声や画像による質問をサポートし、インタラクティブな体験と使いやすさを向上させます。

10、昆仑万维がマルチモーダル統一事前学習モデルSkywork UniPicをオープンソース化、画像生成と理解の能力を統合

昆仑万维はオープンソースのマルチモーダル統一事前学習モデルSkywork UniPicをリリースし、画像理解、テキストから画像生成、画像編集の機能を統合しています。このモデルは大規模で高品質なデータでエンドトゥエンド事前学習を行い、良い汎用性と移行性を示しています。1.5Bの軽量設計は大規模モデルの性能に近く、厳密なデータ構築と複数段階のトレーニングによりモデルの性能が向上しています。

image.png

【AiBase要約:】

📷 Skywork UniPicは画像理解、テキストから画像生成、画像編集の3つの機能を統合し、マルチモーダル統一を実現しています。

💡 1.5Bの軽量パラメータ規模で、大規模モデルに近い性能を持ち、開発者にとって使いやすいです。

🚀 複数段階のトレーニングと厳密なデータ構築により、命令の遵守や複雑なタスクでの実行能力が向上しています。

詳細リンク:https://huggingface.co/Skywork/Skywork-UniPic-1.5B

11、OWLチームがマルチエージェントManus類ツールEigentをオープンソース化

EigentはCAMEL-AIチームが開発したマルチエージェント協働ツールで、OWLフレームワークに基づいて構築されています。複雑なタスクの処理効率を向上させるために設計されており、タスクの分割と並列実行が中心です。複数の大規模言語モデルとマルチモーダルデータ処理をサポートし、オープンソースAIの性能とアクセス性の優位性を示しています。