【AI日報】へようこそ!ここは、あなたが毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットな情報を提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する理解を支援します。

最新のAI製品詳細はこちら:https://top.aibase.com/

1.OpenAIが2つのマルチモーダル推論モデルo4-miniとフルバージョンo3を発表

OpenAIは技術ライブストリーミングで、最新のマルチモーダルモデルであるo4-miniとフルバージョンo3を発表しました。これらの2つのモデルは、テキスト、画像、音声の同時処理が可能で、外部ツールを呼び出して複雑なタスクを処理できます。o4-miniは様々なテストで優れたパフォーマンスを示し、o3よりも精度が高く、プログラミングコンテストでも上位にランクインしました。

image.png

【AiBase要約:】

🛠️ o4-miniとo3はマルチモーダル処理能力を備え、テキスト、画像、音声の同時処理と外部ツールの自動呼び出しが可能です。

📊 o4-miniはAIME2024と2025のテストで、それぞれ93.4%と92.7%の精度を達成し、フルバージョンo3を上回りました。

💻 プログラミングコンテストでは、o4-miniが2700点を獲得し、世界トップ200人のプログラマーにランクインし、強力なプログラミング能力を示しました。

2.微信初のAIアシスタント「元宝」正式リリース、微信友達として追加可能に

テンセントが発表した「元宝」は、微信プラットフォーム上で動作する初のAIアシスタントです。ユーザーは微信で検索して友達として追加し、よりリアルなチャット体験を楽しむことができます。「元宝」は微信公式アカウントの記事、画像、ドキュメントを解析できるだけでなく、スマートなインタラクションを行い、ユーザーからのさらなる質問にも答えることができます。このアシスタントはユーザーのプライバシーに配慮し、身分証明書写真の自動マスキング機能を備えています。ただし、現時点では音声通話やビデオ通話はサポートしていません。

image.png

【AiBase要約:】

🌟 微信初のAIアシスタント「元宝」がリリースされ、ユーザーは微信で直接検索して追加できます。

📊 「元宝」は公式アカウントの記事、画像、ドキュメントの解析をサポートし、スマートなインタラクションを提供します。

🔒 プライバシー保護機能を備え、身分証明書写真の自動マスキングに対応しています。

3.バイトダンスが豆包1.5深層思考モデルを発表:マルチモーダル深層思考、低遅延

4月17日の火山引擎AIイノベーションツアー杭州会場で、バイトダンスは豆包1.5深層思考モデルを発表し、数学、プログラミング、科学的推論、創造的なライティングなどの分野における卓越した能力を示しました。このモデルはMoEアーキテクチャを採用し、パラメーター設定が優れており、推論コストが低くなっています。ビジュアル理解技術と組み合わせることで、写真分析、旅行やプロジェクト管理の支援が可能になり、ビデオ検索機能も大幅に向上し、ユーザーの情報取得の利便性が向上しました。

image.png

【AiBase要約:】

📈 豆包1.5モデルは数学、プログラミングなどの分野で優れたパフォーマンスを示し、MoEアーキテクチャを採用し、パラメーター設定が優れています。

🌍 新モデルはビジュアル理解技術と組み合わせることで、写真分析、旅行やプロジェクト管理の支援が可能になり、機能が充実しています。

🎥 ビデオ検索機能が大幅に向上し、ユーザーはビデオ内の関連情報を迅速に取得でき、利用量も増加しています。

4.月面の裏側Kimiが数学定理証明モデルKimina-Proverをオープンソース化

Kimi技術チームはKimina-Proverのプレビュー版をリリースし、複数のモデルとデータセットをオープンソース化することで、形式的定理証明分野における優れた性能を示しました。Kimina-Proverは大規模強化学習と形式的推論を組み合わせることで、モデルの推論能力とサンプル効率を大幅に向上させ、80.7%の合格率を達成し、これまでの最高結果を上回りました。

image.png

【AiBase要約:】

🔍 Kimina-ProverはminiF2Fベンチマークテストで80.7%の合格率を達成し、以前の最高結果を上回りました。

🚀 このモデルは大規模強化学習と形式的推論を組み合わせることで、推論能力とサンプル効率を大幅に向上させました。

📚 Kimina-Proverは高い説明可能性を備えており、ユーザーは推論プロセスを確認でき、モデルの動作を理解するのに役立ちます。

詳細リンク:https://arxiv.org/abs/2504.11354

5.OpenAIが超エージェントCodex CLIをオープンソース化、5時間で5000スター突破

OpenAIは最近、軽量のコードインテリジェンスツールであるCodex CLIをリリースしました。リリース後、大きな注目を集め、わずか5時間で5000スターを超える評価を獲得し、同日中に1万スターを突破すると予想されています。Codex CLIは、コードの自動生成、実行、リファクタリング、テストなどの強力な機能を備えており、開発者の作業効率を大幅に向上させます。

image.png

【AiBase要約:】

🌟 Codex CLIはリリース後わずか5時間で5000スターの評価を獲得し、本日中に1万スターを突破すると予想されています。

💻 このツールはコードの自動生成、実行、リファクタリング、テストが可能で、機能が豊富で実用的です。

📈 OpenAIは、より多くのインテリジェンス製品を継続的にリリースし、AIプログラミングプラットフォームの買収も検討して競争力を強化する予定です。

詳細リンク:https://github.com/openai/codex?tab=readme-ov-file

6.Google Gemini Live機能が全Androidユーザー向けに完全開放、Androidユーザーに新たな体験を提供

Googleは最近、GeminiアプリのGemini Live機能をすべてのAndroidユーザー向けに無料で開放すると発表しました。以前は、Pixel 9とSamsung Galaxy S25ユーザーのみに限定されていました。Gemini Liveの優れた点は、カメラと画面上のコンテンツをリアルタイムで認識し、ユーザーに即時のフィードバックと情報を提供することで、インタラクティブな体験を大幅に向上させることです。ユーザーからのフィードバックが好意的だったため、Googleはこの機能の普及を決定し、今後数週間以内に全面的にリリースされる予定です。

image.png

【AiBase要約:】

🌟 Gemini Live機能は現在、すべてのAndroidユーザー向けに無料で開放されており、以前はPixel 9とGalaxy S25ユーザーのみに限定されていました。

📸 この機能はカメラと画面上のコンテンツをリアルタイムで認識し、即時の情報とフィードバックを提供することで、ユーザーのインタラクティブな体験を向上させます。

🚀 マイクロソフトは同日、同様のAIツールCopilot Visionを発表し、リアルタイム情報認識技術の急速な進歩を示しています。

7.OpenAIがAIプログラミングツールWindsurfを30億ドルで買収へ

OpenAIはAIプログラミングツールWindsurfとの買収交渉を進めており、取引額は約30億ドルです。この買収はOpenAIにとって最大の買収となり、AI開発者ツール市場における重要な戦略を示しています。Windsurfは人気のAIプログラミングアシスタントであり、コードの生成と解釈が可能で、2億ドル以上の資金調達を完了しています。

【AiBase要約:】

💰 OpenAIはWindsurfとの30億ドルの買収交渉を進めており、成立すれば最大の買収となります。

🚀 Windsurfは人気のAIプログラミングアシスタントであり、コードの生成と解釈をサポートし、2億ドル以上の資金調達を完了しています。

📈 この買収により、OpenAIのプログラミング能力が強化され、競争の激しいAIツール市場で優位に立つことができるようになります。

8.JetBrainsがコーディングインテリジェンスJunie AIを発表、プログラミングとデバッグに新たな体験を提供

JetBrainsは最近、新しいコーディングインテリジェンスJunie AIが製品化準備完了段階に達したと発表しました。これは、開発者がより効率的にコードを作成およびデバッグするのを支援することを目的としています。Junie AIの発表は、JetBrainsのAIツール分野における大きな進歩を示しています。さらに、JetBrainsは古いAIアシスタントを更新し、最新のAIモデルをサポートし、ユーザーエクスペリエンスを向上させました。市場競争に対応するため、JetBrainsは無料プランを導入し、より多くの開発者がツールを使用できるようにする予定です。

【AiBase要約:】

🤖 Junie AIは製品化準備完了段階に達しており、複雑なタスクの処理とデバッグに焦点を当てています。

📈 更新されたAIアシスタントは、最新のAIモデルを複数サポートし、複数ファイル編集機能が追加されました。

🌐 JetBrainsは無料プランを導入し、無制限のコード補完を提供することで、様々な開発者のニーズに対応します。

詳細リンク:https://blog.jetbrains.com/blog/2025/04/16/jetbrains-ides-go-ai/

9.Reachy2オープンソースヒューマノイドロボットが正式発売

Pollen Roboticsが発表したReachy2は、7万ドルで販売されているオープンソースヒューマノイドロボットであり、多くのトップ大学や研究機関で利用されています。モジュール式設計と強力なAI駆動能力により、ヒューマノイドロボット分野のパイオニアとなり、様々な研究や教育の場面に適しています。Reachy2のオープンソース特性と柔軟なプログラミングサポートは、開発者に幅広い革新的な空間を提供し、ロボット技術の進歩を促進しています。

image.png

【AiBase要約:】

🤖 高度なヒューマノイドデザイン、7自由度のアームを備え、自然で正確な動作を実行でき、様々なアプリケーションシナリオに適しています。

🔄 モジュール式とオープンソースアーキテクチャ、Python SDKプログラミングをサポートし、開発者は必要に応じて機能を拡張でき、技術革新を促進します。

🌍 世界20カ国以上で導入されており、顧客には有名機関が含まれており、医療、小売、教育など幅広い分野での応用可能性を示しています。

10.上海人工知能研究所がアップグレード版マルチモーダル大規模モデル「書生・万象3.0」を発表

上海人工知能研究所が発表した「書生・万象3.0」は、テキストとマルチモーダル入力処理能力が強化された新しいマルチモーダル大規模モデルであり、優れたパフォーマンスを示しています。このモデルは、パフォーマンスとユーザーエクスペリエンスの両面で大幅な向上を遂げ、応答速度が速く、理解能力が向上し、ユーザーの多様なニーズに対応できます。

【AiBase要約:】

🚀 アップグレード版「書生・万象3.0」はマルチモーダル処理能力が大幅に向上し、様々なアプリケーションシナリオに適しています。

💡 このモデルは、パフォーマンスとユーザーエクスペリエンスの両面で目に見える進歩を遂げ、応答速度と理解能力が向上しています。

🌐 オープンソース化の取り組みは開発者に新たなプラットフォームを提供し、イノベーションと応用を促進し、業界の発展を推進します。

11.豆包深層思考と画像生成3.0モデルが正式にAPI公開、企業顧客向けに開放

豆包大規模モデルは最近、豆包1.5・深層思考モデルと豆包画像生成モデル3.0を発表し、火山引擎を通じて正式にAPIを公開し、開発者と企業顧客が利用できるようになりました。これらの2つのモデルは、推論と画像生成タスクで卓越したパフォーマンスを示し、AI技術の応用と発展を促進しています。深層思考モデルは専門的な推論タスクで優れたパフォーマンスを示し、画像生成モデルは画像生成の質が大幅に向上しています。

【AiBase要約:】

🧠 豆包1.5・深層思考モデルは専門分野の推論タスクで優れたパフォーマンスを示し、世界トップレベルに近づいています。

🎨 豆包画像生成モデル3.0は高解像度の画像生成を実現し、創作効率を向上させ、商業レベルのデザイン能力を備えています。

🚀 これら2つのモデルの公開APIは、企業顧客により効率的で汎用性の高い推論と画像生成能力を提供し、AI技術の発展を促進します。

詳細リンク:https://github.com/ByteDance-Seed/Seed-Thinking-v1.5