【AIニュース】へようこそ!毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品クリックして詳細を確認https://app.aibase.com/zh

1. 30秒でアプリを生成するAIアシスタントが登場!アリババグループの「霊光」アプリが正式リリース

アリババグループが提供する全モード対応の汎用AIアシスタント「霊光」は、自然言語を使って30秒で小さなアプリを生成できる機能を持ち、編集可能、インタラクティブ、共有可能な機能も備えています。三大機能として「霊光対話」「霊光スナップアプリ」「霊光エイド」があり、3D、音声・映像、チャートなどのマルチモード情報を出力し、ユーザーの情報取得効率と体験を大幅に向上させます。

image.png

【AiBase要約:】

✨ 自然言語で30秒で小規模アプリを生成し、生産性を向上させます。

🎨 霊光対話は構造化された思考と視覚的コンテンツ生成をサポートし、複雑な情報をより理解しやすくします。

🚀 霊光スナップアプリ機能により、カスタマイズされたツール(電卓や計画器など)を素早く生成できます。

2. xAIがGrok 4.1をリリース!品質と速度が向上し、無料で利用可能!

xAI社はGrok4.1およびGrok4.1Thinkingという2つのモデルをリリースしました。これらは、生成内容における幻覚現象を顕著に低減し、ベンチマークテストでも優れた性能を示しています。ただし、Grok4.1が今年最強のモデルであるとは限らず、グーグルがGemini3.0のリリース準備を進めているためです。

image.png

【AiBase要約:】

🌟 Grok4.1とGrok4.1Thinkingはどちらも無料で利用可能です。

📉 新モデルでは生成時の幻覚現象が3倍減少し、正確性が向上しました。

🏆 初期テストではGrok4.1(Thinking)が最高点を獲得し、前のバージョンよりも優れています。

詳細リンク:https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf

3. Poe AIのグループチャット機能が大規模アップデート!200人協働、AIモデル混搭、多人数での新しい相互作用体験を革新!

Poeはグループチャット機能をリリースし、200人が同時に参加し、さまざまなAIモデルと協働できる機能を提供します。旅行計画やクリエイティブブレインストーミングなどのシーンに適しています。この機能はマルチモードAIを統合し、デバイス間同期を実現し、チーム作業の効率を高め、AIの民主化を推進します。

image.png

【AiBase要約:】

🧠 スムーズな協働、任意のAIとの連携

🌐 マルチモードAIに対応、200以上のモデルと互換性あり

📱 デバイス間同期、リアルタイムで中断なし

詳細リンク:https://poe.com/GuessTheFacts

4. 即時使用可能!OceanBaseが初のAIデータベースseekdbを発表、AIネイティブ混合検索をサポート

OceanBaseは初めてのAIデータベースseekdbをリリースしました。この製品はAIネイティブ混合検索をサポートしており、ベクトル、全文、スカラー、空間地理データの統一混合検索が可能です。また、多くの主要なAIフレームワークと互換性があります。AIアプリケーションのエンジニアリングのハードルを低下させ、開発効率を向上させる目的で設計されています。

image.png

【AiBase要約:】

✨ OceanBaseが初のAIデータベースseekdbをリリースし、AIネイティブ混合検索能力を実現。

🚀 ベクトル、全文、スカラー、空間地理データの統一混合検索をサポート。

🔧 即時使用可能で、30種類以上の主要AIフレームワークと互換性があり、AIアプリケーションのエンジニアリングのハードルを下げます。

5. 国産AIモデルKimi K2がPerplexityに接続成功、重要な一歩を踏み出しました

記事では、国産AIモデルKimi K2が世界的なAI検索アプリPerplexityに成功裏に接続され、唯一接続した中国モデルであることが紹介されています。これは中国のAI技術が国際舞台でさらに認知されるようになったことを示し、OpenAIのGPT-5.1と同様に接続されたことで、中国モデルの強力な競争力を示しています。Perplexityは急速に成長しているAI検索アプリで、大量のユーザーと高い評価を持っています。Kimi K2は月の暗面がリリースした最新のオープンソース混合専門大規模モデルであり、非常に高性能で広範囲な応用が可能です。

image.png

【AiBase要約:】

🌟 Kimi K2 ThinkingモデルがPerplexityに成功裏に接続され、唯一の中国モデルとなりました。

📈 Perplexityはわずか2年で3,000万ユーザーを獲得し、評価額は200億ドルを超えています。

🚀 Kimi K2は最新のオープンソース混合専門大規模モデルで、非常に大きな応用可能性があります。

6. グーグルDeepMindがSIMA 2をリリース:複雑な3D仮想世界を制覇する新たな汎用エージェント

グーグルDeepMindはSIMA2をリリースしました。これはGeminiモデルを基盤とした汎用エージェントで、複雑な3Dゲーム世界でのパフォーマンスをテストすることを目的としています。SIMA2は言語指示だけでなく、音声、グラフィック、絵文字も処理でき、自己学習によって進化し続けます。タスク完了率は62%まで上昇し、人間プレイヤーのレベルに近づいています。

image.png

【AiBase要約:】

🌟 SIMA2はGemini2.5Flash Liteモデルを統合し、推論と計画能力を向上させています。

📈 タスク完了率が62%まで上昇し、人間プレイヤーのレベルに近づき、性能が大幅に改善されました。

🛠️ 自己改善メカニズムとGenie3環境生成を通じて、適応能力和汎用性を示しています。

詳細リンク:https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

7. ElevenLabsの爆発的なアップデート:画像、動画、音楽を一度に生成

ElevenLabsは新しいImage & Videoプラットフォームをリリースしました。このプラットフォームは画像生成、動画生成、音声合成、音楽制作、サウンドデザインを統合し、AIコンテンツ工場として一括で運用することが可能です。このプラットフォームは世界中のトップマルチモードモデルを統合し、クリエイターとマーケティング担当者向けに深く最適化されており、コンテンツ生産の効率と質を向上させます。

image.png

【AiBase要約:】

🖼️ 新プラットフォームは画像生成、動画生成、音声合成、音楽制作、サウンドデザインを統合し、一括でAIコンテンツ制作が可能です。

🔊 世界中のトップマルチモードモデルを統合し、Google Veo、OpenAI Soraなども含まれており、視覚と聴覚の効果を向上させます。

💼 商業用途向けに最適化され、多様な比率出力、多言語ナレーション、音画同期調整をサポートし、広告配信に適しています。

詳細リンク:https://elevenlabs.io/image-video

8. 昆崙万維が軽量型マルチモードエージェントSkywork R1V4-Liteをリリースし、スマートインタラクションの新時代を開きます

昆崙万維がリリースしたSkywork R1V4-Liteは、視覚操作、推論、計画能力を統合した軽量型マルチモードエージェントです。この製品は、画像操作、外部ツール呼び出し、マルチモードの深い研究を自動的に行い、複雑なシナリオにおける応用の柔軟性を大幅に向上させます。ユーザーは写真を1枚撮るだけで、システムが自動的にタスクを完了し、複雑なプロンプトが必要ありません。

image.png

【AiBase要約:】

📸 Skywork R1V4-Liteは視覚操作能力を持ち、空間位置の判断やぼやけた文字の拡大などを行うことができます。

🔍 マルチモード理解ベンチマークテストで優れた性能を示し、跨モード推論と知識拡張能力が強力です。

💡 インターネット検索とアクティブなタスク計画をサポートし、実行可能なタスクチェーンを生成して正確な解決策を提供します。

詳細リンク:https://github.com/SkyworkAI/Skywork-R1V