【AIニュース】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目コンテンツをお届けし、開発者に焦点を当てて技術トレンドや革新されたAI製品の応用を理解するお手伝いをします。

新鮮なAI製品クリックして詳細を確認https://top.aibase.com/

1、コンスン・ワンウェイがSkyReels-A3モデルを正式リリース:写真が音声に合わせて口を動かす

コンスン・ワンウェイグループが提供するSkyReels-A3モデルは、DiTビデオ拡散モデルに基づいており、音声駆動のデジタル人間の作成を実現しました。このモデルは静止画や動画の人間が音声内容に合わせて話したり歌ったりできるようにし、台詞の変更やカメラワークの制御などの機能もサポートしています。広告、ライブショッピング、音楽ミュージックビデオなどに効率的で使いやすいAI技術ソリューションを提供します。

image.png

【AiBaseの要約:】

📷 SkyReels-A3は静止画や動画の人間を音声に合わせて動かすことができます。

🎥 60秒までの単一シーンの動画出力に対応し、複数シーンには無限の長さが可能です。

🔄 8種類の事前設定されたカメラワークパラメータが用意され、強度を調整可能でプロ級のカメラワーク効果を実現します。

詳細リンク:https://skyworkai.github.io/skyreels-a3.github.io/

2、マスク社のxAIがGrok 4 AIモデルを永久的に無料で公開

xAI社はGrok4人工知能モデルを永久的に無料で公開すると発表しました。これはグローバルユーザーに先進的なAIツールを提供することを意味しています。

image.png

【AiBaseの要約:】

🤖 Grok4人工知能モデルはグローバルユーザーに永久的に無料で公開されます。

⚙️ AutoモードとExpertモードが用意されており、さまざまなユーザーのニーズに応えます。

🌐 無料公開によりAI技術の普及と応用が促進される可能性があります。

3、Open AIがGPT-5のプロンプトガイドを発表:AIプログラミングとマルチモーダルの新境界を開く

記事では、Open AIがリリースしたGPT-5モデルおよび公式プロンプトガイドについて詳しく紹介しています。特に複雑なタスク、プログラミング、マルチモーダルインタラクションでの向上点を強調しています。ガイドには最適化戦略として、推論の強さを調整したり、エージェントの行動傾向を制御したり、ツールの導入文を利用したりする方法が含まれており、ユーザーがGPT-5の潜在能力を最大限に引き出すお手伝いをします。

image.png

【AiBaseの要約:】

🧠 GPT-5は正確なプロンプト設計により、エージェントタスク、コード生成、指示遵守の性能を向上させました。

💻 フロントエンドインターフェースの生成、大規模コードベースのデバッグ、Responses APIとの連携によりコード生成効率を高めます。

🖼️ マルチモーダルインタラクション機能を導入し、テキスト、画像、音声処理およびカスタマイズ設定を含み、実用性を向上させます。

詳細リンク:https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide

4、百度検索PC版にAI検索機能が全面リリース

百度検索PC版に一連のAI機能が全面リリースされ、従来の情報入口がタスク中枢に変わりました。「スーパーインテリジェントダブル行ボックス」と「ワークステーション」モジュールが追加され、AI読解、AIライティング、AIプレゼンツールが統合されており、ユーザーの検索効率とオフィス体験を向上させています。同時に、百度AI検索の月間アクティブユーザー数は3億2200万人を超え、国内AI検索業界で第1位を維持しています。

image.png

【AiBaseの要約:】

🧠 百度検索PC版にAI機能が全面リリースされ、ユーザーの検索体験が向上しました。

🛠️ 新たに「ワークステーション」モジュールが追加され、AI読解、ライティング、プレゼンツールが統合されています。

📈 月間アクティブユーザー数は3億2200万人に達し、百度は国内AI検索業界で第1位を維持しています。

5、Windows 11 Copilotアプリが無料でGPT-5に対応、利用制限はChatGPTより緩和

マイクロソフトはWindows 11およびWindows 10内のCopilotアプリがGPT-5スマートモードを全面的にサポートしていることを発表しました。この機能はWebルーティング技術により実現され、ユーザーはアップデートを行うことなくスマートモードを有効化できます。また、利用制限はChatGPTよりも緩和されています。

image.png

【AiBaseの要約:】

🌟 CopilotはGPT-5スマートモードをサポートしており、ユーザー体験がスムーズです。

💬 ChatGPTと比較して、Copilotの利用制限がより緩やかで自由度が高くなります。

🖥️ ユーザーは簡単なステップでCopilotとGPT-5に無料アクセスでき、情報を簡単に取得できます。

6、OpenAIを上回る!百川スマートがオープンソース医療大規模モデルBaichuan-M2の能力が世界トップに

百川スマートがリリースしたオープンソース医療強化大規模モデルBaichuan-M2はHealthBench評価で60.1点を獲得し、OpenAIのgpt-oss120bモデルを上回り、国際的に他のオープンソース大規模モデルを凌駕しています。このモデルは極限的な軽量化処理を行い、単一カードでの展開が可能となり、医療機関のコストを大幅に削減しています。また、Baichuan-M2は複雑な医療問題の処理能力においてGPT-5と同等であり、大きな応用可能性を示しています。

image.png

【AiBaseの要約:】

🌟 HealthBench評価で60.1点を獲得し、世界の先進的なオープンソース医療モデルとなりました。

💡 モデルは軽量化処理が施され、単一カードでの展開が可能で、医療機関のコストを大きく削減します。

🚀 Baichuan-M2は複雑な医療問題の処理能力においてGPT-5と同等であり、広範な応用可能性を持っています。

詳細リンク:https://huggingface.co/baichuan-inc/Baichuan-M2-32B

7、アップルがGPT5をiOS 26に搭載:iOS 26にChatGPT5が統合

アップル社は来月リリース予定のiOS 26システムにChatGPT-5モデルを統合することを発表しました。これによりAppleインテリジェントの性能が顕著に向上し、リアルタイム翻訳やコンテンツ検索の最適化などの新機能が登場します。OpenAIアカウントがなくてもこれらの機能を使用できますが、アカウントを関連付けることでさらなる割引が受けられます。

image.png

【AiBaseの要約:】

🧠 ChatGPT-5はiOS 26に統合され、Appleインテリジェントの性能が向上します。

🌐 新たなリアルタイム翻訳機能により、言語間のコミュニケーション体験が改善されます。

💰 OpenAIアカウントを関連付けることでサブスクリプション割引が受けられ、より多くの選択肢が提供されます。

8、グーグルがBlenderFusionを発表:3Dビジュアル編集と生成合成の新しいフレームワーク

グーグルがリリースしたBlenderFusionは、3Dビジュアル編集と生成合成の能力を向上させるための革新的なフレームワークです。デザイナーとクリエイターにより直感的で効率的な創作ツールを提供します。

image.png

【AiBaseの要約:】

🎨 BlenderFusionは、先進的な3D編集ツールと拡散モデルを統合し、効率的な3Dビジュアル編集と生成合成を実現しています。

🛠️ このフレームワークのワークフローには、階層化、編集、合成の3つの段階があり、ユーザーは3Dオブジェクトを簡単に編集し、最終的な画像を生成できます。

📈 グーグルのBlenderFusionはモデルを最適化することで、複雑なシナリオの処理能力を向上させ、デザイナーの創造力を支援します。

詳細リンク:https://blenderfusion.github.io/

9、非常に小さなTTSモデルKitten TTS:パラメータ数がわずか1,500万

Kitten TTSはオープンソースの軽量テキストから音声への変換モデルで、パラメータ数がわずか1,500万で、サイズが25MB未満であり、あらゆるデバイスへの展開が可能です。GPUなしでも動作し、通常のCPUで高品質な音声合成が可能で、簡単なインストールと使用ガイドが提供されているため、ユーザーは素早く始めることができます。

image.png

【AiBaseの要約:】

🐱 Kitten TTSはオープンソースの軽量テキストから音声への変換モデルで、サイズが25MB未満で、あらゆるデバイスに適しています。

⚡ モデルはGPUなしでも動作し、通常のCPUで高品質な音声合成が可能です。

🚀 Kitten TTSは簡単なインストールと使用ガイドが用意されており、ユーザーはすぐに音声を生成できます。

詳細リンク:https://huggingface.co/KittenML/kitten-tts-nano-0.1

10、ミニガン4.0視覚モデルMiniCPM-V 4.0、スマホでの応用がスムーズ

MiniCPM-V4.0はMiniCPM-Vシリーズの最新バージョンで、視覚理解、複数の画像および動画処理において優れた性能を発揮し、OpenCompass評価で69.0の高いスコアを記録し、多数の同類モデルを上回りました。このモデルはモバイルデバイス向けに設計されており、反応速度が速く、過熱の問題がないだけでなく、多様な使用方法とオープンソースツールが提供されており、ユーザーが簡単に始められるようにしています。

image.png

【AiBaseの要約:】

🌟 MiniCPM-V4.0はOpenCompass評価で69.0を記録し、多数の同類モデルを上回りました。

📱 このモデルはモバイルデバイス向けに設計されており、反応速度が速く、過熱の問題はありません。

📚 オープンソースiOSアプリおよび詳細な使用ガイドが提供され、ユーザーが簡単に始められます。

詳細リンク:https://huggingface.co/openbmb/MiniCPM-V-4

11、Stripe報告:AI経済が急成長、収益速度がSaaSの3倍を超える

Stripeが発表した最新分析報告書では、AI経済の急速な発展が明らかにされており、収益成長速度、グローバル市場拡大、ビジネスモデルのイノベーションなどのトレンドが含まれています。報告書では、AIスタートアップ企業が収益目標に到達するスピードが過去の科技企業をはるかに上回っており、『天生のグローバル化』の遺伝子を持っていることが指摘されています。