【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用について理解を深めるお手伝いをします。

最新のAI製品はこちらからご覧ください:https://top.aibase.com/

1.昆侖万維がAI短編ドラマ制作向け初のオープンソースビデオ生成モデルSkyReels-V1を発表

昆侖万維は、AI短編ドラマ制作向けの初のビデオ生成モデルSkyReels-V1とその表情・動作制御アルゴリズムSkyReels-A1のオープンソース化を発表しました。これは、既存モデルの高コストと使いにくさを解決することを目的としています。この革新は、AI短編ドラマ業界の発展を促進し、より高品質な映像コンテンツ生成能力を提供します。SkyReels-V1は高品質なデータでトレーニングされており、人物の演技を緻密に制御し、様々な表情と動作の組み合わせをサポートすることで、ビデオのリアリティと表現力を向上させています。

【AiBase要約:】

🎥 SkyReels-V1は、中国初のオープンソースAI短編ドラマビデオ生成モデルで、33種類の表情と400種類以上の動作の組み合わせをサポートします。

🤖 SkyReels-A1は、SOTAレベルの表情・動作制御アルゴリズムで、高精度の微表情再現を実現します。

🌐 昆侖万維はオープンソース技術に注力し、AI短編ドラマ業界の革新と発展、制作コストの削減を目指しています。

詳細リンク:https://github.com/SkyworkAI/SkyReels-V1

2.xAIの強力なモデルGrok3を発表:GPT-4oを凌駕、計算能力は10倍向上

xAIは月曜日に最新の主力AIモデルGrok3を発表し、同社の人工知能分野における重要な進歩を示しました。Grok3の計算能力は前バージョンGrok2と比べて10倍向上し、画像を分析して質問に答えられるだけでなく、複数のベンチマークテストでOpenAIのGPT-4oを上回りました。新しい機能DeepSearchにより、ユーザーは詳細な情報分析を迅速に取得できるようになり、Grokの応用性をさらに高めています。今後、音声モードも追加される予定で、ユーザーにより豊かな体験を提供すると予想されます。

image.png

【AiBase要約:】

🧠 Grok3はxAIが発表した最新のAIモデルで、計算能力は前バージョンと比べて10倍向上しています。

📈 Grok3は画像を分析して質問に答えられ、複数のベンチマークテストでGPT-4oを上回っています。

🔍 新しく追加されたDeepSearch機能は、詳細な情報分析を提供し、ユーザーが迅速に情報を取得できるようにします。

3.階躍が130Bパラメーターの圧倒的な音声モデルをオープンソース化、リアルタイム会話+感情クローンで衝撃的登場

階躍(Step Audio)は最近、1300億パラメーターの音声モデルをオープンソース化し、音声インタラクション分野における大きなブレークスルーを達成しました。このモデルは音声理解と生成制御能力を組み合わせ、強力な多言語サポートと方言認識を示し、パーソナライズされた音声インタラクション体験を実現します。さらに、感情制御と音声クローン機能により、ユーザーにより豊かなインタラクションの可能性を提供し、将来の音声AIがよりスマートで自然になることを示唆しています。

【AiBase要約:】

🚀 このモデルは、音声理解と生成制御を統合した業界初のリアルタイム音声会話システムで、強力な制御能力を備えています。

🌍 中国語、英語、日本語、広東語、四川語など、複数の言語と方言をサポートし、クロスリンガルのコミュニケーションを容易にします。

🎶 音声クローンと感情制御機能を備えており、ユーザーは音声の感情的なトーンを自由に設定し、パーソナライズされた音声アシスタントを作成できます。

詳細リンク:https://github.com/stepfun-ai/Step-Audio/tree/main

4.最高の効果!階躍星辰がStep-Video-T2Vビデオ生成モデルをオープンソース化

本日、階躍星辰と吉利汽車集団は、2つのオープンソースのマルチモーダル大規模モデルを発表しました。特にStep-Video-T2Vビデオ生成モデルは、300億パラメーターでビデオ生成分野で卓越した能力を示しています。このモデルは高品質なビデオ生成において優れたパフォーマンスを示すだけでなく、指示を正確に理解し、様々なレンズの動きをサポートし、生成された映像は現実的で物理法則に合致しています。開発者は躍問アプリでこのモデルを試用し、フィードバックを提供して技術の進歩に貢献できます。

image.png

【AiBase要約:】

🌟 Step-Video-T2Vモデルは300億パラメーターを備え、204フレーム540P解像度のビデオを生成し、世界をリードする性能を誇ります。

🎨 モーションの滑らかさと美しさにおいて優れたパフォーマンスを示し、既存のオープンソースビデオモデルを凌駕しています。

📱 2つのモデルは躍問アプリで公開されており、開発者は試用して提案を提供し、技術開発を促進できます。

詳細リンク:https://github.com/stepfun-ai/Step-Audio

5.AIの才女、羅福莉が新しい職場で勤務開始

95後世代のAI天才少女、羅福莉は最近、新しいキャリアをスタートさせました。具体的な企業情報はまだ明らかになっていませんが、小米科技の雷軍氏から数千万の年収で招聘されたことで大きな注目を集めました。羅福莉は北京大学で計算言語学の修士号を取得した後、阿里巴巴達摩院やDeepSeekなどの企業で豊富な研究経験を積みました。

【AiBase要約:】

✨ 羅福莉は新しい仕事を開始しました。具体的な企業はまだ発表されていません。

💰 雷軍氏は羅福莉氏に数千万の年収で小米チームへの参加を依頼しました。

📈 DeepSeek-V2モデルのコストパフォーマンスは、羅福莉氏によって「コストパフォーマンスの王者」と呼ばれています。

6.小型モデル+大型モデルの協調!秘塔AI検索が浅層研究「Shallow Research」機能を発表

秘塔網絡科技有限公司は2025年2月18日、AI技術を活用して情報を迅速に収集・分析し、研究効率を向上させることを目的とした新機能「浅層研究」を発表しました。この機能は小型モデルと大型モデルの協調アーキテクチャを採用し、短時間で数百のウェブページの検索と分析を完了し、研究時間を大幅に短縮します。現在はまだ浅層研究段階ですが、ユーザーに予備的な分析結果を提供しており、AIの情報処理における可能性を示しています。

image.png

【AiBase要約:】

🧠 小型モデルと大型モデルの協調アーキテクチャを採用し、研究効率を向上させています。

⏱️ 2~3分以内に数百のウェブページの検索と分析を完了できます。

📈 今後はコード実行や数値解析などの機能を追加し、研究を深化させる予定です。

7.HYBE傘下のAI音声ツールSupertone Playが登場:10秒で音声クローン作成

HYBE傘下のSupertoneは、「Supertone Play」というテキスト読み上げツールを発表しました。これは、クリエイターに高品質で表現力豊かなオーディオコンテンツを提供することを目的としています。このツールは英語、韓国語、日本語に対応しており、今後スペイン語と中国語にも対応する予定です。Supertone Playは150種類の音声キャラクターを備えており、様々な創作ニーズに対応できます。また、音声クローン機能も備えており、ユーザーは自分の声でパーソナライズされたキャラクターを作成し、感情やトーンを調整できます。

image.png

【AiBase要約:】

🎙️ Supertone Playは複数の言語に対応し、クリエイターが使用できる150種類の音声キャラクターを提供します。

🔒 このツールは、技術の悪用を防ぐため、音声認証コードや不可聴ウォーターマークなどのセキュリティ対策を備えています。

🌍 ベータテスト段階で、このツールは80カ国以上で広く使用されており、ユーザーは生成されたコンテンツを積極的にダウンロードしています。

詳細リンク:https://play.supertone.ai/

8.騰訊電子簽がAI契約作成機能をリリース予定

騰訊電子簽の公式アカウントは最近、混元とDeepSeekの大規模モデル技術を活用したAI契約作成機能のリリースを発表しました。これは、ユーザーに便利な契約作成と管理サービスを提供することを目的としています。AIを使用することで、小王は簡単にルームシェア契約を作成し、必要な条項を追加できます。一方、小李はサプライヤー契約の潜在的なリスクを迅速に確認できます。法務担当者の老張も、契約を効率的に管理し、情報の紛失を防ぐことができます。この機能は、契約処理の効率性と正確性を大幅に向上させるでしょう。

image.png

【AiBase要約:】

🤖 AIはワンクリックで契約を作成し、作成プロセスを簡素化し、ユーザーの操作難易度を下げます。

🔍 AIはリスクスキャンアシスタントとして、契約における潜在的な不利な条項を迅速に特定します。

📂 AIはインテリジェントな契約管理を実現し、ユーザーが重要な情報を迅速に見つけ、契約の「紛失」を防ぐのに役立ちます。

9.深圳福田区、広州市で「AI公務員」が登場:DeepSeek大規模モデルを導入

深圳市福田区と広州市は、DeepSeek大規模モデルに基づいた「AI公務員」を相次いで導入し、スマート行政建設の重要な進歩を示しました。福田区で導入されたAIデジタル従業員は、すでに240の業務シナリオを網羅し、行政サービスの効率を大幅に向上させ、パーソナライズされたカスタマイズ生成時間は大幅に短縮され、審査時間は90%削減されました。広州市もDeepSeekに基づいたスマート行政システムの構築を進めており、AI技術が行政サービスの最適化における可能性を示しています。

【AiBase要約:】

🚀 福田区はAIデジタル従業員を導入し、240の業務シナリオを網羅し、行政サービスの効率を向上させています。

⏱️ パーソナライズされたカスタマイズ生成時間は5日から数分に短縮され、審査時間は90%削減されました。

🌐 広州市はDeepSeekに基づいたスマート行政システムを構築し、デジタル化による新たな原動力の構築を推進しています。

10.網易有道が国内初のAIネイティブ学習ハードウェアSpaceOneを発表、DeepSeek-R1を搭載

網易有道は2月18日、大規模モデルの能力を深く統合した国内初のAIネイティブ教育ハードウェアである、革新的な学習ハードウェア「全面表示解答辞書ペンSpaceOne」を発表しました。「草稿紙式推演」を中核として、従来の解法ツールを凌駕し、全種類の深層解説を提供し、数学、物理、化学など複数の科目を網羅し、学習効率を大幅に向上させます。

image.png

【AiBase要約:】

🖊️ SpaceOneはDeepSeek-R1推論モデルを搭載し、視覚的なステップバイステップで問題を分解し、教師の思考プロセスをシミュレートし、10の主要科目を網羅しています。

📱 スライド式ボディと4.4インチの目に優しい全面表示を採用し、縦表示の効率が350%向上し、学習インタラクション体験が最適化されています。

🌐 7800万語の語彙とモバイル4Gモジュールを内蔵し、100種類の言語の相互翻訳をサポートし、地域的な教育資源の制限を突破しています。

11.OpenAI共同創業者の新興企業SSIが10億ドル超の資金調達、評価額は300億ドル超

OpenAIの共同創業者であるイリヤ・スツケベール氏は、新興企業「セーフ・スーパーインテリジェンス(SSI)」で10億ドル以上の資金を調達し、評価額は300億ドルを超え、世界で最も価値のある非公開テクノロジー企業の1つとなりました。SSIは安全なAIシステムの開発に特化しており、まだ収益を上げていません。最初の製品はセーフ・スーパーインテリジェンスになる予定です。スツケベール氏は、複雑な製品競争に参加せず、外部の圧力を完全に遮断することを強調しました。

【AiBase要約:】

🌟 SSIは10億ドル以上の資金調達を行い、評価額は300億ドルを超えています。

🚀 同社は安全なAIシステムの開発に特化しており、現在はまだ収益を上げていません。

🤖 スツケベール氏は、同社の最初の製品はセーフ・スーパーインテリジェンスであり、その他の事業は当面保留すると述べています。

12.OpenAIがマスコミなどの敵対的買収を防ぐため特別議決権を検討

OpenAIは、特に億万長者のマスク氏からの脅威など、潜在的な敵対的買収に対処するために、非営利理事会に特別な議決権を与えることで会社の支配権を保護する方法を探っています。この戦略は、営利企業への転換後も、OpenAIがその中核的な使命の独立性を維持できるようにすることを目的としています。

【AiBase要約:】

🌐 OpenAIは、潜在的な敵対的買収から理事会の支配権を守るために、特別議決権を与えることを検討しています。

🤖 この動きは主に、営利企業への転換後も、会社の核心使命の独立性を維持するためです。