記事本文

ステップスターレイヤーが「StepAudio 2.5 Realtime」を発表：大規模モデルに人のように感情と知性を付与

公開AI二ュ-ス

時間 :May 9, 2026

読む :1分

人工知能の急速な進化の波の中で、大規模モデルのインタラクティブ体験は「テキストでの会話」から「リアルタイムの感情交流」への質的変化を遂げています。5月8日、大規模モデル分野の先駆けであるステップスターライトが、その最新研究成果である次世代リアルタイム音声大規模モデルStepAudio 2.5 Realtimeを正式に発表しました。このモデルの登場は、中国製の大規模モデルが音声インタラクションの自然さと知能性において新たな段階へと進んでいることを示しています。

深層的な感知、インタラクティブ体験が「人間並み」の時代へ

従来の音声アシスタントと比べて、StepAudio 2.5 Realtime の最も重要な突破点は、強力な「人間並みの」深層的な認識能力です。これは単なる音声コマンドの認識にとどまらず、人の会話における微妙な感情や文脈の変化を鋭く捉えることができます。

技術の進歩により、このモデルは知能（IQ）と感情知能（EQ）の両方で飛躍的な進化を遂げました。会話中にユーザーのトーンや語速に応じて、より感情的に適切なフィードバックを提供することができるため、交流が単なる情報伝達ではなく、「人情味」のある深い対話となるのです。

柔軟なカスタマイズ、独自のAIキャラクターを作成

さまざまなシナリオに応じたニーズに対応するために、StepAudio 2.5 Realtime は非常に柔軟な「キャラクターのカスタマイズ」機能を導入しました。職場の専門的で落ち着いたアシスタントが必要なのか、それともユーモラスな会話相手が必要なのか、開発者やユーザーは実際のニーズに応じてAIに特定の性格特性や言語スタイルを付与することができます。このように個別化された能力は、教育、エンタメ、事務など多くの分野でのリアルタイム音声モデルの応用範囲を大幅に広げるでしょう。

フルリリース、中国製大規模モデルが市場に参入

現在、ステップスターライトはStepAudio 2.5 Realtime が正式にフルリリースされたことを発表しました。これは開発者やパートナーがすぐにこの最先端技術にアクセスして体験できるようになったことを意味します。

Claude エリートモデル Fable 5 が按需課金モードを開始、サブスクリプションユーザーの権利は制限される

Anthropicは7月7日より、最強モデルClaude Fable5を全サブスクリプションから削除し、従量課金制に移行すると発表。ProやMaxユーザーの週間使用枠（最大50%）が無効となり、ユーザー間で物議を醸している。....

Jul 3, 2026

376.6k

コードリファクタリングの不安を告別：アリババがPage Agentを開発し、大規模モデルがウェブページの基本的な論理を理解できるように

アリババがPage Agentをオープンソース化し、ブラウザ自動化の考え方が変わりました。これは大規模モデルがウェブページ構造を直接解析するもので、外部のスクリーンショットやプロトコル駆動に頼らず、変化にダイナミックに対応し、「新しいホイールを造る」課題を解決します。

Jul 3, 2026

330.6k

メイドゥーの大規模モデルエコシステムの調整：ダオバオの全面的な使用制限、自社開発のLongCatシステムの推進

メイドゥーは内部で字節傘下のダオバオの大規模モデルの使用を制限し、業務チームが呼び出し状況を自主的に確認するよう求めた。保持が必要な場合は、必要性の説明および移行計画を提出する必要がある。この動きは、メイドゥーが自社開発のAIソリューションへの傾斜を加速させていることを示しており、インフラストラクチャの選択が調整されている。

Jul 2, 2026

250.2k

性能が2倍以上向上：NVIDIAがNemotron-Labs-TwoTower拡散言語モデルを発表

NVIDIAがオープンソース化したNemotron-Labs-TwinTower拡散言語モデルは、「ツインタワー」アーキテクチャで自己回帰モデルの逐次デコードのボトルネックを打破。生成タスクを2つのサブネットワークに分割し、一方を凍結することで並列処理によるテキスト生成スループットを向上。大規模な合成タスクに効率的な新たな解法を提供。....

Jul 1, 2026

284.7k

知能代替のGPT-5？Qwen 3.6 27Bの評価ではローカルモデルが先端水準に達した

Qwen3.6シリーズは、ローカルLLMに妥協が必要という認識を覆す。MacBook Max M5 128GB上で27Bモデルを8ビットGGUF量子化で動作させ、驚異的な効率を実証。体験を犠牲にせず汎用知能を満たす強力なツールであり、ローカルLLMの新時代を告げる。....