百度AI Dayのオープンデーで、百度スマートクラウドは世界初のAIデジタル従業員を発表しました。これはマーケティングマネージャー、返済アシスタント、自動車販売担当者、プロモーションスタッフ、製品マネージャー、コースコンサルタント、採用担当者など、主要な業務職種をカバーしています。これらのデジタル従業員は、百度スマートクラウドが持つ先進的なAIエコシステムの能力を活用し、大規模モデル、デジタル人間技術、および業界のノウハウを深く統合しており、開封してすぐに使用でき、就労後も即座に業務に対応できます。垂直業界の業務シーンを正確に支援しながら、同時に職務能力を継続的に蓄積することができ、企業向けのスマートサービス能力を「業務を理解し、結果を出す、進化できる」三大特性によって再定義し、企業にとって信頼できるデジタル業務パートナーとなることを実現します。
オープンデーで、百度副社長の阮瑜氏が講演し、大規模モデルの能力がかつてない速さで進化・改善されており、その能力の境界も広がっていると語りました。大規模モデルメーカーは、マルチモーダルの大規模モデルの能力を基盤として、世界モデルを登場させ、物理世界の動的モデリング、因果推論や反事実推論、長期予測と計画などの独自の能力を構築しています。大規模モデルの急速な進化により、AIは人間と協働するコピロットの形から、自主的に実行可能なエージェントの形へと進化し、さらにAI主導のAgentic(エージェンティック)方向へ深化しています。Agentic時代には、日常業務の中で新たな「労働者」が増えていき、スマートエージェントは「デジタル従業員」として企業運営のあらゆる側面に参加するようになります。デジタル従業員は生産単位として、組織の生産性に革命的な変化をもたらしています。
石峥氏は、現在企業が必要としているのはKPIを担うことで、業務結果を責任持って果たせるエージェントであると語りました。百度スマートクラウドは、客悦スマートカスタマーサービスの10年にわたる対話能力の蓄積と、曦霊デジタル人間の7年にわたる技術の蓄積を深く融合しています。大規模モデルに基づくエージェントアーキテクチャは、端から端までのスマートインタラクションだけでなく、継続的な業務最適化と成果生成を駆動し、国内で最初のAIデジタル従業員を構築し、機能実行から業務意思決定、成果提供への質的変化を実現しました。
採用業界では、人工によるオファーのコミュニケーション量が多く、繰り返し作業が頻繁に行われており、時間がかかり、手間がかかり、また手順が複雑すぎてミスが起こりやすいです。採用コンサルタントは、AI製品分野のポジションマッチングに長年焦点を当てており、ダイヤルバックでのオファー、面接スケジュールの作成、結果の通知のすべてのフローを完璧に実行しています。会話中に相手の意図を敏感に感じ取り、リアルタイムで話術戦略を調整し、面接参加率を40%向上させ、HRが核心人材評価に集中できるようにしています。
教育トレーニング業界において、コースコンサルタントが「就業」すると、前期の募集相談、サービスフォローアップから後期の継続料金支払いまでを一括して管理できます。繰り返し作業を担当することができます。サービスの面では、7×24時間オンライン応答を行い、募集相談を正確に受けることができます。リードフォローアップの段階では、スマートアルゴリズムで大量のリードをスクリーニングし、分級処理することで、沈黙中のリードを効果的に活性化します。継続料金の転換段階では、過去の対話記録を抽出し、自動的にフォローアップリマインダーをトリガーし、機関の運営効率を大幅に向上させ、教育コンサルタントが高価値の転換に集中し、従業員の効率が40%向上します。
現在、百度スマートクラウドのデジタル従業員は、百度カスタマーセンターのオンライン分流コミュニケーションとスマートサービスフィードバックにまず導入されています。データによると、デジタル従業員は7x24時間の効率的な顧客問い合わせの処理を実現し、ユーザーの保険申込成功率が60%上昇し、サービスのタイムリーさが18時間向上しています。業界の将来について語った石峥氏は、人機協働が現在の主流傾向であり、将来的には複雑なタスクを解決するための複数のデジタル従業員の協働が可能になると考えています。
デジタル従業員が持つ「業務を理解し、結果を出す、進化できる」強力な効能は、百度スマートクラウドのAIエコシステムの深い蓄積に根ざしています。デジタル従業員の核心技術の壁は、「知能の脳」「本物のような外見」「業界特化の核」「進化型の遺伝子」の4つのアップグレードであり、これらはAIがツールからビジネスパートナーへ進化するスピードを加速させています。
「知能の脳」:エンドツーエンドの音声・言語大規模モデルにより、業務の閉ループを駆動します。言語の相互作用において、百度スマートクラウドは業界で初めてクロスアテンション技術を基盤としたマルチモーダル音声言語大規模モデルを考案し、無感覚の遅延通信、自然な中断、スムーズな会話を実現し、本物のようなインタラクティブ体験を提供します。また、百度スマートクラウドは音声認識、大規模言語モデル、音声合成などの技術を統合し、デジタル従業員が極めて短時間で理解し、適切な感情とフィードバックを出力することができ、業務プロセスの自主的な判断と閉ループ実行を実現します。音声認識の精度は98%に達し、会話の遅延は1秒以内にまで減少しています。
「本物のような外見」:映画レベルの外見と表現により、業務の信頼感を構築します。顔の描写においても、百度スマートクラウドは業界をリードしています。国内で初めての4Dスキャン技術を使用し、高精度の頂点流データを取得し、1,000以上の制御次元を用いて笑顔や思考などの顔面筋肉の動きを正確に再現し、映画レベルの素晴らしい映像を提供します。わずか30秒の音声素材で、高忠実度の音色を復元し、本物の音声に匹敵する自然さを持ち、デジタル従業員の外見が「形と神が共に備わっている」ことを実現します。
「業界特化の核」:SOPの蓄積と自進化により、職務専門家を作り出します。百度スマートクラウドのスマートマーケティング製品副総経理の張紅光氏は、デジタル従業員の専門的で熟練した業務能力は、業界の垂直シナリオにおけるSOPの深い蓄積と継続的な自律的進化の能力に根ざしていると語りました。一万時間の法則を参考に、百度スマートクラウドは10万時間を超える業界実務データでデジタル従業員の初期能力を訓練し、金融財務規範、教育・学習プロセス、自動車販売・生産知識など、100以上の垂直業界分野の専門的なSOPを蓄積しています。
「進化型の遺伝子」:自己進化可能な企業知識の遺伝子。さらに、百度スマートクラウドは自社開発のシミュレーション対話自動進化システムを通じて、業務ルールと業界規範を動的に統合し、繰り返し作業を職務能力に変換し、企業知識ベースの動的更新を実現します。大規模モデルの能力が加速して進化し、データトレーニングが継続して増加するにつれて、デジタル従業員の業務能力が継続的に進化し、企業が常に業界の前線にある専門的視点と能力を持つことができるようになります。