発音が不明確で学校でいじめを受けたベラルーシの少年が、AI音声トレーニングアプリによって多数のスタートアップコンペティションで優勝しました。これはヒューマンドラマのストーリーではなく、エストニアのスタートアップ企業Vocal Imageで実際に起きた出来事です。
Vocal Imageは360万ドルのシードファンドを調達し、フランスの教育テクノロジーベンチャーキャピタルであるEducapitalが主導し、エストニアのSpecialist VCとドイツのGenerations Fundが参加しました。この会社のミッションは単純ながらも深いものです:AI技術を使って世界中の人々の声やコミュニケーションスキルを改善すること。
CEOのニック・ラホイカの個人的な経験こそがこの製品の最良の広告になります。彼はベラルーシで生まれ、エストニアに移住してから英語を学び始めました。かつて発話不安障害に苦しんでいました。しかし、このような内向的な少年が後に自分の音声トレーニングスタートアップ企業を代表して多くのスタートアップコンペティションで勝利しました。

ラホイカはTechCrunchのインタビューで、「学校では、発音が不明確だったために一部のいじめに遭った」と語りました。20代前半の無力な若き起業家として、彼は声楽指導者マリナ・シュキウラワに出会いました。その指導者は、声やコミュニケーション能力は訓練によって改善できることを彼に教えたのです。
さらに多くの同じような悩みを持つ人々を助けるために、彼らはYouTubeチャンネルを作成しました。このチャンネルは最終的にVocal Imageへと進化しました。このサブスクリプション型アプリは、個人レッスンの安価な代替として位置づけられており、ユーザーが自宅で安全に練習できるようにしています。ラホイカは「変な動作や変な音を出しても、依然として安全であることができます」と述べています。
Vocal Imageには、舌切りや呼吸法の練習、ジェスチャーの提案などのインタラクティブなリソースが含まれています。さらに興味深いのは、共同創業者兼CTOのミカレ・カラリウスの推進により、このアプリはますますAI技術を活用して自動フィードバックやパーソナライズされたアドバイスを提供するようになっています。
これらのガイド付きトレーニングは、仕事に関連する目標を中心に展開されています。例えば、専門スキルやリーダーシップスキルの向上、プレゼンテーションや発表能力の発展などです。ただし、Vocal Imageは単に自信を高めたい人やLGBTQコミュニティの利用者もサポートしており、シュキウラワはベラルーシでこのグループの権利のために活動していました。
創業チームはベラルーシ出身ですが、多くのベラルーシの起業家と同じように、大統領アレクサンドル・ルカシェンコを倒すための抗議活動が失敗し、残酷な弾圧に遭った後、祖国を離れることを選択しました。ラホイカはエストニアを選び、そこでのビジネス環境を重視しました。その選択はスタートアップにとって正しいものでした。
タリンに移住した後間もなく、Vocal Imageは地元のアクセラレーターStartup Wise Guysに参加しました。同社はこの企業を「成功例」の一つとして見なし、急成長の勢いが理由です。ラホイカによると、このスタートアップはわずか100万ドル以下のプレシード資金で、年間經常収入650万ドルを達成しました。
今年8月時点でのこのスタートアップの年間經常収入は1200万ドルに達し、約5万人の有料ユーザーを保有しています。20人のチーム、その多くがベラルーシの亡命者であるVocal Imageは、開発チームを拡大し、現時点で提供されている英語、スペイン語、ドイツ語、フランス語、ウクライナ語、ロシア語に加え、より多くのローカルバージョンを展開する予定です。
このシリーズはタイミングよく、このスタートアップが最近Hugging Face、Meta、ScalewayによってヨーロッパAIスタートアッププロジェクトの5つの受賞者の中に入れたこと、そしてますます激化する競争に対峙していることも理由があります。例えば、教育テクノロジー企業Headwayは最近、Skiestaという社交スキルアプリにAI駆動の音声トレーニング機能を追加しました。しかし、Vocal ImageはGDPRに準拠したAIデータベースを持つことで、独自の強みを発揮できます。
毎日約3.5万回の録音を通じて、Vocal Imageはすでに100万を超える本物の音声サンプルを蓄積しています。それ以上に素晴らしいのは、これらの録音がVoice Rating機能によってコミュニティによってマークされており、これは協働機能であり、他の人の声が「自信がある」か「子供っぽい」かを判断することができるものです。
これは、Vocal Imageのようなアプリが求めるデータセットの種類であり、精度を向上させるために役立ちます。また、AIスタートアップ企業が人工音声を微調整するのに役立ち、この会社がB2Cの基盤以外にもさらなる成長機会を創出することができます。
