OpenAIの音声APIの大進化：数字の転写がより正確に、代理速度が40%も向上

OpenAI は最近、世界中の開発者向けに2つの重要なAPIの更新をリリースしました。これらの更新により、AIエージェントの音声インタラクションおよび複雑なタスクフローにおけるパフォーマンスが大幅に向上します。

モデル面では、新規のリアルタイムモデルgpt-realtime-1.5とその対応するオーディオモデルが登場しました。このモデルの主な目的は、音声コマンドの信頼性を高めることです。OpenAIの内部テストデータによると、新しいモデルは数字やアルファベットの転記精度が約10％5％7％

アーキテクチャ面では、Responses APIは現在、WebSocketプロトコルをサポートしています。これはAI通信モードの大きな変化を示しています。従来の方法では、各リクエストごとに完全なコンテキストを再送信する必要がありました。一方で、WebSocketは開発者が永続的な接続を確立できるようにし、システムは新しいデータが生成されたときにのみ増分的に送信します。

OpenAIは、頻繁に大量のツールを呼び出す複雑なAIエージェントにとって、この改善が特に重要であると指摘しています。これにより、実行速度が直接

コデックスの自己蒸留プレイが人気！OpenAIの従業員が効率的で時間を節約できるAIアシスタントのヒントを明らかにする

OpenAIのプログラマーVB氏が、Codexの自己蒸留テクニックを公開。簡単なプロンプトで履歴をスキャンし、繰り返しの手動作業を特定して再利用可能なツールに変換し、効率を大幅に向上させる。ユーザーからのフィードバックを受け、VB氏はプロンプト2.0版を迅速にリリースし、機能をさらに最適化した。....

OpenAIの推論モデルが80年間の難問を自力で解決：研究アシスタントから科学発見者へ

OpenAIの汎用推論モデルは人間の指導なしに、組み合わせ幾何学分野で80年以上学界を悩ませてきたエルデシュ単位距離予想を独立して解決しました。この問題は1946年に数学者エルデシュによって提示され、平面上のn個の点の間に最大何ペアの距離が1になるかを探究するものでした。

OpenAIの広告ビジネスの転換：豪華クラブから離れ、中小企業を抱きしめる

OpenAIはChatGPTの広告事業で戦略転換。当初はAdobeやFoxなどの大手ブランドに限り、最低20万ドルのVIP戦略を取っていたが、一般向けで効果重視のモデルへ移行。広告参入障壁を大幅に下げ、誰でもセルフサービスで利用可能に。これにより、GoogleやMetaなど大手との本格競争に突入。....

コリン・フレイムが正式にOpenAIに加わり、首席マーケティング責任者に就任

ServiceNowとSalesforceの元マーケティング幹部コリン・フレミング氏がOpenAIの最高マーケティング責任者に就任。豊富な企業向けマーケティング経験と元プロレーサーという多様な背景を持ち、OpenAIの可能性を拡大する役割を担う。....

OpenAIの音声APIの大進化：数字の転写がより正確に、代理速度が40%も向上

関連推奨

コデックスの自己蒸留プレイが人気！OpenAIの従業員が効率的で時間を節約できるAIアシスタントのヒントを明らかにする

OpenAIの推論モデルが80年間の難問を自力で解決：研究アシスタントから科学発見者へ

OpenAIの広告ビジネスの大転換：20万ドルの前払いを中止し、全面的に街中の店を積極的に受け入れる

OpenAIの広告ビジネスの転換：豪華クラブから離れ、中小企業を抱きしめる

コリン・フレイムが正式にOpenAIに加わり、首席マーケティング責任者に就任