语音交互领域迎来里程碑式突破!国内AI公司阶跃(Step Audio)近日震撼开源了一款



语音交互领域迎来里程碑式突破!国内AI公司阶跃(Step Audio)近日震撼开源了一款


AI编程进入语音交互时代,Anthropic为开发者工具Claude Code引入语音模式,支持通过语音指令执行复杂编程任务,目前已在Windows平台推出。
OpenAI推出两项API更新,提升AI智能体在语音交互与复杂任务中的性能。全新实时模型gpt-realtime-1.5及配套音频模型,显著提高语音命令可靠性。内部测试显示,新模型在数字字母转录准确率上提升约10%,逻辑音频任务准确率提高5%,指令执行准确率提升7%。
OpenAI正整合团队重构音频AI系统,计划2026年推出音频优先设备,押注语音交互成为后屏幕时代核心。
Pinterest推出AI购物助手,周四起逐步上线。用户可通过语音对话获取个性化时尚搭配建议,助手基于用户收藏和当前图片推荐商品,并以语音简述结果。CEO称此举旨在提升互动体验,目前仅支持语音输入。
就在各家AI大模型竞相迭代之际,一家备受瞩目的人工智能初创公司Anthropic正悄然酝酿着一项重大升级——为旗下AI聊天机器人Claude赋予“说话”的能力。Anthropic首席产品官迈克・克里格(Mike Krieger)近日向英国《金融时报》透露,公司正积极探索一系列全新的用户体验,让用户能够直接通过语音与强大的Claude AI模型进行交流。克里格指出,随着Claude的应用场景不断拓展,尤其是在桌面端,语音交互有望成为一种更加自然和高效的用户界面。“我们正在深入研究桌面端的Claude如何进一步发展