相关推荐
ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%
ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。该公司表示,Scribe 支持99种语言的高精度转录,其中包括在以前被忽视的语言,如塞尔维亚语、粤语和马拉雅拉姆语。ElevenLabs 的首席研究员 Fla
英伟达CEO黄仁勋: DeepSeek不会对公司销售造成影响,销量持续攀升
在近日的财报电话会议上,英伟达 CEO 黄仁勋对公司的未来展望依旧充满信心,尽管上个月因中国的 DeepSeek 技术引发了一场市场恐慌。他表示,DeepSeek 的推出不会对公司的销售造成影响。市场对 DeepSeek R1模型所需的芯片数量大幅减少的猜测,曾导致英伟达的股价出现了创纪录的下跌。然而,黄仁勋在电话会议中称赞 R1为 “优秀的创新”,并强调这一类 “推理” 模型实际上对英伟达来说是个好消息,因为这些模型需要更多的计算能力。他指出:“推理模型的计算需求可能会高达100倍,未来的
2025年AI大模型价格战加剧,相关概念股受到资金追捧
近年来,人工智能(AI)大模型技术发展迅猛,随之而来的降价潮使得市场竞争愈发激烈。根据数据宝的最新统计,2025年这一降价趋势仍将持续。尤其是在过去的一段时间里,字节跳动、阿里云等企业纷纷宣布降低旗下 AI 大模型的使用成本,引发了业界的广泛关注。例如,字节跳动旗下的豆包大模型于去年12月宣布降价,其视觉理解模型的价格降至0.003元 / 千 tokens,相较于行业平均价格降低了85%。同样,阿里云也在年末进行了大规模降价,通义千问视觉理解模型全线降价超过80%,最低仅需
微软发布 Phi-4 多模态与迷你模型,语音视觉文本处理再升级
近日,微软进一步扩展了 Phi-4家族,推出了两款新模型:Phi-4多模态(Phi-4-multimodal)和 Phi-4迷你(Phi-4-mini),这两款模型的亮相,无疑将为各类 AI 应用提供更加强大的处理能力。Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构模型,拥有5600万参数。这款模型在多项基准测试中表现优异,超越了目前市场上的许多竞争对手,例如谷歌的 Gemini2.0系列。在自动语音识别(ASR)和语音翻译(ST)任务中,Phi-4多模态模型表现尤为突出,成功击败了如 WhisperV3和 SeamlessM4T-v2-Large 等专业语音
大学老师说AI作文全判0分 网友:过度依赖造成思维惰性
近年来,随着人工智能技术的迅速发展,AI 工具逐渐成为大学生完成各类报告和论文的 “得力助手”。根据央视新闻的报道,部分高校教师和专家表示,利用 AI 生成内容的学生中,个别案例涉及不当行为,如伪造研究数据、编辑实验图片和替代自主设计等,已构成学术不端。在某高校的作业群中,一则通知引起了学生们的广泛关注。老师明确指出,若学生提交使用 AI 直接生成的作文,将被判定为零分。这一政策的出台,旨在提醒学生重视学术诚信,反对依赖技术手段来完成学业。为了应
