相關推薦
ElevenLabs 發佈 Scribe 語音轉文本模型,準確率創新高、英語達 96.7%
ElevenLabs 是一家備受矚目的人工智能語音克隆與生成初創公司,近日推出了其最新的語音轉文本模型 ——Scribe v1。該模型聲稱在多種語言中都達到了最高的準確性,用戶可以通過其官網進行體驗。根據 ElevenLabs 的基準測試,Scribe 在將口語準確轉換爲文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低錯誤率。該公司表示,Scribe 支持99種語言的高精度轉錄,其中包括在以前被忽視的語言,如塞爾維亞語、粵語和馬拉雅拉姆語。ElevenLabs 的首席研究員 Fla
英偉達CEO黃仁勳: DeepSeek不會對公司銷售造成影響,銷量持續攀升
在近日的財報電話會議上,英偉達 CEO 黃仁勳對公司的未來展望依舊充滿信心,儘管上個月因中國的 DeepSeek 技術引發了一場市場恐慌。他表示,DeepSeek 的推出不會對公司的銷售造成影響。市場對 DeepSeek R1模型所需的芯片數量大幅減少的猜測,曾導致英偉達的股價出現了創紀錄的下跌。然而,黃仁勳在電話會議中稱讚 R1爲 “優秀的創新”,並強調這一類 “推理” 模型實際上對英偉達來說是個好消息,因爲這些模型需要更多的計算能力。他指出:“推理模型的計算需求可能會高達100倍,未來的
2025年AI大模型價格戰加劇,相關概念股受到資金追捧
近年來,人工智能(AI)大模型技術發展迅猛,隨之而來的降價潮使得市場競爭愈發激烈。根據數據寶的最新統計,2025年這一降價趨勢仍將持續。尤其是在過去的一段時間裏,字節跳動、阿里雲等企業紛紛宣佈降低旗下 AI 大模型的使用成本,引發了業界的廣泛關注。例如,字節跳動旗下的豆包大模型於去年12月宣佈降價,其視覺理解模型的價格降至0.003元 / 千 tokens,相較於行業平均價格降低了85%。同樣,阿里雲也在年末進行了大規模降價,通義千問視覺理解模型全線降價超過80%,最低僅需
微軟發佈 Phi-4 多模態與迷你模型,語音視覺文本處理再升級
近日,微軟進一步擴展了 Phi-4家族,推出了兩款新模型:Phi-4多模態(Phi-4-multimodal)和 Phi-4迷你(Phi-4-mini),這兩款模型的亮相,無疑將爲各類 AI 應用提供更加強大的處理能力。Phi-4多模態模型是微軟首款集成語音、視覺和文本處理的統一架構模型,擁有5600萬參數。這款模型在多項基準測試中表現優異,超越了目前市場上的許多競爭對手,例如谷歌的 Gemini2.0系列。在自動語音識別(ASR)和語音翻譯(ST)任務中,Phi-4多模態模型表現尤爲突出,成功擊敗瞭如 WhisperV3和 SeamlessM4T-v2-Large 等專業語音
大學老師說AI作文全判0分 網友:過度依賴造成思維惰性
近年來,隨着人工智能技術的迅速發展,AI 工具逐漸成爲大學生完成各類報告和論文的 “得力助手”。根據央視新聞的報道,部分高校教師和專家表示,利用 AI 生成內容的學生中,個別案例涉及不當行爲,如僞造研究數據、編輯實驗圖片和替代自主設計等,已構成學術不端。在某高校的作業羣中,一則通知引起了學生們的廣泛關注。老師明確指出,若學生提交使用 AI 直接生成的作文,將被判定爲零分。這一政策的出臺,旨在提醒學生重視學術誠信,反對依賴技術手段來完成學業。爲了應
