Cerebras推出"世界最快"AI推理服務，挑戰Nvidia主導地位

人工智能計算初創公司Cerebras Systems Inc.正式推出其號稱"世界上最快的人工智能推理服務"，這一舉措無疑是對行業巨頭Nvidia Corp.的直接挑戰。Cerebras首席執行官安德魯·費爾德曼表示，新服務旨在以更快的速度和更低的成本完成AI推理任務，迴應了市場對高效推理解決方案日益增長的需求。

Cerebras的"高速推理"服務建立在其強大的WSE-3處理器之上。這款處理器擁有超過900，000個計算核心和44GB板載內存，其核心數量是單個Nvidia H100圖形處理單元的52倍。Cerebras聲稱，其推理服務速度可達每秒1，000個令牌，比使用Nvidia最強大GPU的同類雲服務快20倍。更引人注目的是，該服務的起價僅爲每百萬個代幣10美分，據稱比現有AI推理工作負載的性價比高100倍。

Cerebras推理服務提供三個訪問層級，包括免費服務、開發者層和企業級。開發者層通過API端點訪問，爲Llama3.18B模型提供每百萬代幣10美分的價格，而Llama3.170B模型則爲60美分。企業級則提供更多定製選項和專門支持，適合持續性工作負載。

多家知名機構已成爲Cerebras的早期客戶，包括葛蘭素史克公司、Perplexity AI Inc.和Meter Inc.等。DeepLearning AI Inc.的創始人Andrew Ng博士對Cerebras的快速推理能力給予高度評價，認爲其對於需要反覆提示大語言模型的代理AI工作流程特別有幫助。

除了推理服務，Cerebras還宣佈了多項戰略合作伙伴關係，旨在爲客戶提供全方位的AI開發工具。合作伙伴包括LangChain、LlamaIndex、Docker Inc.、Weights & Biases Inc.和AgentOps Inc.等。此外，Cerebras的推理API與OpenAI的聊天完成API完全兼容，這意味着現有應用程序可以輕鬆遷移到其平臺。

Cerebras 推理 API 全面開放，開發者每日獲百萬免費 Token

2025年6月2日，人工智能芯片公司 Cerebras Systems 宣佈，其推理 API 現已對所有開發者全面開放，取消了此前的等待名單限制。這一舉措標誌着 Cerebras 在加速生成式 AI 應用開發方面邁出了重要一步，爲全球開發者提供高效、快速的 AI 推理服務。據 Cerebras 官方聲明，開發者每日可免費獲得100萬個 Token 的使用額度。這一免費配額爲開發者提供了充足的資源，用於構建和測試基於 Cerebras 推理平臺的高性能 AI 應用。Cerebras 表示，其推理 API 在速度上顯著優於傳統 GPU 解決方案，推理速度可達 GPU 的20

Cerebras 加速擴張六座數據中心，令推理速度提升十倍！

Cerebras Systems 近日宣佈將在北美和歐洲新建六座數據中心，以提升其人工智能（AI）推理能力。這一舉措將大大增強公司的算力，支持各類 AI 應用的發展。根據計劃，85% 的計算能力將集中在美國，其中已有三座設施在加州的聖克拉拉、斯托克頓和德克薩斯州的達拉斯投入運營。接下來，新中心將分別在明尼阿波利斯(預計2025年第二季度)、俄克拉荷馬城和蒙特利爾(預計2025年第三季度)，以及亞特蘭大和法國(預計2025年第四季度)開張。圖源備註：圖片由AI生成，圖片授權服務商Midjourney新數據中

AI芯片公司Cerebras與Mistral合作，聲稱創速度紀錄超DeepSeek

人工智能芯片公司 Cerebras Systems 於本週四宣佈與法國開源 AI 技術公司 Mistral 達成合作，並幫助後者創造了新的速度記錄。Mistral 旨在與 Meta 和中國的 DeepSeek 等開源競爭對手抗衡，這些公司在上個月憑藉低成本和卓越性能的技術震動了全球市場。這三家公司都在與 ChatGPT 的開發者 OpenAI 展開競爭。圖源備註：圖片由AI生成，圖片授權服務商Midjourney在此次合作中，Mistral 推出了一款名爲 “Le Chat” 的應用，聲稱其能夠以每秒1000個字的速度迴應用戶提問。Cerebras 表示，它爲這一成果提供了計算能

號稱全球最快AI推理服務問世！速度提升20倍成本極低

Cerebras Systems推出Cerebras Inference，宣稱這是全球最快的AI推理服務，性能超越基於GPU的傳統系統20倍，成本效益顯著提高，特別適用於處理大語言模型（LLMs）。其8B版本每秒處理1800個token，70B版本則爲450個token，速度和性價比遠超NVIDIA GPU解決方案。Cerebras Inference在保持行業領先準確度的同時，價格僅爲每百萬個token10美分至60美分，相比GPU產品提升100倍。這項服務特別適合構建需要複雜實時性能的下一代AI應用，如智能代理和智能系統，並提供免費、開發者和企業三個層次的服務，滿足不同需求。Cerebras Inference的核心技術基於Cerebras CS-3系統，搭載業界領先的Wafer Scale Engine3（WSE-3），提供遠超NVIDIA H100的內存帶寬。此服務不僅推動了AI計算領域的革新，還在醫療、能源、政府、科學計算和金融服務等多個行業中發揮關鍵作用，引領AI技術發展。

戴爾科技在印度推出生成式 AI 基礎課程及職業認證

戴爾科技在印度加速AI技能培訓，推出生成式AI基礎課程及職業認證，旨在幫助專業人士掌握AI和機器學習知識，推動企業轉型。前250名註冊參加技術論壇者可獲得戴爾認證。課程覆蓋AI治理與安全，並與多家機構合作，將AI應用於醫療、交通等領域。與NVIDIA合作推出端到端AI解決方案，預計可釋放4.4萬億美元經濟影響力。