哈佛、哥大開源1600萬組蛋白質序列，解決AlphaFold 2訓練數據私有難題！

哈佛大學和哥倫比亞大學等研究機構發佈了名爲OpenProteinSet的開源數據集，包含1600萬個蛋白質多序列對齊（MSA）和相關數據。這一數據集的推出解決了DeepMind的AlphaFold 2訓練數據私有化的問題，爲生物信息學和蛋白質機器學習領域提供了重要支持。AlphaFold 2的蛋白質結構預測準確性引領了該領域，但其私有數據限制了其他研究者的進展。OpenProteinSet包含了所有蛋白質數據庫的蛋白質和各種UniProt集羣的數據，可用於廣泛的AI模型訓練。這一資源對於研究生物學、藥物研發等領域具有重要意義，將推動相關研究的發展。

AI芯片公司Cerebras與Mistral合作，聲稱創速度紀錄超DeepSeek

人工智能芯片公司 Cerebras Systems 於本週四宣佈與法國開源 AI 技術公司 Mistral 達成合作，並幫助後者創造了新的速度記錄。Mistral 旨在與 Meta 和中國的 DeepSeek 等開源競爭對手抗衡，這些公司在上個月憑藉低成本和卓越性能的技術震動了全球市場。這三家公司都在與 ChatGPT 的開發者 OpenAI 展開競爭。圖源備註：圖片由AI生成，圖片授權服務商Midjourney在此次合作中，Mistral 推出了一款名爲 “Le Chat” 的應用，聲稱其能夠以每秒1000個字的速度迴應用戶提問。Cerebras 表示，它爲這一成果提供了計算能

OpenAI更新o3-mini模型，展示了給出答案的 “思維鏈”

近日，OpenAI 在推出其旗艦 AI 模型 o3和 o3-mini 後，進行了重大更新，改變了 o3-mini 的迴應方式。現在，這款模型不僅能夠回答用戶的問題，還能展示其思考過程，爲用戶提供更多透明度。這一變化標誌着 OpenAI 在提升用戶體驗方面邁出了重要一步，使得 AI 工具的使用變得更加人性化。更新後的 o3-mini，特別是在 “高推理” 模式下，不論是免費用戶還是付費用戶，都能夠清晰地看到模型在給出答案之前的 “思維鏈”。這種思維鏈展示了模型是如何理解問題、進行推理的。例如，當用戶詢問

DeepSeek爆火背後，機構預測中國生成式AI市場規模到2029年將達98億美元

市場調研機構 Omdia 發佈了一份報告，指出中國生成式人工智能（GenAI）軟件市場正迎來快速增長。報告顯示，預計到2024年，中國的 GenAI 軟件收入將達到18億美元，約合131億元人民幣。這一市場仍處於起步階段，但未來五年的發展潛力巨大，市場規模將增長5.5倍，預計到2029年，市場規模將增長至98億美元，約714億元人民幣。Omdia 的報告強調，生成式 AI 技術的應用場景正在不斷擴大，未來將涵蓋更多行業和領域。該收入數據不包括其他關鍵技術，例如 AI 訓練和推理芯片、服務器、數據中心建

全球化釣魚攻擊:DeepSeek仿冒網站遍佈六國，用戶需警惕

奇安信XLab實驗室2月6日發佈最新安全報告，揭示了一波針對DeepSeek用戶的大規模網絡釣魚活動。數據顯示，仿冒DeepSeek的釣魚網站數量已超過2000個，且仍在持續增長。根據報告，在2024年12月1日至2025年2月3日期間，共發現2650個仿冒DeepSeek的域名。這波仿冒域名註冊活動始於2025年1月26日，並在1月28日達到高峯。儘管增速有所放緩，但仿冒網站數量仍在持續攀升。這些仿冒網站主要通過三種方式進行欺詐:竊取用戶登錄憑證、利用相似域名和界面誤導用戶、誘騙用戶購買虛擬資產。在地理分佈上

哈佛、哥大開源1600萬組蛋白質序列，解決AlphaFold 2訓練數據私有難題！

相關推薦

Inceptive:前Google大腦指令藥物時代的AGI編輯器

AI芯片公司Cerebras與Mistral合作，聲稱創速度紀錄超DeepSeek

OpenAI更新o3-mini模型，展示了給出答案的 “思維鏈”

DeepSeek爆火背後，機構預測中國生成式AI市場規模到2029年將達98億美元

全球化釣魚攻擊:DeepSeek仿冒網站遍佈六國，用戶需警惕