谷歌全新升級Gemini 2.0 Flash Thinking，長上下文處理能力再創新高

谷歌於2025年1月22日正式發佈了其 Gemini2.0Flash Thinking 推理模型的增強版，再次奪回 Chatbot Arena 的榜首。此版本的升級主要集中在長上下文的處理能力上，能夠支持高達1M token 的輸入，爲用戶在處理長篇文本時提供了更深入的分析能力。

谷歌 AI 負責人 Jeff Dean 在發佈會上表示，此次實驗性更新旨在提高模型的可靠性，並減少模型生成的思想與最終答案之間的矛盾。Gemini2.0Flash Thinking 不僅延續了原有版本的優點，還新增了基於思維（thoughts）增強推理能力的功能，表現出色。

在技術層面，Gemini2.0Flash Thinking 實現了兩大突破:首先，能夠處理高達1M token 的長上下文，這對於複雜的多輪對話和推理過程至關重要;其次，模型在自我糾錯方面表現顯著，能夠在對話中保持連貫性並靈活應用之前積累的信息。這意味着用戶在與模型互動時，可以體驗到更爲自然和一致的對話過程。

在一場演示中，Jeff Dean 展示了該模型如何解決物理問題並解釋推理過程，令人印象深刻。而且，參與者反饋稱，這款最新模型的實際體驗甚至比演示中更爲迅速。

除了長上下文處理能力，Gemini2.0Flash Thinking 在數學能力測試、科學能力測試和多模態推理能力上也有顯著提升，尤其是在數學方面成績提升了54%。這一系列優異的表現讓人們對該模型的未來充滿期待。

進入交互界面，用戶可以在 “Google AI Studio” 平臺上獲得全面的模型功能，包括創建提示詞、實時對話以及開發應用程序等。雖然當前界面的功能較爲分散，但谷歌計劃在模型正式發佈後，提供更詳細的技術報告和用戶指引，以便改善用戶體驗。

展望未來，谷歌的開發團隊正在積極探索3D 數據的處理能力，顯示出他們對持續創新的堅定信念。可以預見，谷歌在 AI 領域的下一個突破正呼之欲出，值得我們持續關注。

試用鏈接:https://aistudio.google.com/prompts/new_chat

Liquid AI 發佈 1.2B 推理模型：不到 1GB 內存，手機端側即可運行“思考”模式

Liquid AI推出LFM2.5-1.2B-Thinking推理模型，擁有12億參數，專爲複雜邏輯推理和數學任務設計。該模型在端側部署上實現突破，僅佔用約900MB內存，可在現代手機上完全離線運行，將兩年前需數據中心支持的推理能力成功遷移至個人移動設備。

Anthropic 重磅升級！Claude Sonnet 4 模型可支持100萬詞元

Anthropic公司宣佈其Claude Sonnet4語言模型現支持100萬個上下文詞元，成爲繼谷歌Gemini後第二家提供此功能的主流供應商。相比之前20萬詞元的限制，此次擴展提升至五倍，開發者可一次性提交超過7.5萬行代碼的完整代碼庫，極大提升開發便利性。

OpenAI新推AI模型o3幻覺現象加劇，精準性令人擔憂

最近，OpenAI 推出了其最新的 o3和 o4-mini AI 模型，這些模型在許多方面都達到了尖端水平。然而，新的模型在 “幻覺” 問題上卻並沒有改善，反而幻覺現象比 OpenAI 之前的多個模型更爲嚴重。所謂 “幻覺”，是指 AI 模型會錯誤地生成虛假信息，這是當今最棘手的 AI 問題之一。以往每一代新模型在減少幻覺方面都有所改善 o3和 o4-mini 卻打破了這一規律。根據 Open 的內部測試，這兩款被稱爲推理模型的 AI，在幻覺頻率上超過了公司的前幾代推理模型以及傳統的非推理模型，比如 GPT-4o。圖源備

OpenAI 推出全新推理模型 o3，實現圖像思考能力

OpenAI 近期發佈了其最新的推理模型 o3和 o4-mini，標誌着人工智能領域的一次重大突破。這兩款模型不僅在推理能力上超越了以往的版本，還首次實現了圖像思考的能力，能夠將視覺信息直接融入到思維過程中。o3被譽爲 “天才級” 模型，尤其在編程和數學等任務中表現出色，準確率高達87.5%。這次發佈的 o3和 o4-mini 模型在多模態處理上表現出色，具備了圖像處理、網頁搜索和代碼執行等功能。開發者可以通過 API 方便地接入這些模型，使用更強大的工具和功能。例如，o3不僅能夠進行復雜問

谷歌全新升級Gemini 2.0 Flash Thinking，長上下文處理能力再創新高

相關推薦

OpenAI 發佈 GPT-5.4系列:百萬級上下文窗口，Pro 與 Thinking 版同步登場

Liquid AI 發佈 1.2B 推理模型：不到 1GB 內存，手機端側即可運行“思考”模式

Anthropic 重磅升級！Claude Sonnet 4 模型可支持100萬詞元

OpenAI新推AI模型o3幻覺現象加劇，精準性令人擔憂

OpenAI 推出全新推理模型 o3，實現圖像思考能力

谷歌全新升級Gemini 2.0 Flash Thinking，長上下文處理能力再創新高

相關推薦

OpenAI 發佈 GPT-5.4系列:百萬級上下文窗口，Pro 與 Thinking 版同步登場

​Liquid AI 發佈 1.2B 推理模型：不到 1GB 內存，手機端側即可運行“思考”模式

Anthropic 重磅升級！Claude Sonnet 4 模型可支持100萬詞元

OpenAI新推AI模型o3幻覺現象加劇，精準性令人擔憂

OpenAI 推出全新推理模型 o3，實現圖像思考能力

Liquid AI 發佈 1.2B 推理模型：不到 1GB 內存，手機端側即可運行“思考”模式