Apache Cassandra 社區近日宣佈, Cassandra5.0正式發佈。這次更新不僅提升了數據效率,還加入了生成 AI(GenAI)功能和優化的性能。作爲一款分佈式開源 NoSQL 數據庫 Cassandra 可以高管理跨多個服務器的大規模數據,確保高可用性和容錯能力。

image.png

版本 Cassandra5.0帶來了重大的進步,其中最引人注目的是全新的存儲附加索引(SAI)功能。以往,用戶需要嚴格定義數據,而現在,開發者可以更靈活地進行查詢,無需再受限於固定的數據結構。這意味着對於非主鍵的查詢變得更加高效,同時二級索引的使用也變得簡單,降低了系統負擔。

此外,Cassandra5.0還擴展了數據庫的功能,加入了向量搜索(Vector Search)和新的向量數據類型。這些功能對於 AI 和機器學習項目至關重要,可以更好地進行相似性,存儲和檢索嵌入向量,進而提升推薦引擎、欺詐檢測、圖像識別及 AI 聊天機器人的效果。

更新中還引入了統一的壓縮策略,使每個節點的數據密度大幅提升。相較於之前每個節點最大支持四 TB,現在的 Cassandra5.0能支持十 TB 甚至更多。這一改進使得企業用戶在大規模部署中可以減少節點數量,從而降低運營成本。

另外,Cassandra5.0推出了一對新的數據結構,稱爲 trie memtables 和 trie SSTables,這些結構將用戶輸入的數據與磁盤存儲進行了更好的對接,減少了不必要的處理和轉換時間,使得從內存或磁盤中提取數據的速度更快、更高效。

這次發佈是自2021年 Cassandra4.0推出以來的第一次重大升級。自那時以來,Apache Cassandra 社區集中精力於5.0的開發,推出了一系列新特性和功能,以提升其性能和適用性。用戶可以通過在線升級從4.0版本遷移到5.0,儘量減少應用程序的停機時間。隨着 Cassandra5.0的推出,3.x 系列的生命週期也宣告結束,用戶需要儘快規劃升級策略,以確保繼續獲得支持和安全更新。

未來,Cassandra 社區還將繼續推進5.1版本的開發,預計該版本將實現完整的 ACID(原子性、一致性、隔離性、持久性)事務,以擴展數據庫在新用例中的適用性。

劃重點:  

🔍 新增存儲附加索引(SAI)功能,讓查詢更靈活高效。  

🚀 引入向量搜索和新向量數據類型,助力 AI 和機器學習項目。  

💾 每個節點數據容量提升至10TB,減少了企業的運營成本。