在科技飛速發展的今天,一位勇敢的程序員選擇迴歸經典,嘗試在老舊的 DOS 環境中運行 Meta 公司最新發佈的大語言模型 Llama2。Yeo Kheng Meng,這位因開發 ChatGPT DOS 客戶端而聲名鵲起的程序員,花費了一個週末的時間,成功地將這個大型語言模型移植到傳統計算環境中,展現了無與倫比的技術創造力。
項目的起步得益於開源代碼的便利。Meng 使用了名爲 “llama2.c” 的項目,這是一個專門設計用來加速 Llama2模型在不同系統和硬件上的移植工作。然而,適配到古老的 DOS 環境並非易事。儘管 llama2.c 旨在提高可移植性,Meng 仍需進行多次編碼調整,以解決傳統計算平臺帶來的各種挑戰。
在實現過程中,Meng 面臨了內存的限制。在 DOS 系統中,通常只能訪問640KB 的常規內存,因此他必須選擇合適的 DOS 擴展工具,以便能夠使用更大的 RAM。此外,由於 llama2.c 需要一個功能較強的 C 編譯器,Meng 還對 OWC 編譯器進行了修改,以確保能夠順利編譯代碼。
經過多次嘗試和測試,Meng 最終成功創建了一個在 DOS 系統上可運行的 llama2二進制文件,並在多臺不同性能的電腦上進行了基準測試。從老舊的486DX266MHz 計算機到現代基於 Ryzen 的臺式機,測試結果顯示,新系統無疑提供了更快的推理速度。而令人驚訝的是,搭載1.7GHz Pentium M 處理器的 ThinkPad T42竟然在性能上超過了16年後發佈的 ThinkPad X13G1,這一發現令許多人感到意外。
Meng 將這次成功的移植和測試過程視爲一個充實且富有成就感的週末項目。他也特別感謝 Andrej Karpathy 開源的 llama2.c 代碼,正是這份貢獻使得這一切成爲可能。這次挑戰不僅彰顯了技術的力量,也證明了在任何平臺上實現創新的可能性。