這篇文章會提供一些優(yōu)化代碼的工具。會讓代碼變得更簡潔,或者更迅速。 當(dāng)然這些并不能代替算法設(shè)計,但是還是能讓Python加速很多倍。 其實前面講算法的文章,也有提到過。比如適用于雙向隊列的 deque,以及在合適的條件下運用 bisect 和 heapq 來提升算法的性能。 而且前面也提到過,Python提供了當(dāng)今最高級也是最有效的排序算法(list.sort)。 另外還有一個功能多樣又迅速的散列表(dict)。而且如果寫迭代器封裝、功能性代碼或者是某種額外擴(kuò)展的時候,或許 CyToolz可以用得到。當(dāng)然在 itertools和 functools模塊中,還有很多函數(shù)可以帶來很高效的代碼。 這篇文章主要講優(yōu)化單處理器的代碼,下面會介紹一些一些高效的函數(shù)實現(xiàn),也有已經(jīng)封裝好的拓展模塊,還包括速度更快的Python解釋器。 當(dāng)然多處理器版本確實能大幅提高運行效率。如果想了解多核編程,可以從multiprocessing模塊開始。而且也能找到非常多的關(guān)于分布式計算的第三方工具。這里可以看一下Python wiki上的關(guān)于Parallel Processing的內(nèi)容。 接下來,會說一些關(guān)于Python加速工具的選單。 1.NumPy、SciPy、Sage和Pandas: 先說,NumPy。它的核心是一個多維數(shù)字?jǐn)?shù)組的實現(xiàn)。除了這個數(shù)據(jù)結(jié)構(gòu)之外,還實現(xiàn)了若干個函數(shù)和運算符,可以高效地進(jìn)行數(shù)組運算。并且對于被調(diào)用的次數(shù)進(jìn)行了精簡。它可以被用來進(jìn)行極其高效的數(shù)學(xué)運算。SciPy和Sage都將NumPy內(nèi)置為自身的一部分,同時內(nèi)置了其他的不同的工具,從而可以用于特定科學(xué)、數(shù)學(xué)和高性能計算的模塊。Pandas是一個側(cè)重于數(shù)據(jù)分析的工具。如果處理大量半結(jié)構(gòu)化數(shù)據(jù)的時候,可能也會用到Pandas相關(guān)的工具,比如Blaze。 2.PyPy、Pyston、Parakeet、Psyco和Unladen Swallow: 讓代碼運行的更快,侵入性最小的就是使用實時編譯器(JIT編譯)。以前的話我們可以直接安裝Psyco。安裝之后導(dǎo)入psyco,然后調(diào)用psyco.full()。代碼運行速度就可以明顯提升。運行Python代碼的時候,它可以實時監(jiān)控程序,會將一部分代碼編譯為了機(jī)器碼。 現(xiàn)在好多Psyco等加速器的項目已經(jīng)停止維護(hù)了,不過類似的功能在PyPy中得到了繼承。 PyPy為了方便分析、優(yōu)化和翻譯,用Python語言將Python重新實現(xiàn)了一遍,這樣就可以JIT編譯。而且PyPy可以直接將代碼翻譯成像C那樣的性能更高的語言。 Unladen Swallow是一個Python的JIT編譯器。是Python解釋器的一本版本,被稱為底層虛擬機(jī)(LLVM)。不過這個開發(fā)已經(jīng)停止了。 Pyston是一個與LLVM平臺較為接近的Python的JIT編譯器。很多時候已經(jīng)優(yōu)于Python的實現(xiàn),但不過還有很多地方不完善。 3.GPULib、PyStream、PyCUDA和PyOpenCL: 這四個都是用在圖像處理單元來實現(xiàn)代碼的加速。前面講的都是用代碼優(yōu)化來實現(xiàn)加速的。而這些都是從硬件層面上進(jìn)行加速,如果有一個強大的GPU,我們可以用GPU來計算,從而減少CPU寶貴的資源。 PyStream古老一點。GPULib提供了基于GPU的各種形式的數(shù)據(jù)計算。 如果用GPU加速自己的代碼,可以用PyCUDA和PyOpenCL。 4.Pyrex、Cython、Numba和Shedskin: 這四個項目都致力于將Python代碼翻譯為C、C++和LLVM的代碼。Shedskin會將代碼編譯為C++語言。Pyrex、Cython編譯的主要目標(biāo)是C語言。Cython也是Pyrex的一個分支。 而且,Cython還有NumPy數(shù)組的額外支持。 如果面向數(shù)組和數(shù)學(xué)計算的時候,Numba是更好的選擇導(dǎo)入時會自動生成相應(yīng)的LLVM的代碼。升級版本是NumbaPro,還提供了對GPU的支持。 5.SWIG、F2PY和Boost.Python: 這些工具可以將其他的語言封裝為Python的模塊。第一個可以封裝C/C++語言。F2PY可以封裝Fortran。Boost.Python可以封裝C++語言。 SUIG只要啟動一個命令行工具,往里面輸入C或者C++的頭文件,封裝器代碼就會自動生成。除了Python,而且可以成為其他語言的封裝器,比如Java和PHP。 6.ctypes、llvm-py和CorePy2: 這些模塊可以幫助我們實現(xiàn)Python底層對象的操作。ctypes模塊可以用于在內(nèi)存中構(gòu)建編譯C的對象。并且調(diào)用共享庫中的C的函數(shù)。不過ctypes已經(jīng)包含在Python的標(biāo)準(zhǔn)庫里面了。 llvm-py主要提供LLVM的Python接口。以便于構(gòu)建代碼,然后編譯他們。也可以在Python中構(gòu)建它的編譯器。當(dāng)然搞出自己編程語言也是可以的。 CorePy2也可以進(jìn)行加速,不過這個加速是運行在匯編層的。 7.Weave、Cinpy和PyInline: 這三個包,就可以讓我們在Python代碼中直接使用C語言或者其他的高級語言。混合代碼,依然可以保持整潔??梢允褂肞ython代碼的字符串的多行特性,可以使其他的代碼按照自身的風(fēng)格來進(jìn)行排版。 8.其他工具: 如果我們要節(jié)省內(nèi)存,就不能使用JIT了。一般JIT都太耗費內(nèi)存。有一句話說的很對,時間和內(nèi)存經(jīng)常不能兼得,而我們在工程開發(fā)中,總是要尋找他們的平衡點。 至于其他的一些東西,比如Micro Python項目,這個是用在嵌入式設(shè)備或者微控制器上面使用的。 如果只是想在Python環(huán)境中工作,然后想用別的語言,可以看看這個項目Julia。 到這里,讓Python加速的方法就說到這里了。 謝謝大家關(guān)注。希望大家每天都能開心和進(jìn)步。 最近天氣一直很冷。冬天到了,大家注意保暖。 |
|