新聞中心
Python其實(shí)很簡(jiǎn)單 第十五章 文件操作
在各種變量中保存的數(shù)據(jù)都是臨時(shí)的,隨著程序運(yùn)行結(jié)束都會(huì)丟失。要做到數(shù)據(jù)長(zhǎng)期有效,必須建立在磁盤中建立文件,將數(shù)據(jù)輸入到文件中并保存。需要獲取數(shù)據(jù)時(shí)需要打開(kāi)文件讀取。
公司主營(yíng)業(yè)務(wù):網(wǎng)站制作、網(wǎng)站設(shè)計(jì)、移動(dòng)網(wǎng)站開(kāi)發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競(jìng)爭(zhēng)能力。成都創(chuàng)新互聯(lián)公司是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開(kāi)放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對(duì)我們的高要求,感謝他們從不同領(lǐng)域給我們帶來(lái)的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來(lái)驚喜。成都創(chuàng)新互聯(lián)公司推出茂名免費(fèi)做網(wǎng)站回饋大家。
而我們自己建立的程序都是應(yīng)用程序,從本質(zhì)上講,應(yīng)用程序是無(wú)法直接操作計(jì)算機(jī)的硬件的,譬如讀寫磁盤中文件,這就需要調(diào)用操作系統(tǒng)中的相應(yīng)命令。接下來(lái)我們使用的Python內(nèi)置函數(shù)open()、write()都是通過(guò)調(diào)用操作系統(tǒng)的相關(guān)命令才實(shí)現(xiàn)文件讀寫的,至于其中的細(xì)節(jié),我們就不需要考慮了。
15.1創(chuàng)建和打開(kāi)文件
在Python 中創(chuàng)建或打開(kāi)文件,實(shí)際上是建立一個(gè)對(duì)象,該對(duì)象通過(guò)調(diào)用內(nèi)置的open()函數(shù)創(chuàng)建或打開(kāi)一個(gè)文件。
語(yǔ)法:
file object = open(filename [, mode][, buffering])
參數(shù)說(shuō)明如下:
filename:file_name變量是一個(gè)包含了你要訪問(wèn)的文件名稱的字符串值;
mode:mode決定了打開(kāi)文件的模式:只讀,寫入,追加等。所有可取值見(jiàn)如下的完全列表。這個(gè)參數(shù)是非強(qiáng)制的,默認(rèn)文件訪問(wèn)模式為只讀(r)。
Buffering:如果buffering的值被設(shè)為0,就不會(huì)有寄存;如果buffering的值取1,訪問(wèn)文件時(shí)會(huì)寄存行;如果將buffering的值設(shè)為大于1的整數(shù),表明了這就是的寄存區(qū)的緩沖大小;如果取負(fù)值,寄存區(qū)的緩沖大小則為系統(tǒng)默認(rèn)。
mode參數(shù)的參數(shù)值及說(shuō)明
對(duì)于其中最難區(qū)別的r、r+、w、w+、a、a+幾個(gè)參數(shù)的區(qū)別總結(jié)如下,要特別注意指針的位置:
下面舉例說(shuō)明open( )函數(shù)的使用方法。
例1:
file=open('1.py')
如果文件“1.py”存在,則可以打開(kāi)此文件;如果文件“1.py”不存在,則會(huì)出現(xiàn)如下提示:
Traceback (most recent call last):
File " ", line 1, in
file=open('1.py')
FileNotFoundError: [Errno 2] No such file or directory: '1.py'
例2:
file=open('4.py',’a+’)
雖然文件“4.py”不存在,但運(yùn)行并未出現(xiàn)錯(cuò)誤,參見(jiàn)上表,“a+”的含義是以讀寫模式打開(kāi)文件,如果該文件已經(jīng)存在,新內(nèi)容將以追加方式寫入;如果該文件不存在,則新建文件用于寫入。查看文件夾,發(fā)現(xiàn)已經(jīng)生成了一個(gè)新的文件4.py。
例3:
file=open('python.png','rb')
print(file)
運(yùn)行結(jié)果:
這就是說(shuō),雖然Python可以打開(kāi)一個(gè)圖片格式的文件,但print()并不能將其輸出,還需要第三方庫(kù)中模塊的相應(yīng)方法去處理,如PIL中的open()f方法。
例4:
file = open("f.txt", "w",encoding='utf-8')
# 以只寫模式打開(kāi)文件f.txt,編碼方式為utf-8
print( "文件名: ", file.name) # 輸出文件名
print( "是否已關(guān)閉 : ", file.closed) # 文件是否打開(kāi)
print( "訪問(wèn)模式 : ", file.mode) # 文件訪問(wèn)模式
運(yùn)行結(jié)果:
文件名: f.txt
是否已關(guān)閉 : False
訪問(wèn)模式 : w
例5:
15.2關(guān)閉文件
打開(kāi)文件使用后要及時(shí)關(guān)閉,以免造成不必要的破壞,同時(shí)也可以釋放內(nèi)存。在Python中使用close()方法可以關(guān)閉文件。
語(yǔ)法格式:
file.close()
其中,file為文件對(duì)象。
15.3 with語(yǔ)句
with 語(yǔ)句適用于對(duì)資源進(jìn)行訪問(wèn)的場(chǎng)合,確保不管使用過(guò)程中是否發(fā)生異常都會(huì)執(zhí)行必要的“清理”操作,釋放資源,比如文件使用后自動(dòng)關(guān)閉、線程中鎖的自動(dòng)獲取和釋放等。
with語(yǔ)句的語(yǔ)法格式如下:
with expression as target:
with-body
其中,expression用于指定一個(gè)表達(dá)式,譬如打開(kāi)文件的open()函數(shù)。target用于指定一個(gè)變量,并且將expression的結(jié)果保存到該變量中,譬如文件對(duì)象file。with-body用于指定with語(yǔ)句體,譬如一些文件操作的相關(guān)語(yǔ)句,如果沒(méi)有要執(zhí)行的語(yǔ)句體,則直接用pass語(yǔ)句代替。
假設(shè)python當(dāng)前目錄下存在一個(gè)test.txt文件,其內(nèi)容如下:
Python是一種解釋型語(yǔ)言: 這意味著開(kāi)發(fā)過(guò)程中沒(méi)有了編譯這個(gè)環(huán)節(jié)。類似于PHP和Perl語(yǔ)言。
Python是交互式語(yǔ)言: 這意味著,您可以在一個(gè) Python 提示符 后直接執(zhí)行代碼。
Python是面向?qū)ο笳Z(yǔ)言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對(duì)象的編程技術(shù)。
Python是初學(xué)者的語(yǔ)言:Python 對(duì)初級(jí)程序員而言,是一種偉大的語(yǔ)言,它支持廣泛的應(yīng)用程序開(kāi)發(fā)。
舉例如下:
with open('test.txt','r',encoding='utf-8') as file:
line=file.read()line() # readline()方法可以讀取文件一行數(shù)據(jù),接下來(lái)就會(huì)講到。
print(line)
運(yùn)行結(jié)果如下:
Python是一種解釋型語(yǔ)言: 這意味著開(kāi)發(fā)過(guò)程中沒(méi)有了編譯這個(gè)環(huán)節(jié)。類似于PHP和Perl語(yǔ)言。
而此時(shí),我們給該段代碼with語(yǔ)句之外再增加一個(gè)讀取文件的語(yǔ)句,代碼如下:
with open('test.txt','r',encoding='utf-8') as file:
line=file.readline()
print(line)
line2=file.readline()
print(line2)
發(fā)現(xiàn)出現(xiàn)了如下錯(cuò)誤提示:
Traceback (most recent call last):
File "C:/Users/zym/AppData/Local/Programs/Python/Python39/3.py", line 5, in
line2=file.readline()
ValueError: I/O operation on closed file.
意思是要讀取的文件已經(jīng)被關(guān)閉了。
由此可知,當(dāng)with語(yǔ)句運(yùn)行結(jié)束后,被打開(kāi)的test.txt文件就自動(dòng)關(guān)閉了。
15.4讀取文件
在Python 中讀取文件的方法有:
1、讀取指定個(gè)數(shù)的字符
格式如下:
File.read([size])
其中,file為打開(kāi)的文件對(duì)象。size為可選參數(shù),可以指定要讀取的字符個(gè)數(shù),省缺表示讀取所有內(nèi)容。
在調(diào)用read()方法讀取文件內(nèi)容時(shí),文件必須是以r(只讀)或者r+(讀寫)方式打開(kāi)。
如:
with open('test.txt','r',encoding='utf-8') as file:
txt=file.read() (或txt=file.read(10))
print(txt)
將讀取、輸出test.txt文件的全部?jī)?nèi)容(或前10個(gè)字符)。
2、移動(dòng)文件的指針
對(duì)于剛打開(kāi)的文件,文件指針總是指向文件頭的。也可以通過(guò)seek()方法將文件的指針移動(dòng)到新的位置。
格式如下:
file.seek(offset[,whence])
其中,file表示已經(jīng)打開(kāi)的文件對(duì)象;offset用于指定移動(dòng)的字符個(gè)數(shù);whence表示從哪個(gè)位置起始計(jì)算個(gè)數(shù),其值為0表示從文件頭開(kāi)始計(jì)算,其值為1表示從當(dāng)前位置開(kāi)始計(jì)算,其值為2表示從文件尾開(kāi)始計(jì)算,默認(rèn)值為0。
例如:
with open('test.txt','r',encoding='utf-8') as file:
string=file.read(9)
print('取9個(gè)字符: '+string)
file.seek(2) #指針從文件頭開(kāi)始移動(dòng)2個(gè)字符
string=file.read(9) #從當(dāng)前位置讀取10個(gè)字符
輸出結(jié)果:
取9個(gè)字符:
Python是一種
取9個(gè)字符:
thon是一種解釋
而下面的代碼會(huì)拋出錯(cuò)誤:
with open('test.txt','r',encoding='utf-8') as file:
file.seek(2,1) #指針從當(dāng)前位置開(kāi)始移動(dòng)2個(gè)字符
string=file.read(10) #從當(dāng)前位置讀取10個(gè)字符
print('取10個(gè)字符: '+string)
錯(cuò)誤提示為:
Traceback (most recent call last):
File "C:UserszymAppDataLocalProgramsPythonPython393.py", line 7, in
file.seek(2,1) #指針從當(dāng)前位置開(kāi)始移動(dòng)2個(gè)字符
io.UnsupportedOperation: can't do nonzero cur-relative seeks
原因在于,必須使用b模式(即rb)打開(kāi)文件,才能使用whence參數(shù)。但是,b模式(二進(jìn)制)不適合文本文件。對(duì)于test.txt這樣的文本文件,為了解決通過(guò)改變指針讀取任意位置字符,可以采用加一個(gè)位置變量的方法來(lái)存儲(chǔ)指針的值。
例如:
with open('test.txt','r',encoding='utf-8') as file:
#utf-8漢字與英文字符都占一個(gè)字符
string='' #設(shè)置一個(gè)空字符串
pointer=0 #當(dāng)前指針為0
str1=file.read(6) #讀取6個(gè)字符
pointer+=6 #指針變量后移6個(gè)字符
string+=str1 #string用來(lái)存放已讀取的字符
print('取6個(gè)字符: ',str1)
file.seek(pointer) #指針從文件頭開(kāi)始移動(dòng)2個(gè)字符
str1=file.read(8) #從當(dāng)前位置讀取10個(gè)字符
pointer+=8 #指針跳過(guò)已讀取的字符
string+=str1
print('再取8個(gè)字符: ',str1)
print('所有讀取的字符: ',string)
print('當(dāng)前指針?biāo)幍奈恢茫?',pointer)
str1=file.read(1)
print('當(dāng)前指針?biāo)幍淖址?',str1)
運(yùn)行結(jié)果如下:
取6個(gè)字符:
Python
再取8個(gè)字符:
是一種解釋型語(yǔ)言
所有讀取的字符:
Python是一種解釋型語(yǔ)言
當(dāng)前指針?biāo)幍奈恢茫?/p>
14
當(dāng)前指針?biāo)幍淖址?/p>
:
3、讀取一行數(shù)據(jù)readline()方法
語(yǔ)法格式:
file.readline()
例:
with open('test.txt','r',encoding='utf-8') as f:
string=f.read(1) # 讀取文件的第一個(gè)字符
if string != '': # 防止文件為空文件
lineno=0
while True:
line=f.readline()
if line != '':
lineno+=1
print('第'+str(lineno)+'行:'+line,end='')
# 因?yàn)槊啃卸加凶詭У姆中蟹琾rint()語(yǔ)句不允許換行
else:
break # 出現(xiàn)空行時(shí)停止讀取
else:
print('要讀取的文件為空文件!')
運(yùn)行結(jié)果:
第1行:ython是一種解釋型語(yǔ)言: 這意味著開(kāi)發(fā)過(guò)程中沒(méi)有了編譯這個(gè)環(huán)節(jié)。類似于PHP和Perl語(yǔ)言。
第2行:Python是交互式語(yǔ)言: 這意味著,您可以在一個(gè) Python 提示符 后直接執(zhí)行代碼。
第3行:Python是面向?qū)ο笳Z(yǔ)言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對(duì)象的編程技術(shù)。
第4行:Python是初學(xué)者的語(yǔ)言:Python 對(duì)初級(jí)程序員而言,是一種偉大的語(yǔ)言,它支持廣泛的應(yīng)用程序開(kāi)發(fā)。
4、讀取全部行命令readlines()方法
語(yǔ)法格式:
File.readlines()
該方法與read()方法一樣,在調(diào)用read()方法讀取文件內(nèi)容時(shí),文件必須是以r(只讀)或者r+(讀寫)方式打開(kāi)。
例:
with open('test.txt','r',encoding='utf-8') as f:
txt=f.readlines()
print(txt)
運(yùn)行結(jié)果:
['Python是一種解釋型語(yǔ)言: 這意味著開(kāi)發(fā)過(guò)程中沒(méi)有了編譯這個(gè)環(huán)節(jié)。類似于PHP和Perl語(yǔ)言。 ', 'Python是交互式語(yǔ)言: 這意味著,您可以在一個(gè) Python 提示符 后直接執(zhí)行代碼。 ', 'Python是面向?qū)ο笳Z(yǔ)言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對(duì)象的編程技術(shù)。 ', 'Python是初學(xué)者的語(yǔ)言:Python 對(duì)初級(jí)程序員而言,是一種偉大的語(yǔ)言,它支持廣泛的應(yīng)用程序開(kāi)發(fā)。 ']
從上面的運(yùn)行結(jié)果可以看出,readlines()方法的返回值為一個(gè)字符串列表。所以,也可以以讀取列表元素的方法輸出。如下所示:
with open('test.txt','r',encoding='utf-8') as f:
txt=f.readlines()
for line in txt:
print(line,end='')
運(yùn)行結(jié)果:
Python是一種解釋型語(yǔ)言: 這意味著開(kāi)發(fā)過(guò)程中沒(méi)有了編譯這個(gè)環(huán)節(jié)。類似于PHP和Perl語(yǔ)言。
Python是交互式語(yǔ)言: 這意味著,您可以在一個(gè) Python 提示符 后直接執(zhí)行代碼。
Python是面向?qū)ο笳Z(yǔ)言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對(duì)象的編程技術(shù)。
Python是初學(xué)者的語(yǔ)言:Python 對(duì)初級(jí)程序員而言,是一種偉大的語(yǔ)言,它支持廣泛的應(yīng)用程序開(kāi)發(fā)。
15.5 寫入文件內(nèi)容
語(yǔ)法格式如下:
file.write(string)
其中,file為打開(kāi)的文件對(duì)象,string為要寫入的字符串。
寫入文件內(nèi)容時(shí),文件必須以w(可寫)或a(追加)模式打開(kāi)。否則,會(huì)拋出如下異常提示:
Traceback (most recent call last):
File "C:UsersAdministratorAppDataLocalProgramsPythonPython383.py", line 2, in
f.write('人生苦短,我用Python!')
io.UnsupportedOperation: not writable
關(guān)于write()方法的用法舉例如下:
with open('test.txt','a',encoding='utf-8') as f:
f.write('人生苦短,我用Python!')
with open('test.txt','r',encoding='utf-8') as f:
txt=f.read()
print(txt)
運(yùn)行結(jié)果:
Python是一種解釋型語(yǔ)言: 這意味著開(kāi)發(fā)過(guò)程中沒(méi)有了編譯這個(gè)環(huán)節(jié)。類似于PHP和Perl語(yǔ)言。
Python是交互式語(yǔ)言: 這意味著,您可以在一個(gè) Python 提示符 后直接執(zhí)行代碼。
Python是面向?qū)ο笳Z(yǔ)言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對(duì)象的編程技術(shù)。
Python是初學(xué)者的語(yǔ)言:Python 對(duì)初級(jí)程序員而言,是一種偉大的語(yǔ)言,它支持廣泛的應(yīng)用程序開(kāi)發(fā)。
人生苦短,我用Python!
可以看出,由于文件的打開(kāi)方式為a模式(追加模式),寫入的內(nèi)容被寫入到文件的末尾。
在Python中,文件操作方法里沒(méi)有類似于字符串內(nèi)的計(jì)算長(zhǎng)度、查找、替換、截取、分隔等方法,為什么沒(méi)有?原因可能是文件的類型太復(fù)雜,譬如說(shuō)二進(jìn)制文件,上述操作的意義不大。如果僅僅要對(duì)文本文件進(jìn)行上述操作,完全可以先把文件的內(nèi)容讀取到字符串中,再用相應(yīng)的字符串函數(shù)或方法去操作就可以了。譬如,要將test.txt文件中的字符串‘Python’替換為’PHP’,則可以用如下代碼完成:
txt1=''
with open('test.txt','r',encoding='utf-8') as f:
txt1=f.read() #先將文件內(nèi)容存入字符串txt1中
txt2=txt1.replace('Python','PHP') #將txt1中的'Python'替換為'PHP',并存入txt2
with open('test.txt','w',encoding='utf-8') as f:
f.write(txt2) #將字符串txt2的內(nèi)容寫回到文件中
這里之所以分兩步打開(kāi)文件(第一次為r模式,第二次為w模式),而沒(méi)有采用一次讀寫(r+、w+方式),因?yàn)槟菢颖容^容易出錯(cuò)。實(shí)踐證明,將文件的讀操作和寫操作分開(kāi)其實(shí)是非常正確的選擇。
如何用python實(shí)現(xiàn)函數(shù)?
分兩步:定義函數(shù)和調(diào)用函數(shù)。
1.定義函數(shù)用def關(guān)鍵字,然后定義函數(shù)名和入?yún)ⅲ约昂瘮?shù)執(zhí)行語(yǔ)句。
2.通過(guò)函數(shù)名調(diào)用函數(shù)即可,需要傳入?yún)?shù)的話需要加上參數(shù)值
「干貨」讓Python性能起飛的15個(gè)技巧,你知道幾個(gè)呢?
前言
Python 一直以來(lái)被大家所詬病的一點(diǎn)就是執(zhí)行速度慢,但不可否認(rèn)的是 Python 依然是我們學(xué)習(xí)和工作中的一大利器。本文總結(jié)了15個(gè)tips有助于提升 Python 執(zhí)行速度、優(yōu)化性能。
關(guān)于 Python 如何精確地測(cè)量程序的執(zhí)行時(shí)間,這個(gè)問(wèn)題看起來(lái)簡(jiǎn)單其實(shí)很復(fù)雜,因?yàn)槌绦虻膱?zhí)行時(shí)間受到很多因素的影響,例如操作系統(tǒng)、Python 版本以及相關(guān)硬件(CPU 性能、內(nèi)存讀寫速度)等。在同一臺(tái)電腦上運(yùn)行相同版本的語(yǔ)言時(shí),上述因素就是確定的了,但是程序的睡眠時(shí)間依然是變化的,且電腦上正在運(yùn)行的其他程序也會(huì)對(duì)實(shí)驗(yàn)有干擾,因此嚴(yán)格來(lái)說(shuō)這就是實(shí)驗(yàn)不可重復(fù)。
我了解到的關(guān)于計(jì)時(shí)比較有代表性的兩個(gè)庫(kù)就是 time 和 timeit 。
其中, time 庫(kù)中有 time() 、 perf_counter() 以及 process_time() 三個(gè)函數(shù)可用來(lái)計(jì)時(shí)(以秒為單位),加后綴 _ns 表示以納秒計(jì)時(shí)(自 Python3.7 始)。在此之前還有 clock() 函數(shù),但是在 Python3.3 之后被移除了。上述三者的區(qū)別如下:
與 time 庫(kù)相比, timeit 有兩個(gè)優(yōu)點(diǎn):
timeit.timeit(stmt='pass', setup='pass', timer= , number=1000000, globals=None) 參數(shù)說(shuō)明:
本文所有的計(jì)時(shí)均采用 timeit 方法,且采用默認(rèn)的執(zhí)行次數(shù)一百萬(wàn)次。
為什么要執(zhí)行一百萬(wàn)次呢?因?yàn)槲覀兊臏y(cè)試程序很短,如果不執(zhí)行這么多次的話,根本看不出差距。
Exp1:將字符串?dāng)?shù)組中的小寫字母轉(zhuǎn)為大寫字母。
測(cè)試數(shù)組為 oldlist = ['life', 'is', 'short', 'i', 'choose', 'python']。
方法一
方法二
方法一耗時(shí) 0.5267724000000005s ,方法二耗時(shí) 0.41462569999999843s ,性能提升 21.29%
Exp2:求兩個(gè) list 的交集。
測(cè)試數(shù)組:a = [1,2,3,4,5],b = [2,4,6,8,10]。
方法一
方法二
方法一耗時(shí) 0.9507264000000006s ,方法二耗時(shí) 0.6148200999999993s ,性能提升 35.33%
關(guān)于 set() 的語(yǔ)法: | 、 、 - 分別表示求并集、交集、差集。
我們可以通過(guò)多種方式對(duì)序列進(jìn)行排序,但其實(shí)自己編寫排序算法的方法有些得不償失。因?yàn)閮?nèi)置的 sort() 或 sorted() 方法已經(jīng)足夠優(yōu)秀了,且利用參數(shù) key 可以實(shí)現(xiàn)不同的功能,非常靈活。二者的區(qū)別是 sort() 方法僅被定義在 list 中,而 sorted() 是全局方法對(duì)所有的可迭代序列都有效。
Exp3:分別使用快排和 sort() 方法對(duì)同一列表排序。
測(cè)試數(shù)組:lists = [2,1,4,3,0]。
方法一
方法二
方法一耗時(shí) 2.4796975000000003s ,方法二耗時(shí) 0.05551999999999424s ,性能提升 97.76%
順帶一提, sorted() 方法耗時(shí) 0.1339823999987857s 。
可以看出, sort() 作為 list 專屬的排序方法還是很強(qiáng)的, sorted() 雖然比前者慢一點(diǎn),但是勝在它“不挑食”,它對(duì)所有的可迭代序列都有效。
擴(kuò)展 :如何定義 sort() 或 sorted() 方法的 key
1.通過(guò) lambda 定義
2.通過(guò) operator 定義
operator 的 itemgetter() 適用于普通數(shù)組排序, attrgetter() 適用于對(duì)象數(shù)組排序
3.通過(guò) cmp_to_key() 定義,最為靈活
Exp4:統(tǒng)計(jì)字符串中每個(gè)字符出現(xiàn)的次數(shù)。
測(cè)試數(shù)組:sentence='life is short, i choose python'。
方法一
方法二
方法一耗時(shí) 2.8105250000000055s ,方法二耗時(shí) 1.6317423000000062s ,性能提升 41.94%
列表推導(dǎo)(list comprehension)短小精悍。在小代碼片段中,可能沒(méi)有太大的區(qū)別。但是在大型開(kāi)發(fā)中,它可以節(jié)省一些時(shí)間。
Exp5:對(duì)列表中的奇數(shù)求平方,偶數(shù)不變。
測(cè)試數(shù)組:oldlist = range(10)。
方法一
方法二
方法一耗時(shí) 1.5342976000000021s ,方法二耗時(shí) 1.4181957999999923s ,性能提升 7.57%
大多數(shù)人都習(xí)慣使用 + 來(lái)連接字符串。但其實(shí),這種方法非常低效。因?yàn)椋? + 操作在每一步中都會(huì)創(chuàng)建一個(gè)新字符串并復(fù)制舊字符串。更好的方法是用 join() 來(lái)連接字符串。關(guān)于字符串的其他操作,也盡量使用內(nèi)置函數(shù),如 isalpha() 、 isdigit() 、 startswith() 、 endswith() 等。
Exp6:將字符串列表中的元素連接起來(lái)。
測(cè)試數(shù)組:oldlist = ['life', 'is', 'short', 'i', 'choose', 'python']。
方法一
方法二
方法一耗時(shí) 0.27489080000000854s ,方法二耗時(shí) 0.08166570000000206s ,性能提升 70.29%
join 還有一個(gè)非常舒服的點(diǎn),就是它可以指定連接的分隔符,舉個(gè)例子
life//is//short//i//choose//python
Exp6:交換x,y的值。
測(cè)試數(shù)據(jù):x, y = 100, 200。
方法一
方法二
方法一耗時(shí) 0.027853900000010867s ,方法二耗時(shí) 0.02398730000000171s ,性能提升 13.88%
在不知道確切的循環(huán)次數(shù)時(shí),常規(guī)方法是使用 while True 進(jìn)行無(wú)限循環(huán),在代碼塊中判斷是否滿足循環(huán)終止條件。雖然這樣做沒(méi)有任何問(wèn)題,但 while 1 的執(zhí)行速度比 while True 更快。因?yàn)樗且环N數(shù)值轉(zhuǎn)換,可以更快地生成輸出。
Exp8:分別用 while 1 和 while True 循環(huán) 100 次。
方法一
方法二
方法一耗時(shí) 3.679268300000004s ,方法二耗時(shí) 3.607847499999991s ,性能提升 1.94%
將文件存儲(chǔ)在高速緩存中有助于快速恢復(fù)功能。Python 支持裝飾器緩存,該緩存在內(nèi)存中維護(hù)特定類型的緩存,以實(shí)現(xiàn)最佳軟件驅(qū)動(dòng)速度。我們使用 lru_cache 裝飾器來(lái)為斐波那契函數(shù)提供緩存功能,在使用 fibonacci 遞歸函數(shù)時(shí),存在大量的重復(fù)計(jì)算,例如 fibonacci(1) 、 fibonacci(2) 就運(yùn)行了很多次。而在使用了 lru_cache 后,所有的重復(fù)計(jì)算只會(huì)執(zhí)行一次,從而大大提高程序的執(zhí)行效率。
Exp9:求斐波那契數(shù)列。
測(cè)試數(shù)據(jù):fibonacci(7)。
方法一
方法二
方法一耗時(shí) 3.955014900000009s ,方法二耗時(shí) 0.05077979999998661s ,性能提升 98.72%
注意事項(xiàng):
我被執(zhí)行了(執(zhí)行了兩次 demo(1, 2) ,卻只輸出一次)
functools.lru_cache(maxsize=128, typed=False) 的兩個(gè)可選參數(shù):
點(diǎn)運(yùn)算符( . )用來(lái)訪問(wèn)對(duì)象的屬性或方法,這會(huì)引起程序使用 __getattribute__() 和 __getattr__() 進(jìn)行字典查找,從而帶來(lái)不必要的開(kāi)銷。尤其注意,在循環(huán)當(dāng)中,更要減少點(diǎn)運(yùn)算符的使用,應(yīng)該將它移到循環(huán)外處理。
這啟發(fā)我們應(yīng)該盡量使用 from ... import ... 這種方式來(lái)導(dǎo)包,而不是在需要使用某方法時(shí)通過(guò)點(diǎn)運(yùn)算符來(lái)獲取。其實(shí)不光是點(diǎn)運(yùn)算符,其他很多不必要的運(yùn)算我們都盡量移到循環(huán)外處理。
Exp10:將字符串?dāng)?shù)組中的小寫字母轉(zhuǎn)為大寫字母。
測(cè)試數(shù)組為 oldlist = ['life', 'is', 'short', 'i', 'choose', 'python']。
方法一
方法二
方法一耗時(shí) 0.7235491999999795s ,方法二耗時(shí) 0.5475435999999831s ,性能提升 24.33%
當(dāng)我們知道具體要循環(huán)多少次時(shí),使用 for 循環(huán)比使用 while 循環(huán)更好。
Exp12:使用 for 和 while 分別循環(huán) 100 次。
方法一
方法二
方法一耗時(shí) 3.894683299999997s ,方法二耗時(shí) 1.0198077999999953s ,性能提升 73.82%
Numba 可以將 Python 函數(shù)編譯碼為機(jī)器碼執(zhí)行,大大提高代碼執(zhí)行速度,甚至可以接近 C 或 FORTRAN 的速度。它能和 Numpy 配合使用,在 for 循環(huán)中或存在大量計(jì)算時(shí)能顯著地提高執(zhí)行效率。
Exp12:求從 1 加到 100 的和。
方法一
方法二
方法一耗時(shí) 3.7199997000000167s ,方法二耗時(shí) 0.23769430000001535s ,性能提升 93.61%
矢量化是 NumPy 中的一種強(qiáng)大功能,可以將操作表達(dá)為在整個(gè)數(shù)組上而不是在各個(gè)元素上發(fā)生。這種用數(shù)組表達(dá)式替換顯式循環(huán)的做法通常稱為矢量化。
在 Python 中循環(huán)數(shù)組或任何數(shù)據(jù)結(jié)構(gòu)時(shí),會(huì)涉及很多開(kāi)銷。NumPy 中的向量化操作將內(nèi)部循環(huán)委托給高度優(yōu)化的 C 和 Fortran 函數(shù),從而使 Python 代碼更加快速。
Exp13:兩個(gè)長(zhǎng)度相同的序列逐元素相乘。
測(cè)試數(shù)組:a = [1,2,3,4,5], b = [2,4,6,8,10]
方法一
方法二
方法一耗時(shí) 0.6706845000000214s ,方法二耗時(shí) 0.3070132000000001s ,性能提升 54.22%
若要檢查列表中是否包含某成員,通常使用 in 關(guān)鍵字更快。
Exp14:檢查列表中是否包含某成員。
測(cè)試數(shù)組:lists = ['life', 'is', 'short', 'i', 'choose', 'python']
方法一
方法二
方法一耗時(shí) 0.16038449999999216s ,方法二耗時(shí) 0.04139250000000061s ,性能提升 74.19%
itertools 是用來(lái)操作迭代器的一個(gè)模塊,其函數(shù)主要可以分為三類:無(wú)限迭代器、有限迭代器、組合迭代器。
Exp15:返回列表的全排列。
測(cè)試數(shù)組:["Alice", "Bob", "Carol"]
方法一
方法二
方法一耗時(shí) 3.867292899999484s ,方法二耗時(shí) 0.3875405000007959s ,性能提升 89.98%
根據(jù)上面的測(cè)試數(shù)據(jù),我繪制了下面這張實(shí)驗(yàn)結(jié)果圖,可以更加直觀的看出不同方法帶來(lái)的性能差異。
從圖中可以看出,大部分的技巧所帶來(lái)的性能增幅還是比較可觀的,但也有少部分技巧的增幅較小(例如編號(hào)5、7、8,其中,第 8 條的兩種方法幾乎沒(méi)有差異)。
總結(jié)下來(lái),我覺(jué)得其實(shí)就是下面這兩條原則:
內(nèi)置庫(kù)函數(shù)由專業(yè)的開(kāi)發(fā)人員編寫并經(jīng)過(guò)了多次測(cè)試,很多庫(kù)函數(shù)的底層是用 C 語(yǔ)言開(kāi)發(fā)的。因此,這些函數(shù)總體來(lái)說(shuō)是非常高效的(比如 sort() 、 join() 等),自己編寫的方法很難超越它們,還不如省省功夫,不要重復(fù)造輪子了,何況你造的輪子可能更差。所以,如果函數(shù)庫(kù)中已經(jīng)存在該函數(shù),就直接拿來(lái)用。
有很多優(yōu)秀的第三方庫(kù),它們的底層可能是用 C 和 Fortran 來(lái)實(shí)現(xiàn)的,像這樣的庫(kù)用起來(lái)絕對(duì)不會(huì)吃虧,比如前文提到的 Numpy 和 Numba,它們帶來(lái)的提升都是非常驚人的。類似這樣的庫(kù)還有很多,比如Cython、PyPy等,這里我只是拋磚引玉。
原文鏈接:
python(15):函數(shù)(2)
===============================
函數(shù)并非總是直接顯示輸出,相反,它可以處理一些數(shù)據(jù),并返回一個(gè)或一組值。函數(shù)返回的值被稱為返回值。在函數(shù)中,可
使用return語(yǔ)句將值返回到調(diào)用函數(shù)的代碼行
有時(shí)候,需要讓實(shí)參變成可選的,這樣使用函數(shù)的人就只需要在必要時(shí)才提供額外的信息,可以使用默認(rèn)值來(lái)讓實(shí)參變成可選的。
例如,假設(shè)要拓展函數(shù)get_formstted_name(),使其還處理中間名,為此,可將其修改類似于下面這樣
本文題目:python第15步函數(shù) python第六章函數(shù)
網(wǎng)站地址:http://www.ef60e0e.cn/article/doejeig.html