新聞中心
sorted函數(shù)python
sorted函數(shù)python介紹如下
成都創(chuàng)新互聯(lián)專注于射洪企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè)公司,成都做商城網(wǎng)站。射洪網(wǎng)站建設(shè)公司,為射洪等地區(qū)提供建站服務(wù)。全流程專業(yè)公司,專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,成都創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務(wù)
sorted() 作為?Python?內(nèi)置函數(shù)之一,其功能是對序列(列表、元組、字典、集合、還包括字符串)進(jìn)行排序。
sorted() 函數(shù)的基本語法格式如下
list = sorted(iterable, key=None, reverse=False)
其中,iterable 表示指定的序列,key 參數(shù)可以自定義排序規(guī)則;reverse 參數(shù)指定以升序(False,默認(rèn))還是降序(True)進(jìn)行排序。sorted() 函數(shù)會返回一個排好序的列表。
注意,key 參數(shù)和 reverse 參數(shù)是可選參數(shù),即可以使用,也可以忽略。
演示sorted()函數(shù)的基本代碼用法:
#對列表進(jìn)行排序
a = [5,3,4,2,1]
print(sorted(a))
#對元組進(jìn)行排序
a = (5,4,3,1,2)
print(sorted(a))
#字典默認(rèn)按照key進(jìn)行排序
a = {4:1,\
5:2,\
3:3,\
2:6,\
1:8}
print(sorted(a.items()))
#對集合進(jìn)行排序
a = {1,5,3,2,4}
print(sorted(a))
#對字符串進(jìn)行排序
a = "51423"
print(sorted(a))
為什么python內(nèi)置的sort比自己寫的快速排序快100倍?
主要原因,內(nèi)置函數(shù)用C寫的。在Python語言內(nèi)無論如何造不出內(nèi)置函數(shù)的輪子。這也是通常C跟C++語言用戶更喜歡造基礎(chǔ)算法的輪了的原因。因?yàn)镃/C++用戶真有條件寫出匹敵標(biāo)準(zhǔn)庫的算法,但很多高級語言不行,不是程序員技術(shù)差,是客觀條件就根本做不到。
你比如說Java語言沒人造字符串的輪子,C++光一個字符串類就有無數(shù)多的實(shí)現(xiàn)。是因?yàn)镃+用戶更喜歡寫字符串類嗎?顯然不是,一方面是因?yàn)镴ava語言內(nèi)沒法造出匹敵Java內(nèi)置標(biāo)準(zhǔn)庫算法的輪子,而C++真的可以,另外一個比較慘的原因是C++標(biāo)準(zhǔn)庫的字符串功能太弱了,大多數(shù)高級語言的字符串類功能都比C+標(biāo)準(zhǔn)庫字符串類功能更強(qiáng)。
寫C++的時候一大錯覺就是我覺著我能比標(biāo)準(zhǔn)庫還快,同樣的道理放在Python里面也同樣適用,不管是Python各種常用package或內(nèi)建函數(shù),基本上都針對實(shí)用場景作了優(yōu)化,自己手寫的算法一般是比不上內(nèi)建算法效率的,這也是為什么用Python時不鼓勵自己造輪子的原因。
回到這個問題,Python內(nèi)建的sort本質(zhì)上為C實(shí)現(xiàn)的函數(shù),本身執(zhí)行效率就會比Python快很多,并且會根據(jù)不同的數(shù)據(jù)規(guī)模采用不同的排序算法,故效率一般都會優(yōu)于自己在Python里面手寫的排序更何況題主寫的是基于遞歸的quicksort9,額外時間開銷大。
因?yàn)閜ython內(nèi)置的sort是用c語言寫的,如果你用c語言或者c++寫的話肯定是可以做到一樣快的至于為什么python計(jì)算效率比c語言能慢100倍這個具體的原理我不清楚,不過鑒于知乎上已經(jīng)有很多大佬解釋過這個問題,我就不在這里班門弄斧了
還有底下扯timsort的,快排序是所有比較排序算法里平均性能最優(yōu)的一族算法,像C++和rust里的unstable_sort都是用的快排序。可能在一些情況下,比如數(shù)組幾乎有序時,timsort會比快排序快。但是你隨便給一個數(shù)組,比如像題主那樣隨機(jī)一個一百萬大小的數(shù)然后排序,timsort是絕對不可能比快排序快的。絕對不可能。快的這100倍和timsort屁關(guān)系都沒有。
我是C/C++程序員,我可以很負(fù)責(zé)的告訴你,在用天下現(xiàn)有所有高級語言進(jìn)行排序的問題上,C要是認(rèn)了第二,則沒人敢認(rèn)第一。所以,我猜,Python以及好多其他高級語言,都會時不時直接上C語言寫的靜態(tài)庫和動態(tài)庫。我自己也造了不少輪子,有部分是因?yàn)閯倓偲鸩剑瑢ο到y(tǒng)API和函數(shù)庫不熟悉,找不到適合的,所以自己造輪子,后來發(fā)現(xiàn)了有更好的,我把我寫的拋棄了。但這里也不排除有一部分是因?yàn)槲覀€人覺得還有優(yōu)化的空間,所以自己用C語言重新造了一個輪子,這樣效率比現(xiàn)成的更優(yōu)。
所以說,要論高級語言的鼻祖,還真非C莫屬,從執(zhí)行效率上講,別說python,JAVA,C#,VB,甚至C的親兒子C++,在同一個程序員手中,都沒法與C抗衡,所以說,這些語言都是排著隊(duì)等著被C吊打的,也正因?yàn)槿绱耍裕駊ython這類高級語言,有自帶函數(shù)可用的,最好別想著自己重新造輪子,因?yàn)槟悴豢赡茉斐霰茸詭Ш瘮?shù)更快的輪子。
內(nèi)置庫函數(shù)都是用C實(shí)現(xiàn)的,肯定要比手寫的Python程序執(zhí)行效率更高,此外內(nèi)置排序Timsort相比本科課程上學(xué)的時間復(fù)雜度為Onlogn的排序算法做了很多常數(shù)優(yōu)化,所以對于普通人而言,不要希望純手寫出來的東西效率能和標(biāo)準(zhǔn)庫相當(dāng)了。另外,題主寫的排序是過不了LeetCode上的裸排序題目的,隨機(jī)選取pivot對于快速排序是最基本的優(yōu)化雖然題主排的是隨機(jī)數(shù),現(xiàn)在這么選肯定不是效率低的主要原因。
所以說了,py幾乎得把自己的循環(huán)體拆了,這就是py和c/c++的性能差距,必須盡量用內(nèi)置函數(shù)和numpy來處理數(shù)據(jù),一旦手寫循環(huán)體。,那你就得知道這可能得慢百倍,像用opency的py版時你不小心寫個雙循環(huán)來處理數(shù)據(jù),那酸爽,而cppc#搞opencv就能隨意用指針來寫循環(huán),這也是為啥他們其實(shí)不需要numpy這種組件,自身就有足夠的性能和靈活度來處理這個。
Cpp內(nèi)置的排序是快排和堆排的結(jié)合,最壞時間復(fù)雜度為nlogn,而快排最壞是n2。至于python內(nèi)部的排序,我認(rèn)為是一個道理,不會簡簡單單是一個快排,舉個簡單例子,當(dāng)你數(shù)據(jù)已經(jīng)是有序的時候,再傳入快排肯定就不合適。那你設(shè)置排序函數(shù)的時候,是不是預(yù)先將他打亂,再進(jìn)行快排會更好呢。當(dāng)然具體不會這么簡單,只是我認(rèn)為官方給的接口都是很精妙的,很值得學(xué)習(xí)。
一方面Python中sort函數(shù)是用C語言寫的,C++內(nèi)部的sort是由快排,直接插入和堆排序混合的,當(dāng)數(shù)據(jù)量比較大的時候先用的快排,當(dāng)數(shù)據(jù)量小的時候用直接插入,因?yàn)楫?dāng)數(shù)據(jù)量變小時,快排中的每個部分基本有序,接近直接插入的最好情況的時間復(fù)雜度O(n),就比快排要好一點(diǎn)了。
另外一方面這個的底層實(shí)現(xiàn)就是歸并排序。,只是使用了Python無法編寫的底層實(shí)現(xiàn),從而避免了Python本身附加的大量開銷,速度比我們自己寫的歸并排序要快很多,所以說我們一般排序都盡量使用sorted和sort。
快速排序的Python 簡單實(shí)現(xiàn)
快速排序的Python 簡單實(shí)現(xiàn)
核心思想
先從待排序的數(shù)組中找出一個數(shù)作為基準(zhǔn)數(shù)(取第一個數(shù)即可),然后將原來的數(shù)組劃分成兩部分:小于基準(zhǔn)數(shù)的左子數(shù)組和大于等于基準(zhǔn)數(shù)的右子數(shù)組。然后對這兩個子數(shù)組再遞歸重復(fù)上述過程,直到兩個子數(shù)組的所有數(shù)都分別有序。最后返回“左子數(shù)組” + “基準(zhǔn)數(shù)” + “右子數(shù)組”,即是最終排序好的數(shù)組。
from random import randint
def quicksort(nums):
iflen(nums) =1:
? ? return nums
# 左子數(shù)組
less = []
# 右子數(shù)組
greater = []
# 基準(zhǔn)數(shù)
base= nums.pop()
# 對原數(shù)組進(jìn)行劃分
forxin nums:
? ? ifx
? ? ? ? less.append(x)
? ? else:
? ? ? ? greater.append(x)
# 遞歸調(diào)用
returnquicksort(less) + [base] + quicksort(greater)if__name__ =='__main__':
nums = [randint(-1000,1000)forxinrange(100)]
print (quicksort(nums))
輸出:
[1,2,3,4,5,6,7,8,9,10]
快速排序算法的平均時間復(fù)雜度為O(nlogn),通常認(rèn)為在所有同數(shù)量級的排序算法中,快速排序的平均性能是最好的,這也是它被稱為“快速排序”的原因。
快速排序算法相比于其他排序算法來說比較耗費(fèi)空間資源,因?yàn)榭焖倥判蛐枰獥?臻g來實(shí)現(xiàn)遞歸。
快速排序的基準(zhǔn)元素的選取非常重要,如果基準(zhǔn)元素選取不當(dāng),可能影響排序過程的時間復(fù)雜度和空間復(fù)雜度。為了避免快速排序退化為冒泡排序以及遞歸棧過深等問題,通常依照“三者取中”的法則來選取基準(zhǔn)元素。三者取中法是指在當(dāng)前待排序的子序列中,將其首元素、尾元素和中間元素進(jìn)行比較,在三者中取中值作為本趟排序的基準(zhǔn)元素。
python實(shí)現(xiàn)快速排序(QuickSort)
快速排序使用分治法來把一個串(list)分為兩個子串(sub-lists)。具體算法描述如下:
注:遞歸到最底部的判斷條件是數(shù)列的大小是零或一,此時該數(shù)列顯然已經(jīng)有序。
選取基準(zhǔn)值有數(shù)種具體方法,此選取方法對排序的時間性能有決定性影響。
想了解其他排序相關(guān)算法可以,看作者的 排序算法專欄 。
如果喜歡作者,歡迎點(diǎn)贊、收藏及關(guān)注,謝謝!
點(diǎn)擊下面相應(yīng)的鏈接即可查看各個算法的詳細(xì)介紹及python實(shí)現(xiàn)方法 :
當(dāng)前文章:Python快速排序函數(shù) 快速排序 Python
文章來源:http://www.ef60e0e.cn/article/dooiigi.html