新聞中心
本篇文章為大家展示了使用python爬蟲怎么實(shí)現(xiàn)一個(gè)發(fā)送短信驗(yàn)證碼功能,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。
內(nèi)聯(lián)代碼片
。
import time def get_time() : " 獲取當(dāng)前的時(shí)間戳" now_time =str(int(time.time()*1000))#獲取毫秒級的時(shí)間戳 print('當(dāng)前的時(shí)間戳',now_time) return now_time get_time()
來看運(yùn)行結(jié)果
我們目前可以這樣去做
我們把這個(gè)獲取到的時(shí)間戳參數(shù)加入到url中,我們可以實(shí)現(xiàn)動(dòng)態(tài)的獲取,每次要要獲取這個(gè)二維碼時(shí)就需要指定當(dāng)前的時(shí)間time參數(shù),那我們完全可以這樣來構(gòu)造這個(gè)url。我們用一個(gè)變量來接收獲取的時(shí)間戳,然后以字符串的形式加入到time后面。
下面展示一些內(nèi)聯(lián)代碼片
。
import time def get_time() : " 獲取當(dāng)前的時(shí)間戳" now_time =str(int(time.time()*1000))#獲取毫秒級的時(shí)間戳 print('當(dāng)前的時(shí)間戳',now_time) return now_time time_one = get_time() img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one print(img_url)
我們來看是否可以獲取到相應(yīng)正確的url
我們點(diǎn)入那個(gè)藍(lán)色的鏈接,來看有沒有獲取到這個(gè)驗(yàn)證碼圖片。
測試證明我們完全是對的。
下一步我們要做的是實(shí)現(xiàn)代碼的訪問,獲取并保存這個(gè)驗(yàn)證碼。為什么保存,我們應(yīng)該知道這點(diǎn)知識(shí)。
看這三個(gè)提交欄,很明顯是一個(gè)要提交表單的。提交那就需要post,而post請求呢,就是要提交我們的數(shù)據(jù),及手機(jī)號碼和圖形驗(yàn)證碼。
當(dāng)我們把數(shù)據(jù)提交上去以后,我們在手機(jī)上就會(huì)收到短信驗(yàn)證碼。我們以此來實(shí)現(xiàn)發(fā)送短信驗(yàn)證碼的功能。
我們來保存圖片驗(yàn)證碼
下面展示一些內(nèi)聯(lián)代碼片
。
import time import requests def get_time() : " 獲取當(dāng)前的時(shí)間戳" now_time =str(int(time.time()*1000))#獲取毫秒級的時(shí)間戳 print('當(dāng)前的時(shí)間戳',now_time) return now_time time_one = get_time() img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one print(img_url) headers = { 'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36' } response = requests.get(url=img_url,headers = headers) img_data = response.content with open('yzm.jpg',mode = 'wb') as file : file.write(img_data)
可以看到在代碼編輯器右邊已經(jīng)出現(xiàn)了保存的圖片。
下一步我們繼續(xù)來分析這個(gè)手機(jī)號碼的數(shù)據(jù)和圖片驗(yàn)證碼的數(shù)據(jù)在哪里傳入,又是如何實(shí)現(xiàn)。
我們輸入一個(gè)手機(jī)號碼,然后輸入圖片驗(yàn)證碼,然后點(diǎn)擊免費(fèi)獲取。此時(shí)再次進(jìn)行抓包,抓包的方法與上文的第一次抓包方法相同。
我們來看會(huì)出現(xiàn)什么樣的包。
藍(lán)色部分的就是我們尋找的目標(biāo)包。然后我們?nèi)绾稳プ觯奎c(diǎn)擊打開查看相應(yīng)的代碼。
看到?jīng)]有post請求,是因該提交表單數(shù)據(jù)的。我們看看下面的表單數(shù)據(jù)
這里你會(huì)發(fā)現(xiàn)有一點(diǎn)不同電話號碼是直接的數(shù)字,圖片驗(yàn)證碼就需要你來處理了,因?yàn)槲覀兩衔谋4娴尿?yàn)證碼是圖片,你如何識(shí)別到這圖片驗(yàn)證碼里面額數(shù)據(jù),來進(jìn)行傳入呢?這里我們還需要一個(gè)網(wǎng)站。
超級鷹,是用來識(shí)別驗(yàn)證碼的,其實(shí)我們還是調(diào)用這個(gè)接口。
我們點(diǎn)擊開發(fā)文檔,我們是用Python寫的代碼。所以我們點(diǎn)擊python的圖標(biāo),來這里來查看我們需要的。
在下面找到超級鷹圖像識(shí)別,然后點(diǎn)擊下載。把里面的api接口的py文件導(dǎo)入到你的python編輯器。我這里是用Pycharm寫的。所以直接將解壓出來的Python文件拖入pycharm。
下面是里面的部分代碼。
這里面做了小小的修改。我們直接來看這段代碼寫了什么。
我來告訴大家原始的代碼有問題,很低級的問題。
#!/usr/bin/env python # coding:utf-8 import requests from hashlib import md5 class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username password = password.encode('utf8') self.password = md5(password).hexdigest() self.soft_id = soft_id self.base_params = { 'user': self.username, 'pass2': self.password, 'softid': self.soft_id, } self.headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)', } def PostPic(self, im, codetype): """ im: 圖片字節(jié) codetype: 題目類型 參考 http://www.chaojiying.com/price.html """ params = { 'codetype': codetype, } params.update(self.base_params) files = {'userfile': ('ccc.jpg', im)} r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers) return r.json() def ReportError(self, im_id): """ im_id:報(bào)錯(cuò)題目的圖片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json() if __name__ == '__main__': chaojiying = Chaojiying_Client('超級鷹用戶名', '超級鷹用戶名的密碼', '96001') #用戶中心>>軟件ID 生成一個(gè)替換 96001 im = open('a.jpg', 'rb').read() #本地圖片文件路徑 來替換 a.jpg 有時(shí)WIN系統(tǒng)須要// print chaojiying.PostPic(im, 1902) #1902 驗(yàn)證碼類型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加()
上面這個(gè)是他的原始接口代碼。就很離譜。分塊來分析。
def __init__(self, username, password, soft_id): self.username = username password = password.encode('utf8')#沒有縮進(jìn) self.password = md5(password).hexdigest() self.soft_id = soft_id ....... .......
這塊的錯(cuò)誤在哪呢?我這里特意表明突出,上面的原始代碼直接沾到這里并不突出,但是你用編輯器打開會(huì)有問題的。
if __name__ == '__main__': chaojiying = Chaojiying_Client('超級鷹用戶名', '超級鷹用戶名的密碼', '96001') #用戶中心>>軟件ID 生成一個(gè)替換 96001 im = open('a.jpg', 'rb').read() #本地圖片文件路徑 來替換 a.jpg 有時(shí)WIN系統(tǒng)須要// print chaojiying.PostPic(im, 1902) #print沒有加 () #1902 驗(yàn)證碼類型 官方網(wǎng)站>>價(jià)格體系 3.#4+版 print 后要加()
還有一處,在這里,代碼格式都沒有寫對,我這里指出,讀者應(yīng)該可以發(fā)現(xiàn)。這里介意讀者可以去平臺(tái)下載這個(gè)接口,自己去修改。
好,且不在談這些,我們繼續(xù)。我們還是修改部分代碼。
def ReportError(self, im_id): """ im_id:報(bào)錯(cuò)題目的圖片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json() if __name__ == '__main__': chaojiying = Chaojiying_Client('超級鷹用戶名', '超級鷹用戶名的密碼', '96001') #用戶中心>>軟件ID 生成一個(gè)替換 96001 im = open('a.jpg', 'rb').read() #本地圖片文件路徑 來替換 a.jpg 有時(shí)WIN系統(tǒng)須要// print chaojiying.PostPic(im, 1902) #這是原始的代碼 #1902 驗(yàn)證碼類型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加()
我們可以在這內(nèi)部寫一個(gè)方法,我們待會(huì)要調(diào)用這個(gè)代碼接口時(shí),直接調(diào)用這個(gè)方法。
注意我們在類里面添加這樣一部分代碼,就是寫一個(gè)方法
def run(self): chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD, 913137) # 用戶中心>>軟件ID 生成一個(gè)替換 96001 im = open('yzm.jpg', 'rb').read() # 本地圖片文件路徑 來替換 a.jpg 有時(shí)WIN系統(tǒng)須要// result = chaojiying.PostPic(im, 1004) # 1902 驗(yàn)證碼類型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加() return result['pic_str']
注意分析這個(gè)接口代碼,里面 chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD,913137)
在注釋里面其實(shí)說的已經(jīng)很清楚了,這里的constant代表我們要導(dǎo)入的py文件,里面包含你的用戶名,密碼,以及軟件id。
im = open(‘yzm.jpg', ‘rb').read()
打開你保存的驗(yàn)證碼文件,上面我們已經(jīng)保存過。result = chaojiying.PostPic(im, 1004)
1004代表你的驗(yàn)證碼類型。
用戶名和密碼你需要注冊一下。那么軟件id和驗(yàn)證碼類型你該如何確定呢?
這是主頁,請點(diǎn)擊價(jià)格體系
在下面你可以來判斷你的驗(yàn)證碼類型了
我們這里需要登錄進(jìn)入用戶中心
進(jìn)入如下界面
往下拉進(jìn)入軟件id
進(jìn)入后點(diǎn)擊生成一個(gè)軟件id,軟件名稱和軟件說明可以隨便填寫
這樣我們就可以獲得一個(gè)軟件id 。
這個(gè)constant如何編寫,很簡單,建立一個(gè)py文件,里面寫入
USER_NAME=' …' PASSWORD='… '
然后保存即可。導(dǎo)入py文件到當(dāng)前路勁,然后import即可。
現(xiàn)在我們來看完整的代碼
接口完整修改后的代碼
import requests from hashlib import md5 import constant import constant class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username self.password = md5(password.encode('utf8')).hexdigest() self.soft_id = soft_id self.base_params = { 'user': self.username, 'pass2': self.password, 'softid': self.soft_id, } self.headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)', } def PostPic(self, im, codetype): """ im: 圖片字節(jié) codetype: 題目類型 參考 http://www.chaojiying.com/price.html """ params = { 'codetype': codetype, } params.update(self.base_params) files = {'userfile': ('ccc.jpg', im)} r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers) return r.json() def ReportError(self, im_id): """ im_id:報(bào)錯(cuò)題目的圖片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json() def run(self): chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD, 913137) # 用戶中心>>軟件ID 生成一個(gè)替換 96001 im = open('yzm.jpg', 'rb').read() # 本地圖片文件路徑 來替換 a.jpg 有時(shí)WIN系統(tǒng)須要// result = chaojiying.PostPic(im, 1004) # 1902 驗(yàn)證碼類型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加() return result['pic_str'] if __name__ == '__main__': chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD, 913137) # 用戶中心>>軟件ID 生成一個(gè)替換 96001 im = open('yzm.jpg', 'rb').read() # 本地圖片文件路徑 來替換 a.jpg 有時(shí)WIN系統(tǒng)須要// result = chaojiying.PostPic(im, 1004) print(chaojiying.PostPic(im,1004))# 1902 驗(yàn)證碼類型 官方網(wǎng)站>>價(jià)格體系 3.4+版 print 后要加()
主文件代碼,從這里執(zhí)行
import time import requests from chaojiying import Chaojiying_Client import constant def get_time() : " 獲取當(dāng)前的時(shí)間戳" now_time =str(int(time.time()*1000))#獲取毫秒級的時(shí)間戳 print('當(dāng)前的時(shí)間戳',now_time) return now_time time_one = get_time() img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one print(img_url) headers = { 'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36' } response = requests.get(url=img_url,headers = headers) img_data = response.content with open('yzm.jpg',mode = 'wb') as file : file.write(img_data) print(response) #驗(yàn)證碼識(shí)別 code = Chaojiying_Client(constant.USER_NAME,constant.PASSWORD,913137).run() print('識(shí)別出來的驗(yàn)證碼為',code) #請求保證同一個(gè)用戶 cookiejar = response.cookies cookies = cookiejar.get_dict() print(cookies) data = { 'phone' :19745678397, 'imgValidCode' : code, } time_two = get_time() code_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/getsms.do?×tamp'+time_two requests_two = requests.post(url=code_url,data= data,headers=headers,cookies=cookies) print(requests_two.json())
上述內(nèi)容就是使用python爬蟲怎么實(shí)現(xiàn)一個(gè)發(fā)送短信驗(yàn)證碼功能,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
標(biāo)題名稱:使用python爬蟲怎么實(shí)現(xiàn)一個(gè)發(fā)送短信驗(yàn)證碼功能-創(chuàng)新互聯(lián)
文章路徑:http://www.ef60e0e.cn/article/jjigi.html