1. <ul id="0c1fb"></ul>

      <noscript id="0c1fb"><video id="0c1fb"></video></noscript>
      <noscript id="0c1fb"><listing id="0c1fb"><thead id="0c1fb"></thead></listing></noscript>

      99热在线精品一区二区三区_国产伦精品一区二区三区女破破_亚洲一区二区三区无码_精品国产欧美日韩另类一区

      RELATEED CONSULTING
      相關(guān)咨詢
      選擇下列產(chǎn)品馬上在線溝通
      服務(wù)時(shí)間:8:30-17:00
      你可能遇到了下面的問題
      關(guān)閉右側(cè)工具欄

      新聞中心

      這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
      Python中Xpath如何使用

      這篇文章主要介紹了Python中Xpath 如何使用,具有一定借鑒價(jià)值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。

      成都創(chuàng)新互聯(lián)公司堅(jiān)持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都網(wǎng)站制作、做網(wǎng)站、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時(shí)代的龍安網(wǎng)站設(shè)計(jì)、移動(dòng)媒體設(shè)計(jì)的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!

      xpath速度比較快,是爬蟲在網(wǎng)頁定位中的較優(yōu)選擇,但是很多網(wǎng)頁前端代碼混亂難以定位,而學(xué)習(xí)定位也較為不易,這里列出一點(diǎn)編程過程中可能有用的東西。

      試驗(yàn)環(huán)境:Python環(huán)境,lxml.etree

      試驗(yàn)所使用的html代碼

      
      
      
          xpath test
      
      
      
          
              
                    
      • 時(shí)間
      •             
      • 地點(diǎn)
      •             
      • 任務(wù)
      •         
          
                   

      這里是個(gè)小標(biāo)題

              
                    1             2             3         
              
                    84             104             223         
          
          
              

      這里是H3的內(nèi)容             百度一下             
                        
      • test1
      •                 
      • test2
      •             
              

          
                   
                    
      • 1
      •             
      • 2
      •             
      • 3
      •             
      • 4
      •             
      • 5
      •             
      • 6
      •             
      • 7
      •             
      • 8
      •             
      • 9
      •             
      • 10
      •         
          

      1、匹配某節(jié)點(diǎn)下的所有.//

      //獲取文檔中所有匹配的節(jié)點(diǎn),.獲取當(dāng)前節(jié)點(diǎn),有的時(shí)候我們需要獲取當(dāng)前節(jié)點(diǎn)下的所有節(jié)點(diǎn),.//一定要結(jié)合.使用//,否則都會(huì)獲取整個(gè)文檔的匹配結(jié)果.

      2、匹配包含某屬性的所有的屬性值//@lang

      print tree.xpath('//@code') #匹配所有帶有code屬性的屬性值
      >>['84', '104', '223']

      3、選取若干路徑|

      這個(gè)符號(hào)用于在一個(gè)xpath中寫多個(gè)表達(dá)式用,用|分開,每個(gè)表達(dá)式互不干擾

      print tree.xpath('//div[@id="testid"]/h3/text() | //li[@data]/text()') #多個(gè)匹配條件
      >>[u'\u8fd9\u91cc\u662f\u4e2a\u5c0f\u6807\u9898', '1', '2', '3']

      4、 Axes(軸)

      child:選取當(dāng)前節(jié)點(diǎn)的所有子元素

      >>print tree.xpath('//div[@id="testid"]/child::ul/li/text()') #child子節(jié)點(diǎn)定位
      >>['84', '104', '223']
      
      >>print tree.xpath('//div[@id="testid"]/child::*') #child::*當(dāng)前節(jié)點(diǎn)的所有子元素
      >>[]
      
      >>#定位某節(jié)點(diǎn)下為ol的子節(jié)點(diǎn)下的所有節(jié)點(diǎn)
      >>print tree.xpath('//div[@id="testid"]/child::ol/child::*/text()') 
      >>['1', '2', '3']

      attribute:選取當(dāng)前節(jié)點(diǎn)的所有屬性

      >>print tree.xpath('//div/attribute::id') #attribute定位id屬性值
      >>['testid', 'go']
      
      >>print tree.xpath('//div[@id="testid"]/attribute::*') #定位當(dāng)前節(jié)點(diǎn)的所有屬性
      >>['testid', 'first']

      ancestor:父輩元素 / ancestor-or-self:父輩元素及當(dāng)前元素

      >>print tree.xpath('//div[@id="testid"]/ancestor::div/@price') #定位父輩div元素的price屬性
      >>['99.8']
      
      >>print tree.xpath('//div[@id="testid"]/ancestor::div') #所有父輩div元素
      >>print tree.xpath('//div[@id="testid"]/ancestor-or-self::div') #所有父輩及當(dāng)前節(jié)點(diǎn)div元素
      >>[]
      >>[]

      following :選取文檔中當(dāng)前節(jié)點(diǎn)的結(jié)束標(biāo)簽之后的所有節(jié)點(diǎn)

      #定位testid之后不包含id屬性的div標(biāo)簽下所有的li中第一個(gè)li的text屬性
      >>print tree.xpath('//div[@id="testid"]/following::div[not(@id)]/.//li[1]/text()') 
      >>['test1']

      感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享Python中Xpath 如何使用內(nèi)容對(duì)大家有幫助,同時(shí)也希望大家多多支持創(chuàng)新互聯(lián),關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,遇到問題就找創(chuàng)新互聯(lián),詳細(xì)的解決方法等著你來學(xué)習(xí)!


      網(wǎng)站名稱:Python中Xpath如何使用
      本文鏈接:http://www.ef60e0e.cn/article/pchpdh.html
      99热在线精品一区二区三区_国产伦精品一区二区三区女破破_亚洲一区二区三区无码_精品国产欧美日韩另类一区
      1. <ul id="0c1fb"></ul>

        <noscript id="0c1fb"><video id="0c1fb"></video></noscript>
        <noscript id="0c1fb"><listing id="0c1fb"><thead id="0c1fb"></thead></listing></noscript>

        申扎县| 枣强县| 罗定市| 法库县| 双桥区| 潮安县| 墨竹工卡县| 康平县| 咸阳市| 黄冈市| 长泰县| 讷河市| 开阳县| 邵东县| 雅江县| 尚志市| 濮阳市| 惠州市| 陇南市| 满城县| 高淳县| 桦川县| 崇礼县| 苍梧县| 正阳县| 大田县| 临西县| 雅安市| 阳信县| 锦州市| 文昌市| 浏阳市| 乌兰县| 太康县| 太仓市| 章丘市| 瑞丽市| 宜君县| 驻马店市| 利辛县| 包头市|