无码人妻一区二区三区精品视频,无码内射成人免费喷射

五月综合激情婷婷六月,日韩欧美国产一区不卡,他扒开我内裤强吻我下面视频 ,无套内射无矿码免费看黄,天天躁,日日躁,狠狠躁

公司動態(tài)

產(chǎn)品資訊

行業(yè)資訊

輕云服務器升級CN2線路有什么優(yōu)點

XPath

XPath即為XML路徑語言（XML Path Language），它是一種用來確定XML文檔中某部分位置的語言。

xpath是最常用且最便捷高效的一種解析方式，通用型強，其不僅可以用于python語言中，還可以用于其他語言中，數(shù)據(jù)解析建議首先xpath。

XPath使用方法

xpath解析原理：

實例化一個etree的對象，且需要將被解析的頁面源代碼數(shù)據(jù)加載到該對象中

調(diào)用etree對象中的xpath方法結合著xpath表達式實現(xiàn)標簽的定位和內(nèi)容的捕獲

安裝lxml

pip install -i https://mirrors.aliyun.com/pypi/simple/ lxml

from lxml import etree
tree = etree.parse('./tree.html')  #從本地加載源碼，實例化一個etree對象。必須是本地的文件，不能是字符串
tree = etree.HTML(源碼)  #從互聯(lián)網(wǎng)加載源碼，實例化etree對象
#  / 表示從從根節(jié)點開始，一個 / 表示一個層級，//表示多個層級
r = tree.xpath('//div//a') #以列表的形式返回div下的所有的a標簽對象的地址
r = tree.xpath('//div//a')[1] #返回div下的第二個a標簽對象地址
r = tree.xpath('//div[@class="tang"]')#以列表的形式返回tang標簽地址
r = tree.xpath('//div[@class="tang"]//a') #以列表的形式返回tang標簽下所有的a標簽地址
#獲取標簽中的文本內(nèi)容
r = tree.xpath('//div[@class="tang"]//a/text()') #以列表的形式返回所有a標簽中的文本
#獲取標簽中屬性值
r = tree.xpath('//div//a/@href')##以列表的形式返回所有a標簽中href屬性值

tree.html

<html lang="en">
 <head>
<meta charset="utf-8" />
<meta name="theme-color" content="#ffffff"></meta>
<title>xpaht測試</title>
 </head>
 <body>
  <div>
<p>百里守約</p>
  </div>
  <div class="song">
<p>前程似錦</p>
  </div>
  <div class="song">
<p>前程似錦2</p>
  </div>
  <div class="ming">  #后面改了名字
<p>以夢為馬</p>
  </div>  
  <div class="tang">
<ul>
 <li><a  title='qing'>清明時節(jié)</a></li>
 <li><a  title='qing'>秦時明月</a></li>
 <li><a  title='qing'>漢時關</a></li>
</ul>
  </div>
<flink-root></flink-root>
  <script type="text/javascript" src="runtime.0dcf16aad31edd73d8e8.js"></script>
  <script type="text/javascript" src="es2015-polyfills.923637a8e6d276e6f6df.js"></script>
  <script type="text/javascript" src="polyfills.bb2456cce5322b484b77.js"></script>
  <script type="text/javascript" src="main.8128365baee3dc30e607.js"></script>
 </body>
</html>

案例—58二手房

將頁面中的房源名稱解析出來，即將title值解析出來就行

思路

獲取房源名稱所在的url，并獲取其響應數(shù)據(jù)
數(shù)據(jù)解析，構造xpath表達式。提取目標數(shù)據(jù)

import requests
from lxml import etree
url = "https://bj.58.com/ershoufang/p1/"
headers={
 'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Mobile Safari/537.36'
}
pag_response = requests.get(url,headers=headers,timeout=3).text
#實例化一個etree對象
tree = etree.HTML(pag_response)
r = tree.xpath('//span[@class="content-title"]/text()') #獲取所有//span標簽為"content-title"的文本內(nèi)容
print(r)

Tips：我們使用xpath進行數(shù)據(jù)解析時，不能直接看元素就進行構造xpath表達式，以為很多情況下從瀏覽中看的元素結構和爬取下來的源碼結構不一樣。所以正確方法是先將源碼爬下來再觀察進行構造xpath。

如下瀏覽器中的元素結構和爬取的元素結構就不一樣。如果按照瀏覽器匯總的元素來構造xpath表達式，則不會解析成功！

總結

本篇文章就到這里了，希望能夠給你帶來幫助，也希望您能夠多多關注本站的更多內(nèi)容！

版權聲明：本站文章來源標注為YINGSOO的內(nèi)容版權均為本站所有，歡迎引用、轉(zhuǎn)載，請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網(wǎng)站，禁止在非maisonbaluchon.cn所屬的服務器上建立鏡像，否則將依法追究法律責任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學習參考，不代表本站立場，如有內(nèi)容涉嫌侵權，請聯(lián)系alex-e#qq.com處理。

動態(tài)撥號：關鍵詞排名下降是啥緣故，快速提高排名怎樣做

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項

概要：競價推廣費用大概要多少呢，競價推廣好不好

一下吧：SEO中site是什么意思，作用和應用是怎樣的

郵箱：付費郵箱有哪些優(yōu)勢，付費郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢呢