标题在这众多提取方法中这次使用xpath进行模拟我们所面对的数据,进行一般和特殊的数据提取。
网址:https://www.xiazaiba.com/android/app/
文章以该网站进行xpath提取数据。
一、对于简单的数据来说,可以直接通过检查网页源码,之后进行copy其xpath的路径(提示:7、8成网页可以这样直接提取到)
- 第一步:鼠标右键,检查网页,也可以快捷键F12
/html/body/div/div[1]/div[6]/div/div[3]/div[1]/div[2]/a[1]/text()
这个xpath提取的是所有
/html/body/div/div[1]/div[6]/div/div[3]/div[1]/div[2]/a[position()>1]/text()
这个xpath提取的是所有之后的模块
- 还是翻页标签,还可以采用content()方法进行定位:
/html/body/div/div[1]/div[8]/div/a[contains(string(.),‘下一页’)]/@href