之前分享过Firefox火狐插件firebug和xpath checker提取关键词,现分享一个谷歌xpath插件,毕竟用火狐浏览器的外贸人太少了。谷歌插件在chrome商店就能下载,非常方便。
注:xpath插件不限于阿里国际站,任何网页上都能用,毕竟我主要还是做国际站运营的。
正文:
一、谷歌浏览器安装插件
chrome商店下载地址:https://chrome.google.com/webstore/detail/xpath-helper/hgimnogjllphhhkhlmebbmlgjoejdpjl
二、例如提取标题,提取关键词举一反三。
1、打阿里国际站搜索关键词,展示结果,切换成列表展示
2、前面安装完xpath插件后,浏览器网址旁边会有一个xpath插件小图标,点击xpath插件小图标,下弹出黑色的下拉框。
3、随便选择一个产品标题旁边右击,选择:检查,然后浏览器往上弹出一个框
4、在弹出框的左上角,点击一次鼠标的小图标,选择一个产品的标题,进行代码定位。
5、选择标题代码位置
- 右击-选择copy-
- 选择copy xpath,
- 点击复制xpath。
- 然后粘贴到弹出来的xpath插件中。
- 显示提取出结果
6、修改xpath,提取全部数据。
默认xpath只是提取一条,你选择哪个产品的标题就提取哪条,修改对应第几条产品为*符号
比如刚才是选择第4条产品,然后把4修改*符号
修改前
/html/body/div[2]/div[2]/div[2]/div[3]/div[1]/div[2]/div[1]/div[2]/div[6]/div[1]/div[4]/div/div[1]/div[1]/div/div/div[1]/h2/a
修改后
/html/body/div[2]/div[2]/div[2]/div[3]/div[1]/div[2]/div[1]/div[2]/div[6]/div[1]/div[*]/div/div[1]/div[1]/div/div/div[1]/h2/a
建议在选择xpath的时候,不要选择第一条数据做为样式,否则很可以找不到位置
提取出来的数据复制到表格就行了。
只要是网页上的数据都能提取,后台数据管家关键词,P4P词,其它信息都能提取。
教程写的非常简单了,应该能看的懂了。
太好了,再也不用复制粘贴进EXCEL表,然后再吭哧吭哧删除排序提取了,嘤嘤嘤。
我以为能提取内在的关键词,那跟我和前台看到的一样没什么意思噢。。。。有点鸡肋
看不懂工具本身的作用或者不能举一反三的创造性使用,不是工具鸡肋…
谢谢分享
学习了
请教个问题,这样采集,是采集当前页面的所有标题
那么,假设我想采集10页,或20页。该如何操作呢
如果是大批量采集页数,推荐使用火车头采集器
谢谢
我有重要的问题联系你可以留个联系方式么 谢谢博主 急
扫公众号就可以加我
说的真好,应该是花了很长时间的,感谢!
xpath非常棒的工具