发新话题 回复该主题

关于按关键字抓取商品详情里的信息 [复制链接]

1#

[attachimg]4746[/attachimg]功能需要淘宝搜索空调,然后抓取数据,其中有几个字段是商品详情里的,比如图中的空调类型,冷暖类型,能效等级等,但它们在每个商品里的出现位置不固定,所以需要分别找到关键字然后录入字段。
我已经设置好了循环点击下一页,点击本页面所有商品,然后进来抓了价格,评价数等数据。还需要商品详情里的数据。就是这个按关键字查询怎么设置呢?
分享 转发
TOP
2#


TOP
3#

回复 2楼189*****498的帖子

利用xpath进行定位。您需要学习一下xpath相关知识。
例:想要了“冷暖类型”这个参数,则xpath写成:.//ul[@id='J_AttrUL']//li[contains(text(),'空调类型') ]如果要别的参数,则替换文本就行。



其实我们已经做好了这个需求的模板,您直接用就行,不过只能用于旗舰版以上的云采集。

最后编辑Se**ie 最后编辑于 2019-05-20 10:04:03
TOP
发新话题 回复该主题