发新话题 回复该主题

关于循环设置网页出现固定值的问题(表格网页数据抓取) [复制链接]

1#
关于循环设置网页出现固定值的问题。

现象:设置循环采集表格网页时,由于设置顺序不对,会产生如下情况,采集出来都是固定的一个值。见红框处


详细解决办法:

第一步:回到初始状态


第二步:拖动获取数据至循环框中(需要这么做,不然数据无法跟着循环动起来)


第三步:回到循环列表设置一下(这步非常关键,不操作这步出不来循环数据),并且点击一下红框


第四步,此时可以点击“提取数据”,然后再网页上点击你需要的数据进行抓取

第五步,完成后点击运行,你就可以看到动态的循环数据了。
最后编辑海**情 最后编辑于 2016-11-17 14:48:53
本主题由 版主 海**情 于 2016/12/3 19:11:48 执行 提升/下沉主题 操作
分享 转发
TOP
2#

我把规则也上传了,规则名称是“表格网页数据抓取”,需要时可以去看看:)
TOP
3#

不错,写的很清楚,其实重点就是第3步,要先选中循环,然后看一下当前循环选中项(也就是循环列表第一行,楼主第3步的红色框),这样做是确定需要循环的网页元素。
然后再选中“提取数据”,点击页面字段提取的时候,注意一定要选择上一步红色框对应的网页位置里面的内容。也就是要点击红色框所对应的网页元素里面包含的网页内容,这样系统就能自动识别循环项和点击要提取的字段之间的关系,并且自动计算其他循环项和要提取的字段的关系。最终对每个循环项完成循环提取。

其实楼主写的很清楚了,还有配图,大家仔细看,一定能解决类似问题。

再次对楼主的热心分享表示感谢!
八爪鱼,让数据触手可及!八爪鱼采集器,最好用的网页数据采集工具!
TOP
4#

这个帖子不错啊,正好学习
TOP
5#

想跟管理员请教下,如果红框里所含的内容不包括要提取的内容,怎么样设置?FF0000这块的设置又是怎么回事呢?我在提取代码里面的字段时,软件会自动将其他不需要的div框里面的内容放到循环列表里面,删不掉。这个不需要的div框又恰好是第一个,也就是楼主所标识的红框里,导致我的提取内容不包括在红框里面。很苦恼,不知道怎么解决!希望大神搭救下
TOP
6#

翻页倒是翻过去了,可是采集的内容怎么仍旧是第一页的内容,怎么解决啊
TOP
7#

回复 6楼stsj528的帖子

我也有这样的问题
TOP
8#

回复 6楼stsj528的帖子

把提取数据循环放到翻页循环里面
TOP
9#

回复5楼中华人参网,在进行循环列表时,可以利用xpath的position功能,把第一行给摒弃掉
TOP
10#

回复 5楼中华人参网的帖子

你搞懂了没有?我研究了好久还是这样
TOP
发新话题 回复该主题