我们用http://www.ccgp-shanxi.gov.cn/view.php?app=&type=&nav=100&page=1做测试,图中的名称,地区和状态是我要的值,我只要当前列表的...
火车浏览器导出的cookie是所有打开页面的cookie,而火车采集器在调用该cookie时,若有多个相同的key ,则以最上面的key为准,如下图:则这可能会导致火...
示例网址:58游泳卡第一页:http://bj.58.com/youyongka/采集其中电话号码步骤为:(1)下载相应版本的58电话号码插件,下面以V9为示例:下载地址为:h...
本次教程使用模拟器示例为夜神模拟器,下面具体介绍下设置方法:(1)下载夜神模拟器,然后按照提示安装。下载地址:https://www.yeshen.com/(2)安装...
记录自增ID:同一个内容页中,多个标签设置记录自增ID,那么多个标签都是从1开始自增,再次测试运行又会重新开始从1自增,更换个内容页测试运行,也是...
下面介绍下火车采集器二级代理功能,我们按照实际在规则中设置的方式来介绍下如何在火车采集器中使用二级代理列表1.获取IP获取ip有三种方式:(1...
起始网址目前支持四种导入方式,下面介绍数据库导入功能:数据库导入支持mysql以及sqlserver两种数据库类型,在使用此功能时需要填写数据库相应的连接...
一.功能介绍: 采集器运行任务时候,通过访问指定的网页来获取cookie进行调用。使用场景: &nbs...
如下图:编辑标签界面,文件下载选项,勾选探测文件并下载,会把采集到的任何格式的文件附件下载下来,包含常见的图片。顺便说下其他选项:“将相对地址...
获取当前采集页的网址,可以按下面设置, 正则提取规则为: ^(?<content>[\s\S]*?)$
关联区域功能,可以先截取网页中指定区域内容,然后将该区域作为数据来源再进行采集处理。 &n...
数据提取方式支持调用其他标签值可以让采集过程更加灵活,在提取中点击标签符号即可调用其他标签的值。下面介绍下具体使用方法:我们以网址:https://d...
火车采集器数据获取新增支持CSS selector,很多网页的css 的属性唯一,此功能更利于批量从网页中提取数据。 如要系统性学习css提取的知识,可以先...
区间变化的变化原理为:地址中的两个参数以固定的间隔进行增长,并且相邻两组值的结束值与起始值间隔为1,以这种形式变化增长的地址格式可以使...