有的用户反映说,采集器会重复发布文章,也就是说发布到网站的网站,下一次运行 又接着发布,导致网站上内容重复。
这个问题,需要从以下两点入手考虑:
...
火车采集器企业版本软件是专门提供给多人协同使用的版本,因此有多种便于管理的功能,而其中的远程管理功能是其中的重要功能点。&nb...
在采集网站时,如果目标网站有防采集机制,那么就无法达到批量采集的目的,这里介绍下火车采集器中的二级代理功能,可以在火车采集器中调...
在V9中内置翻译的插件,使用以下步骤:1.下载下面这个压缩包,并解压到采集器根目录下,注意解压的过程中要关闭火车采集器翻译插件点击下载链接2.若您...
插件下载地址:点击下载插件在火车采集器中如何安装智能原创插件第一步,使用解压软件,提取插件安装包中的文件,解压到一个文件夹中。第二步,打开解...
采集器可以通过设置的词库,来进行中文分词,就是经常说的自动提取关键词。1, 设置词库如下图:如上图 工具==》中文分词管理,来进行中文分词管理点击...
此功能是针对用户需求为:采集内容包含某个字符即将该字段的所有内容都替换为某个固定的内容。 使用场景例如:我们从对方网站采集城市名...
登录时提示如下:那么你需要将plugins下的插件使用最新版本的插件覆盖下:下载附件,根据不同的版本选择插件:插件点此下载
最新版的采集器中新增加了对于http二级代理的API请求功能,下面介绍一下这个功能如何添加。首先您需要找到一家代理IP,该代理需提供通过API获取IP的功...
采集器9.4.3.0619新增采集预警功能,如下图该功能是:当采集完成后,如果采集结果符合预设条件时,向指定邮箱发送预警邮件。预设条件可选择为:发送邮...
采集器运行后提示后提示一下信息请下载当前文件 ,解压后替换到system文件夹下即可
“火车伪原创插件.dll” 文件放到Plugins目录下。“火车伪原创插件配置工具.exe” 文件放在采集器根目录下,和LocoySpider.exe放在同一目录。通...
语法测试时提示以上错误提示,是因为程序集没有引用,下面介绍下解决方法:1.linq程序集在工具→点击引用,选择system.Linq.dll2.regularE...
火车采集器企业版本软件是专门提供给多人协同使用的版本,因此有多种便于管理的功能,而其中的远程管理功能是其中的重要功能点。&nb...
sqlite中设置自增ID后,自增ID已经记录,就算清空已经采集的内容,再次采集时,自增ID也是从上一次的ID后递增,想要重置自增ID从零开始,需要按...