火车采集器

采集发布成功和错误的管理

有时候,我们在数据发布时会出现一些问题,比如模块不正确,成功标识码不全,而导致发布后需要重新进行数据处理,现在我们以常见的几种情况讲一下处理方式方法:

1.显示数据发布失败,网站上确实也没有内容,需重新发布.

答:这种情况下请选中任务,右键"标记内容发布状态为未发".然后再重新发布一次即可.

2. 显示数据发布失败,网站上显示的是发布成功,

答:这种情况下,一般是您的模块里的成功标识码不正确.您需要重新测试发布一次,查看能提示成功的代码,并将原模块里的成功标记码用新的替换.如果您不想再发布这些数据,请选中任务并右键"清空该任务所有本地采集数据".如果您需要重新发布一次,请按问题1的处理方法解决.

3. 显示数据发布成功,但网站上却没有内容.

答:解决方法同问题2.

4.采集完内容后,发现规则有问题,原来的一些数据采错了,现在修改了规则,怎么重新采集那些未采集到的内容.

答:这个请在本地编辑任务里执行sql语句, update Content set 已采=0 where 内容='' ,这个意思是将所有内容为空的记录标记为未采,然后我们只选采内容,执行任务,就会采那些没内容的信息.