开始建立新任务
任务是采集器采集数据时的基本工作单元,它一定是建立在站点中的。采集器通过运行任务来采集发布数据。任务工作的步骤总体可以分为三步:采网址,采内容,发内容。一个任务的运行可以任意选择哪几步。而采集器又可以同时运行多个任务(默认设置是同时最多运行3个任务)。任务的编辑界面如图:
采网址,就是从列表页中提取出内容页的地址。 手动填写链接地址规则: <a href="链接地址" target=_blank>
这段代码就是提取网址的脚本规则。选中“启用自定义链接格式得到地址”和“禁用系统自动识别链接”,并如下图设置
2,采内容 在测试到的地址中,任意选择一个子地址,双击选中的地址或者点击“测试该页”按钮。如图: |