火车采集器教程

下载文件并发布到木翼下载系统 

  这篇文章是在采集文章并发布到DedeCMS系统的基础上进行扩展,一些部分会讲得略一些,如果您有的操作看不懂,请查看一下原文.

  我们打开火车默认的任务 下载软件并发布到木翼,然后一步步不说,

首先是标签的建立,下载类的因为标签很多,且需要和模块里一一对应,手工加容易出错,我们使用软件的标签智能提取功能,程序会自动新建标签.

智能提取

 

  网址获得部分很简单,主要是规则里有一些难度的,比如文件大小的获得和单位用的是正则表达式.

软件大小

大小单位

关键的一步是获得文件下载地址,我们看一下规则;

下载地址

这里是使用了替换,注意.原来网页上的下载地址是 http://www.codepub.com/d/downpage.php?n=1&id=14293::1230976050,我们点击后打开

http://www.codepub.com/d/downpage.php?n=1&id=14293::1230976050,还是原来的地址,但是上边有下载地址了,注意,地址是这样的

地址

有三个地址,我们取第一个:http://www.codepub.com/d/download.php?n=1&server=1&id=14293::1230976050,注意这里是有联系的,所以我们用替换就可以直接得到地址了.然后用它下载软件.测试,可以下载到了.

下面是下载的保存地址 u\download\2009-02\10 这个是程序默认的地址,后边的年月日是随时间变化的,我们用随机目录,然后测试下

下载目录

但是有一个问题,就是木翼默认会将

这里的文件地址和原来的动态地址加起来,这样就有问题了,下载地址不对了.怎么办呢?目前我还没有发现比较好的解决方法,只有先采集不发布,采集完了替换一下,只要标题,然后发布,就可以了.我们看批量采集.

下载中

发布成功

发布到网站的结果.

点进去看一下都正常,OK.