NETARM(ANDX)V3.0 自带的采集功能,可以实现24小时不间断采集与更新数据,达到无人值守的效果。
具体方法如下:
一、打开需要采集数据的栏目的配置文件,如:config/article/pick.andx
pick:1表示启用,0表示不启用。只对该栏目有效。
setup:可以为多个站点,用半角逗号分割。后面的部分需要相应复制、粘贴,改name1为name2...以经类推。
*.url:采集的网址。
*.list:采集页面的列表页地址的正则判断格式。
*.detail:采集页面的详情页地址的正则判断格式。
*.topic:标题所在的标签:标签:标识名:标识值。
*.content:内容所在的标签:标签:标识名:标识值。
*.sort:数据在网站上使用的分类ID号。
二、运行pick.bat。