软件星级:3分
火车采集器(LocoySpider) 是一个供各大主流文章系统,论坛系统等使用的多线程内容采集发布程序。在该软件中,强大的内容收集和数据导入功能可以将您收集的任何网页数据发布到远程服务器,并定制用户CMS系统模块。无论你的网站是什么系统,都可以使用火车采集器
火车采集器(LocoySpider)是一款功能强大且易于上手的专业采集软件,强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,自定义用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车采集器,系统自带的模块文件支持:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。 同时您也可以使用系统的数据导出功能,利用系统内置标签,将采集到的数据对应表的字段导出到本地任何一款Access,MySql,MS SqlServer内。
1、Web发布配置管理
2、任务运行日志查看器
3、任务设置批量复制
4、数据库入库配置管理
5、简易验证码识别系统
6、获取源代码、http模拟提交工具
网上下载火车采集器。安装完成打开,选择免费用户,密码可以自己随意输入:123456就可以。点击登录。
进入页面你会看到许多软件自带文件夹,不用管,或者删掉。点击新建右侧倒三角符号,选择新建分组。输入名称点保存即可。
下方会以文件夹出现你刚刚建立的分组名称。在文件夹上单击鼠标左键选中文件夹。
选中文件件后单击鼠标右键,选择新建任务。会出现如下对话框,随意输入任务名。
点击添加,会出现一个对话框,输入你要采集的网站或网站内某一个栏目的网址。点击右侧添加,下方会出现添加的网址,再点完成。
再点击下方的添加,在出的对话框里,会看到必须包含这一项,再把同样的网址输入进去点击保存。
刚刚我们完成的是第一步,选择第二步采集内容规则。如果只是简单的采集内容,可以直接在对话框中选择标题和内容,点击进入填写采集文章的源码。如果不懂源码,你可以随意打开一个网页,按键盘上的F12,下面就会出现页面的源码。
填写完之后点击确定即可,在右侧的典型页面你可以把要采集的网址输入进去,测试下是否采集到你想要采集的内容。
完成后,选择第三部发布内容,点击下方启用前面的选框,按步骤填写即可。
填完后选择保存,会返回初始页面,选中你刚刚输入的任务名,后面三个框要选中,点击鼠标右键开始任务即可,你想要的内容就会出现在你保存的文件夹内。
1.新增:User-Agent支持从文本读取并随机切换。教程://faq.locoy.com/q-1348.html。
2.新增:自动识别手机号功能支持14、15、16、17、19开头的新号段。
3.优化:文件下载完毕插件接口优化。
4.优化:探测文件下载时正式下载文件,提升下载速度。
5.修复:http请求头“Header或设置名”以数字开头的名称报错的问题修复。
6.修复:发布到word文档,如果数据包含特殊字符或本地图片异常会导致发布失败问题修复。
7.修复:拷贝任务时,任务备注未拷贝问题修复。
8.修复:标签引用支持调用“列表页”标签。
9.修复:json提取时如果json对象的“键”是整型导致提取有误。
10.优化:网址解析替换html问题。
11.修复:get、post分页问题处理。
12.修复:生成固定格式的数据中“系统时间”选中“06-16”生成时间格式“yyyy-MM”
13.新增:数据库发布模块支持replace into语句。