火车头采集器下载
有朋友问我:“下载了火车头采集器2010SP2版但打不开”。我觉得,这是初学火车头采集器经常碰到的问题。我把给他的回复转到这里,供有此问题的朋友参考。 火车头采集器正常运行的前提是:你的电脑必须安装net framework 2.0 它的下载地址:
http://download.microsoft.com/do ... 38565a/dotnetfx.exe
安装完net framework 2.0之后,再双击目录内的LocoySpider.exe文件就可启动主程序了。
如何用火车头采集一个页面的两部分的内容?正文开始代码是
另外可以用采集器,自动采集功能.动易2006,或者火车头采集器,火车头采集器使用方法在99D软件站有!火车头采集器下载地址在99d软件站也提供下载!!
去你百度搜索99d软件站!
软件使用,项目管理:
选择添加新项目,找到你需要采集的页面→复制网址到新闻网址列表框,项目名称随便填(主要是给你自己记忆备忘用)→下一步
项目编辑列表设置:
这里填写就要注意点了,找到你要采集的新闻列表的第一个信息标题的地方,一般标题前面这里会有一个table标签,选择这个table标签前面的具有典型特征的一些代码,代码具体选多少呢,分2种情况,一是有分页的列表,简单说就是列表最下面有下一页或者有1、2、3、等页面链接的,二是没有分页的,简单说就是列表只有1页,只有1页的情况好办,这里可以随便选了,只要保证不重复就行了。但是有分页的列表页就要麻烦一些,这时候选取代码的原则是:在保证没有重复代码的前提下,尽量选择少一点的代码,因为代码越多越容易出错,越不能保证每个列表页面都有这些代码了,这是经验之谈,当然也不一定,有些网页代码格式非常统一,那么这种网页就好采集,列表开始代码也好填一些。什么是具有典型特征的代码呢?就是基本上每个列表页都有的代码,但是这个页码在所有的列表页中又是唯一的,不重复。