软件星级:3分
A1 Website Scraper是一个高级Windows应用程序,专门用于帮助您抓取网站并将数据提取到可自定义的CSV文件中。
用户界面
默认情况下,该工具显示简化的查看模式,该模式隐藏了一些高级配置设置。在两种模式之间切换需要单击一下。
A1网站抓取工具采用了多选项卡式布局,可以快速访问该程序的几个关键功能,这些功能使您可以设置抓取选项,扫描网站,分析网站和查看文件。
另外,您可以创建存储所有配置数据的项目,并将其保存在计算机上,以便将来可以导入和编辑它们。
提取配置设置
A1网站抓取工具随附许多专用参数,可帮助您自定义抓取和提取数据的方式。您可以使用自定义正则表达式从抓取的页面中获取数据并插入各种测试示例(例如,提取产品名称和URL,要提取的单个列,多个正则表达式函数)。
此外,您还可以定义输出数据格式(CSV文件格式),查看CSV测试输出,显示原始测试输出,抓取整个网站,控制要获取链接内容分析的URL,以及应用输出过滤器以抓取来自某些网址的数据。
该应用程序使您可以从纯文本文件中导入URL,调整生成的CSV文件的编码和字符格式,并使用标题或URL导出CSV数据。
扫描和分析网站
A1 Website Scraper允许您启动或停止扫描过程,在几个快速预设之间进行选择,查看有关扫描数据的信息(例如,扫描状态,总时间,内部和外部URL的数量,在搜寻器引擎中等待的作业)以及更改几个数据收集参数,例如创建网站扫描的日志文件,验证外部URL,存储所有页面的标题)。
分析模式创建带有链接的网站结构,并允许您应用过滤器(例如,仅显示具有重复标题,描述和关键字的URL),并查看有关每个网页的信息,即核心数据(例如标题,描述,完整地址,响应代码) )和外部数据(例如外部和内部链接)。此外,您可以预览文件和源数据。
表格,查看模式和其他便捷工具
您可以在文本编辑器,记事本,Internet Explorer或Firefox中打开所选文件,在表中添加或删除项目,插入行,上下移动项目,删除HTML注释,设置格式和去除空格,以及启用语法突出显示和拼写检查功能。
整体可靠的网站抓取工具
总而言之,A1网站抓取工具具有多种自定义功能,可用于抓取网站并将数据提取到CSV文件中,特别适合专业用户。