产品介绍

互联网爬虫BONC-Spider是一个对网络数据进行采集的在线数据爬虫工具,主要面向的客户是对网络数据有采集需求的组织或企业。

我们的优势

采集强度高

支持脚本动态采集、登录采集、跨层采集等。对于疑难采 集页面,有成熟的解决方案

采集速度快

支持多任务同时进行,每个任务又可以设置多线程, 确保运行效率

采集规模化

支持任务多级分类、批量管理。支持云服务器分布式部署, 管理员团队协和

采集自动化

支持基于时间触发的自动化采集,包括定时触发和循 环触发

特性

用于对指定网页、网站、评论、论坛以及社交软件上的信息进行抓取,用于刻画用户标签以及监测舆情等

产品功能

  • 强稳定性

    目标网页改版后,自动通知管理员

  • 反向代理

    cookie,header等信息对特殊网站进行爬取,解决反爬等问题

  • 高易用性

    在线的数据采集系统,对操作系统没有要求,只需装有浏览器,联网即可使用

  • 灵活的数据储存

    爬取的数据存储在用户设置的存储设置中的表内

  • 增量爬取

    支持增量采集和自动更新,支持多种调度策略

  • 并发爬取

    可以同时对多个网站进行爬取