登录
首页 » java,html » web爬虫工具,抓取网页

web爬虫工具,抓取网页

于 2022-03-19 发布 文件大小:3.59 MB
0 54
下载积分: 2 下载次数: 1

代码说明:

基于webcollector-2.12 开发,web爬虫工具,抓取网页,使用方便快捷。 WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 WebCollector致力于维护一个稳定、可扩的爬虫内核,便于开发者进行灵活的二次开发。内核具有很强的扩展性,用户可以在内核基础上开发自己想要的爬虫。源码中集成了Jsoup,可进行精准的网页解析。2.x版本中集成了selenium,可以处理javascript生成的数据。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 办公协同平台,(适用于毕业设计)
    主要功能:用户管理 角色管理 信息发布 投诉管理 主要功能的简述; 角色管理:poi导入导出角色到excel中,利用ssh框架的文件上传与分页 权限管理:权限过滤器 投诉管理:通过fusionchart生成统计图 页面使用WDatepicker日期选择组件,ueditor 富文本编辑器,fusioncharts 统计图表工具组件
    2022-03-07 21:53:29下载
    积分:1
  • struts-extras扩展及045-046修复代码
    # The Apache Struts Extras[![License](http://img.shields.io/:license-apache-blue.svg)](http://www.apache.org/licenses/LICENSE-2.0.html)This a subproject of the [Apache Struts](http://struts.apache.org/) project which provides different plugins,mostly focused on fixing (if possibe) vulnerabilities in older versions of the framework.## List of plugins- [Apache Struts 2 Secure Jakarta Multipart parser plugin](struts2-secure-jakarta-multipart-parser-plugin/README.md)- [Apache Struts 2 Secure Jakarta Stream Multipart parser plugin](struts2-secure-jakarta-stream-multipart-parser-plugin/README.md)## LicenseRelease under Apache License 2.0
    2022-01-26 06:51:22下载
    积分:1
  • 社区系统
     随着我国的经济发展和城市开发,住宅小区越来越成为居住的主流,运用一个系统来对社区居民信息进行管理和促进居民之间的交流是当代社会这一市场所需要的。社区管理和交流平台是利用计算机来处理社区的信息,通过计算机联网可以实现数据的远程访问和共享,从而方便管理并节约成本。而通过交流的平台则可以更好的加强小区管理人员和业主以及外来人员之间的信息流通,也可以把小区的文化向外传播,让外面的人了解并加入进来。开发这样一套社区居民信息管理和交流系统软件是很有现实意义
    2022-07-13 06:17:57下载
    积分:1
  • Java实现的学生图书资料管理系统
    Java实现的学生图书资料管理系统,利用MYSQL数据库,实现图书的增删改查,及其它功能
    2022-02-11 19:13:14下载
    积分:1
  • Automobile Inventory Management System
    具有员工和管理面板的汽车库存系统。具有增加、删除员工、更新库存等功能。
    2022-04-30 19:22:41下载
    积分:1
  • 基于Resin的一个简单的web网站
    一个简单的基于Resin的“土族文化传播系统”网站。我还是一名学生,老师留的答辩大作业,现在上传是希望各位前辈给点建议,如何做的更好。
    2022-05-05 15:09:41下载
    积分:1
  • java小作业 实现任意对象的增删改查(利用ajax,注解)
    前台代码和后台都是固定的,利用注解动态实现任意对象的增删改查。不过在增加新实体时,数据库的属性与新实体的属性名称一致。如果属性名称不一致,就不能成功录入读取数据。压缩包里面有web和控制台实现的两种方式。
    2022-02-20 06:03:40下载
    积分:1
  • web爬虫工具,抓取网页
    基于webcollector-2.12 开发,web爬虫工具,抓取网页,使用方便快捷。 WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 WebCollector致力于维护一个稳定、可扩的爬虫内核,便于开发者进行灵活的二次开发。内核具有很强的扩展性,用户可以在内核基础上开发自己想要的爬虫。源码中集成了Jsoup,可进行精准的网页解析。2.x版本中集成了selenium,可以处理javascript生成的数据。
    2022-03-19 07:39:46下载
    积分:1
  • 校友信息系统
    校友信息系统是一个细节一次大学去学生目前正在做什么 ;
    2023-02-28 01:55:18下载
    积分:1
  • 基于APPCAN开发的 海外购APP源码
    基于APPCAN开发的购物+团购+聊天APP手机端源代码及服务器端PHP源代码主要是为我现实中的杂货店的周边提供网上交易服务,主要包含简单的会员系统,支付宝交易系统
    2022-04-28 02:24:35下载
    积分:1
  • 696518资源总数
  • 104297会员总数
  • 29今日下载