-
基于java的文本搜索引擎的设计与实现
说明: 基于java的文本搜索引擎的设计与实现(完整毕业论文)。页面使用 html+jsp,分词器使用lucene,网络爬虫使用java实现,数据库使用mysql。(Design and Implementation of Text Search Engine Based on Java)
- 2020-12-14 15:09:14下载
- 积分:1
-
osgood-visual-spider-master
基于Xpath的网页爬取,提供了web页面(Web crawling based on Xpath)
- 2018-12-06 11:50:30下载
- 积分:1
-
Algorithms_of_the_Intelligent_Web
说明: 搜索引擎及Web智能的经典书籍,很多该方向导师推荐的信息检索必读书目。(Classic book on search and web intelligence, which is recommended by a lot of Prof. on information intelligence.)
- 2011-02-21 11:11:52下载
- 积分:1
-
lucene-4.0.0
这是一个搜索引擎的安装包,很简单,自己学吧哈(This is a search engine installation package is simple own now)
- 2013-01-19 13:30:01下载
- 积分:1
-
第一课爬取百度
百度爬虫,爬取贴吧指定页面的内容,然后进行爬取(Baidu crawler, crawl the content of the specified page of the post bar, and then crawl.)
- 2019-02-16 11:58:24下载
- 积分:1
-
SinaSpider-master
使用master-slave模式的分布式新浪微博爬虫,采用纯python代码编写。(This spider system is programmed by pure Python code and works as Master-Slave schema.)
- 2016-12-23 17:33:07下载
- 积分:1
-
交易猫开源
交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源交易猫开源
- 2022-08-18 22:46:24下载
- 积分:1
-
data_collect.tar
新浪微薄爬虫,抓取好友信息和好友的关注列表,
保存文件格式为文本(Sina meager reptiles, grab your friends and friends of watchlist information, save the file as text format)
- 2014-01-29 18:32:17下载
- 积分:1
-
py测试程序
说明: 适用于新手练习的简单爬虫代码,运行此代码将自动从网站上下载一张图片到桌面上(Simple crawler code for novices)
- 2019-11-14 21:49:36下载
- 积分:1
-
xx_20030222
下一代天网文件搜索引擎(next generation Skynet document search engine)
- 2005-01-08 11:27:09下载
- 积分:1