-
复旦大学自然语言处理包(含示例)
复旦大学自然语言处理包,由复旦大学研究的中文自然语言处理包,内有全部源码及使用示例。对于搜索引擎、分词器研究和应用非常有用。
- 2022-01-25 17:48:28下载
- 积分:1
-
百度云盘爬虫系统
百度云盘爬虫系统,可以爬取百度云的资源,搭建云盘爬取网站(Baidu cloud disk crawler system, can crawl Baidu cloud resources, build cloud disk crawl website)
- 2018-11-17 15:50:37下载
- 积分:1
-
compass
说明: compass对lucene行进了封装
这个是对compass的应用,index的建立,搜索以及高级搜索(compass on the lucene marching compass of the package, this is the application, index creation, search and advanced search)
- 2010-03-29 14:50:25下载
- 积分:1
-
Crawler4OtherTransit
爬虫,简单语句,爬虫快速
支持单线程操作,容易改正,并有注释(Reptiles, simple statement, reptiles fast support single-threaded operation, easy to correct, and Notes)
- 2012-09-24 10:46:49下载
- 积分:1
-
1905
很好的搜索:
给你很多长度不定的木棒,将他们分成几组,每组中的总长度作为这组的标示值,请给出一种分组方法,能使得所有标示值中的最小值最大。
Input
多组,每组两行,第一行是一个N和K,代表有N根木棒,分成K组,第二行是N个数字,代表木棒的长度。(N不超过100,K不超过20,每根木棒长度不超过1000)
Output
输出所有标示值中的最小值的最大值。
Sample Input
5 3
1 3 5 7 9
5 3
89 59 68 35 29
Sample Output
8
89(err)
- 2007-12-28 16:47:08下载
- 积分:1
-
3--blog_move-4-18
新浪博客,CSDN博客,腾讯空间的简单的爬虫系统源码,java版。(blog.sina.com,csdn, qzone, spider java source)
- 2013-06-17 11:05:45下载
- 积分:1
-
auto_spyder4jiandan
通过python爬虫抓取煎蛋网妹子图中多个页面的图片并保存到本地。(Through the python spiders crawling Fried egg nets sister figure multiple pages of pictures and saved to the local.)
- 2016-06-01 10:56:16下载
- 积分:1
-
python_sina_crawl
新浪微博的爬虫程序。程序运行方式:保存所有代码后,打开Main.py,修改LoginName为你的新浪微博帐号,PassWord为你的密码。运行Main.py,程序会在当前目录下生成CrawledPages文件夹,并保存所有爬取到的文件在这个文件夹中。(Sina microblogging reptiles. Program operation: save all the code, open Main.py, modify LoginName for your Sina Weibo account, PassWord for your password. Run Main.py, the program will generate CrawledPages in the current directory folder and save all files to crawling in this folder.)
- 2021-04-08 16:39:00下载
- 积分:1
-
MSNIMRobot
MSN机器人IMRobot
很值得研究的
- 2009-12-09 14:31:26下载
- 积分:1
-
PermissiveResearch-master
实现一个本地搜索引擎(作者语:search engine),允许容错搜索,也就是搜索结果不需要和搜索的关键字完全精准匹配。比如,搜索”eric wang“,搜索结果可以包括Erica Watts等等。搜索效率十分高,并且支持CoreData数据搜索。可以很方便修改搜索算法或者替换成自定义的搜索算法。
- 2013-12-09 13:58:16下载
- 积分:1