-
读写文本文件在WinCE
Read and Write Text Files in WinCE
- 2022-05-11 02:03:45下载
- 积分:1
-
搜索引擎
爬虫模块、预处理模块和搜索模块。
搜索引擎的三个部分是相互独立的,三个部分分别工作,主要的关系体现在前一部分得到的数据结果为后一部分提供原始数据。
用户通过浏览器提交查询的词或者短语 P,搜索引擎根据用户的查询返回匹配的网页信息列表 L;
上述过程涉及到两个问题,如何匹配用户的查询以及网页信息列表从何而来,根据什么而排序?用户的查询 P 经过分词器被切割成小词组 并被剔除停用词 ( 的、了、啊等字 ),根据系统维护的一个倒排索引可以查询某个词 pi 在哪些网页中出现过,匹配那些 都出现的网页集即可作为初始结果,更进一步,返回的初始网页集通过计算与查询词的相关度从而得到网页排名,即 Page Rank,按照网页的排名顺序即可得到最终的网页列表;
假设分词器和网页排名的计算公式都是既定的,那么倒排索引以及原始网页集从何而来?原始网页集在之前的数据流程的介绍中,可以得知是由爬虫 spider 爬取网页并且保存在本地的,而倒排索引,即词组到网页的映射表是建立在正排索引的基础上的,后者是分析了网页的内容并对其内容进行分词后,得到的网页到词组的映射表,将正排索引倒置即可得到倒排索引;
网页的分析具体做什么呢?由于爬虫收集来的原始网页中包含很多信息,比如 html 表单以及一些垃圾信息比如广告,网页分析去除这些信息,并抽取其中的正文信息作为后续的基础数据。
- 2022-05-07 14:54:09下载
- 积分:1
-
This is a Maze algorithm C++ Source must be given the map width, height, as well...
这是一个走迷宫算法的C++源程序,必须给出地图的宽度、高度,以及入口和出口坐标作为输入。-This is a Maze algorithm C++ Source must be given the map width, height, as well as import and export of coordinates as input.
- 2022-01-26 15:07:38下载
- 积分:1
-
倒车雷达源程序带显示
这个程序比较全面,适合学习及应用。
- 2022-02-02 19:00:41下载
- 积分:1
-
一个图书馆管理系统,用数据库开发的
一个图书管理系统,用ACCESS数据库进行开发-A library management system, developed using ACCESS database
- 2022-04-18 03:26:50下载
- 积分:1
-
硬盘擦除器,将硬盘的逻辑盘内容擦除。用qt4+vc6。
硬盘擦除器,将硬盘的逻辑盘内容擦除。用qt4+vc6。-Hard Drive Eraser will erase the hard disk of the logical content. With qt4+ Vc6.
- 2022-11-26 23:30:03下载
- 积分:1
-
opencv的几个库移植到wince,一个很有用的教程
opencv的几个库移植到wince,一个很有用的教程-opencv several libraries ported to wince, a very useful tutorial
- 2022-05-22 12:15:15下载
- 积分:1
-
a wonderful achievement of snow, legends of Santa Claus, very cool!
一个用JAVA实现的奇妙雪景,有传说中的圣诞老人,极酷!-a wonderful achievement of snow, legends of Santa Claus, very cool!
- 2022-05-20 19:04:31下载
- 积分:1
-
漂亮的后台模板
由于最近自己在开发一个管理系统,搭建好服务端后一直在想使用什么来做前端页面,ext、easyui等等都在实验,感觉这些都不怎么好看,样式呆板,毫无新意,不能给人眼前一亮的感觉,感觉这套模板不错,分享给大家
- 2022-07-14 23:38:05下载
- 积分:1
-
计算最短路径的简单实例
计算最短路径的简单实例-shortest path calculation of simple examples
- 2022-02-05 19:29:13下载
- 积分:1