-
状态模式vc源码实例。
状态模式vc源码实例。-state model vc source examples.
- 2022-03-26 05:55:54下载
- 积分:1
-
搜索引擎
爬虫模块、预处理模块和搜索模块。
搜索引擎的三个部分是相互独立的,三个部分分别工作,主要的关系体现在前一部分得到的数据结果为后一部分提供原始数据。
用户通过浏览器提交查询的词或者短语 P,搜索引擎根据用户的查询返回匹配的网页信息列表 L;
上述过程涉及到两个问题,如何匹配用户的查询以及网页信息列表从何而来,根据什么而排序?用户的查询 P 经过分词器被切割成小词组 并被剔除停用词 ( 的、了、啊等字 ),根据系统维护的一个倒排索引可以查询某个词 pi 在哪些网页中出现过,匹配那些 都出现的网页集即可作为初始结果,更进一步,返回的初始网页集通过计算与查询词的相关度从而得到网页排名,即 Page Rank,按照网页的排名顺序即可得到最终的网页列表;
假设分词器和网页排名的计算公式都是既定的,那么倒排索引以及原始网页集从何而来?原始网页集在之前的数据流程的介绍中,可以得知是由爬虫 spider 爬取网页并且保存在本地的,而倒排索引,即词组到网页的映射表是建立在正排索引的基础上的,后者是分析了网页的内容并对其内容进行分词后,得到的网页到词组的映射表,将正排索引倒置即可得到倒排索引;
网页的分析具体做什么呢?由于爬虫收集来的原始网页中包含很多信息,比如 html 表单以及一些垃圾信息比如广告,网页分析去除这些信息,并抽取其中的正文信息作为后续的基础数据。
- 2022-05-07 14:54:09下载
- 积分:1
-
This file introduce about DirectX and directshow
This file introduce about DirectX and directshow
- 2022-05-08 19:19:14下载
- 积分:1
-
函数注释生成器。
可批量、简单、规范生成函数头注释
函数注释生成器。
可批量、简单、规范生成函数头注释-Available in volume, simple, standardized generating function header comments
- 2022-03-22 02:10:56下载
- 积分:1
-
这是一个比较简单的程序。
this a relatively simple program.
-this is a relatively simple program.
- 2022-06-30 05:15:38下载
- 积分:1
-
Visual C++ 2005中CHAR,TCHAR,CString间转换函数
Visual C++ 2005中CHAR,TCHAR,CString间转换函数-Visual C++ 2005 in CHAR, TCHAR, CString intergovernmental transfer function
- 2022-02-07 16:00:22下载
- 积分:1
-
Serial operation to achieve the EVC function. Comparison of a good reference sou...
实现了EVC操作串口的功能。比较不错的参考源码-Serial operation to achieve the EVC function. Comparison of a good reference source
- 2023-07-03 15:10:02下载
- 积分:1
-
一个面向WINDOWS调用的代码
一个面向WINDOWS调用的代码-WINDOWS calling for a code
- 2022-06-26 08:32:19下载
- 积分:1
-
田径赛程安排程序,用C++编写的,实现田径赛程的安排工作
田径赛程安排程序,用C++编写的,实现田径赛程的安排工作-Track and field schedule program written in C++, achieving track and field schedule of the organization of work
- 2022-08-02 19:21:39下载
- 积分:1
-
有用的 FTP 客户端
一个用于传输文件或文件夹的FTP客户端,在里面能够实现在本地电脑文件的上传,以及在服务器上面下载文件或者文件夹。
在这个实例的代码里面,有比较详细的注释,代码里面也实现了浏览文件夹跟文件的算法,已经获取注册表上文件图标的方法函数。使用了一些在FTP常用的函数。
- 2022-11-29 18:25:03下载
- 积分:1