-
receive DLL/EXE document, the resource definition Cool
得到DLL/EXE文件中的资源定义 Cool-receive DLL/EXE document, the resource definition Cool
- 2022-05-26 17:09:54下载
- 积分:1
-
this is a Zlib compression library packaged COM interface, complete applications...
这是一个对Zlib压缩库进行打包COM接口,完整的应用程序和可重用代码-this is a Zlib compression library packaged COM interface, complete applications and reusable code
- 2022-10-19 00:55:03下载
- 积分:1
-
获取主机mac地址vc程序,程序简洁,方法简单
获取主机mac地址vc程序,程序简洁,方法简单-Access to the host mac address vc procedures, the procedures simple, method is simple
- 2023-07-29 03:25:03下载
- 积分:1
-
有关于socket编程的
网络问空间爱你你传输服务的代码。一节公答谢小嘴...
有关于socket编程的
网络问空间爱你你传输服务的代码。一节公答谢小嘴-Socket programming on the network space love you ask your transmission service code. A public thank mouth
- 2022-04-10 01:34:43下载
- 积分:1
-
vc++ mfc 各种事例,不下载不知道,一下载吓一跳.
vc++ mfc 各种事例,不下载不知道,一下载吓一跳.
- 2022-05-30 03:40:43下载
- 积分:1
-
This is a program of video upsample in the dct domain which convert the video re...
dct域内视频的上采样了,640*480到1920*1080-This is a program of video upsample in the dct domain which convert the video resolution from 640*480 to 1920*1080.
- 2022-05-06 11:50:46下载
- 积分:1
-
it is a simple program
vc动态链接库自测代码,一个很好的例子:可以自由灵活的调用dll,学习一下哦-it is a simple program
- 2022-08-19 02:52:32下载
- 积分:1
-
VC++中用MFC来编写应用程序的一个源码
VC++中用MFC来编写应用程序的一个源码-VC++ Using MFC to write a source application
- 2023-03-27 11:10:04下载
- 积分:1
-
Overview Most of us know that OLEDB is the latest database technology that provi...
Overview Most of us know that OLEDB is the latest database technology that provides fast data access on the windows platform. However, many C++ programmers tend to avoid using raw OLEDB and prefer ADO in their development process.
- 2022-03-04 03:32:13下载
- 积分:1
-
搜索引擎
爬虫模块、预处理模块和搜索模块。
搜索引擎的三个部分是相互独立的,三个部分分别工作,主要的关系体现在前一部分得到的数据结果为后一部分提供原始数据。
用户通过浏览器提交查询的词或者短语 P,搜索引擎根据用户的查询返回匹配的网页信息列表 L;
上述过程涉及到两个问题,如何匹配用户的查询以及网页信息列表从何而来,根据什么而排序?用户的查询 P 经过分词器被切割成小词组 并被剔除停用词 ( 的、了、啊等字 ),根据系统维护的一个倒排索引可以查询某个词 pi 在哪些网页中出现过,匹配那些 都出现的网页集即可作为初始结果,更进一步,返回的初始网页集通过计算与查询词的相关度从而得到网页排名,即 Page Rank,按照网页的排名顺序即可得到最终的网页列表;
假设分词器和网页排名的计算公式都是既定的,那么倒排索引以及原始网页集从何而来?原始网页集在之前的数据流程的介绍中,可以得知是由爬虫 spider 爬取网页并且保存在本地的,而倒排索引,即词组到网页的映射表是建立在正排索引的基础上的,后者是分析了网页的内容并对其内容进行分词后,得到的网页到词组的映射表,将正排索引倒置即可得到倒排索引;
网页的分析具体做什么呢?由于爬虫收集来的原始网页中包含很多信息,比如 html 表单以及一些垃圾信息比如广告,网页分析去除这些信息,并抽取其中的正文信息作为后续的基础数据。
- 2022-05-07 14:54:09下载
- 积分:1