-
中文分词系统
利用哈希表创建词表,利用正向最大匹配算法和逆向最大匹配算法实现中文分词,逐行读入,在哈希词表中查找最大长度的词,采用的编码格式为GBK码,哈希表查找的复杂度O(1),效率比较高,适用于此次试验的大量数据查找匹配。
- 2022-09-01 13:30:03下载
- 积分:1
-
complex-beta-nmf-master
说明: 复杂的非负矩阵分解代码,实现更好的效果来分解(Complex non negative matrix decomposition code for better results)
- 2019-12-27 10:24:18下载
- 积分:1
-
哈工大LTP编译好的库文件
哈工大LTP主要用于分词,词性标注,句法语义分析,不过它需要自己编译源码,生成动态链接库,这个过程很麻烦,这个是已经生成好的文件可以直接用
- 2022-04-25 12:47:59下载
- 积分:1
-
自然语言处理分词 输入输出均为txt
自然语言处理分词 输入输出均为txt 另附 input.txt 和dictionary.txt,可以根据需要改变输入文件和字典(将待分词的内 容放入input.txt即可,字典应该够用)
- 2022-01-26 03:37:29下载
- 积分:1
-
PKU-Paraphrase-Bank-master-中文数据集
说明: 可用于中文复述生成任务训练及测试,内涵多本中文小说相似句子对。(The data can be used for the training and testing of the Chinese retelling generation task, which can contain similar sentence pairs of many Chinese novels.)
- 2020-12-17 17:07:51下载
- 积分:1
-
知网语义相似度计算JAVA源码
利用知网计算语义相似度。包含来自的论文。已经通过测试。结果正确。
- 2022-01-27 19:53:32下载
- 积分:1
-
ACL 2020 论文
说明: ACL 2020图神经网络(GNN)相关论文——自动摘要。本文提出了一种基于图的异构神经网络抽取摘要算法(HeterSUMGraph),该算法除句子外,还包含不同粒度的语义节点。这些额外的结点起到句子之间的中介作用,丰富了句子之间的关系。(ACL 2020 graph neural network (GNN) related papers-automatic summary. This paper proposes a graph-based heterogeneous neural network extraction summary algorithm (HeterSUMGraph), which contains semantic nodes with different granularities in addition to sentences. These extra nodes act as an intermediary between sentences, enriching the relationship between sentences.)
- 2020-05-06 10:13:53下载
- 积分:1
-
MRCG_features
说明: 在输入特征提取阶段利用多分辨率耳蜗图,可提供更全面的输入信息(In the stage of input feature extraction, multi-resolution cochlear image can provide more comprehensive input information)
- 2019-12-27 10:16:37下载
- 积分:1
-
l0-sparse-NMF-master
说明: 可实现矩阵非负分解,增加了稀疏化因子来作为约束条件(Nonnegative decomposition of matrix can be realized, and sparse factor is added)
- 2019-12-27 10:11:33下载
- 积分:1
-
lcqmc
说明: 语义相似度任务-LCQMC数据集下载。LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,其目标是判断两个问题的语义是否相同。(Semantic similarity task - lcqmc dataset download. Lcqmc is a problem semantic matching data set constructed by Harbin Institute of technology in colling2018, the international summit of natural language processing. Its goal is to determine whether the semantics of the two problems are the same.)
- 2020-05-10 14:44:49下载
- 积分:1