-
文本分类(采用Java语言)
资源描述利用分类算法实现对文本的数据挖掘,主要包括: 1. 语料库的构建,主要包括利用爬虫收集Web文档等; 2. 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,理解所选 的分类算法的建模原理、实现过程和相关参数的含义; 4. 对测试集的文本进行分类 5. 对测试集的分类结果利用正确率和召回率进行分析评价。
- 2022-02-13 04:15:07下载
- 积分:1
-
ELM
一种神经网络算法:极限学习机(ELM),包括分类和回归,仿真验证无误,适合初学者练习(A data mining algorithm: limit learning machine (ELM), including classification and regression, simulation verification is unmistakable, suitable for beginners to practice)
- 2018-03-14 12:45:55下载
- 积分:1
-
数据挖掘 Binning算法
数据挖掘中的binning算法,用于数据预处理(Binning algorithm in data mining for data preprocessing)
- 2019-01-07 09:04:15下载
- 积分:1
-
0262842
請用星號( )排列出下列的 p箭 星號 D案,輸入 Y料 ne txt中的第一行為箭 的上下高度(必為奇數),第二行為 D案的總寬度()
- 2018-05-28 18:54:24下载
- 积分:1
-
sklearn-tree-BN-knn
分类器的性能比较与调优:
使用scikit-learn 包中的tree,贝叶斯,knn,对数据进行模型训练,尽量了解其原理及运用。
使用不同分析三种分类器在实验中的性能比较,分析它们的特点。
本实验采用的数据集为house与segment。(Performance comparison and optimization of classifiers:
We use tree, Bayesian and KNN in scikit-learnpackage to train the data model and try to understand its principle and application.
The performances of three classifiers are compared and their characteristics are analyzed.
The data set used in this experiment is house and segment.)
- 2021-04-16 15:08:53下载
- 积分:1
-
ltlk4
FIR Filter Design This chapter treats the design of linear-pha()
- 2018-02-07 09:12:27下载
- 积分:1
-
0056764
这是一本经典数值算法书,包含多种算法的理论,为编程者具有一定参考意义()
- 2018-05-25 16:07:55下载
- 积分:1
-
关于大数据的相关论文
关于大数据的论文,对稀疏表示分类有很大的帮助,希望对初学者哟帮助
- 2022-02-06 00:21:30下载
- 积分:1
-
Tensor-Factorization-HOSVD-iterative-master
hosvd 迭代分解,很好用,是一个硕士论文里的代码(terative HOSVD algorithm to decompose tensor and find its Singular factors in each mode.)
- 2021-03-27 11:39:12下载
- 积分:1
-
wcav
Numerical Recipes Software 提供的算法子程序集,一共有上千种算法,部分算法可以在书店买到书()
- 2018-05-24 17:49:06下载
- 积分:1