登录
首页 » python » python文本分类算法

python文本分类算法

于 2022-03-18 发布 文件大小:1.75 kB
0 71
下载积分: 2 下载次数: 2

代码说明:

ptthon关于文本分类的算法,利用分类算法实现对文本的数据挖掘,主要包括: 1. 语料库的构建,主要包括利用爬虫收集Web文档等; 2. 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,理解所选 的分类算法的建模原理、实现过程和相关参数的含义; 4. 对测试集的文本进行分类 5. 对测试集的分类结果利用正确率和召回率进行分析评价

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 079842-01
    说明:  《深入浅出Python机器学习》源码 ipynb格式("Deep and Simple Python Machine Learning" Source Code ipynb Format)
    2020-06-17 13:00:02下载
    积分:1
  • ORC_Python27
    说明:  加上Coolprop库后,可以在Python软件中进行ORC的计算(With the addition of the Coolprop library, the ORC calculation can be done in Python software)
    2020-06-20 11:20:02下载
    积分:1
  • python分类器实现
    我们被要求设计三个分类器:KNN分类器,感知器分类器,SVM分类器;和无监督的维数缩减方法:PCA;并在两个数据集:手写数字图像(MNIST数据集)和一组文本(SST数据集)上测试这些学习算法。 需要实现的任务是从图形源中识别0-9的手写数字以获取文本信息,以及判断文本的情绪。
    2022-08-24 10:14:06下载
    积分:1
  • 【吴恩达课后编程作业】第二周
    吴恩达深度学习第一课第二周编程作业,供大家借鉴共享(DeepLearning Lesson 1, Week 2 Programming Assignments)
    2020-06-21 20:00:02下载
    积分:1
  • com.tencent.qb.plugin.arqbar9
    Subterranean homesick alien
    2019-03-03 00:19:02下载
    积分:1
  • mechine-learning-ex7
    说明:  该文件以python为语言,通过应用机器学习中的PCA技术提取人脸特征(This document takes Python as the language and extracts facial features by applying PCA technology in machine learning)
    2019-01-14 10:47:33下载
    积分:1
  • PCA
    主成分分析 ( Principal Component Analysis , PCA )或者主元分析。是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。给定 n 个变量的 m 个观察值,形成一个 n ′ m 的数据矩阵, n 通常比较大。对于一个由多个变量描述的复杂事物,人们难以认识,那么是否可以抓住事物主要方面进行重点分析呢?如果事物的主要方面刚好体现在几个主要变量上,我们只需要将这几个变量分离出来,进行详细分析。但是,在一般情况下,并不能直接找出这样的关键变量。这时我们可以用原有变量的线性组合来表示事物的主要方面, PCA 就是这样一种分析方法。(Principal component analysis (Principal Component Analysis, PCA) or PCA. Is a statistical method to grasp the principal contradiction of things, it can be resolved diverse things out the main factors, revealing the essence of things, simplifying complex problems. The purpose of calculating the main component of high-dimensional data is projected to a lower dimensional space. Given n variables of m observations, forming an n ' m of the data matrix, n is usually large. For a complex matters described by several variables, it is difficult to know, so if you can grab something to focus on key aspects of analysis? If the main aspects of things just reflected on several key variables, we only need to separate out these few variables, for detailed analysis. However, in general, does not directly identify this critical variables. Then we can represent the major aspects of things with a linear combination of the original variables, PCA is one such analysis.)
    2021-01-28 21:48:40下载
    积分:1
  • rnn语言模型
    简单的循环神经网络语言模型,国外的课程练笔 简单的循环神经网络语言模型,国外的课程练笔 简单的循环神经网络语言模型,国外的课程练笔 简单的循环神经网络语言模型,国外的课程练笔 简单的循环神经网络语言模型,国外的课程练笔
    2022-06-01 08:13:08下载
    积分:1
  • 黑夜变白ToDayGAN-master
    能然黑夜的图片变成白天,效果很逼真,很牛(If the picture of night turns into day, the effect is very vivid and cattle.)
    2020-12-19 21:29:10下载
    积分:1
  • grid_world
    这是一个网格世界的编程 是python版本 希望对大家有帮助(it is grid world python.)
    2019-06-01 21:48:47下载
    积分:1
  • 696518资源总数
  • 104313会员总数
  • 30今日下载