登录
首页 » Python » Python数据预处理

Python数据预处理

于 2020-09-17 发布
0 273
下载积分: 1 下载次数: 16

代码说明:

说明:  Python数据预处理示例,包括数据清洗、数据整合、数据变换等操作。(Python data preprocessing examples, including data cleaning, data integration, data transformation and other operations.)

文件列表:

Python数据预处理\Python数据预处理.ipynb, 105248 , 2019-04-19
Python数据预处理\titanic.csv, 35191 , 2017-09-27
Python数据预处理, 0 , 2019-04-19

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • GWR4操作说明
    GWR能够实现地理加权回归计算,里面有GWR4操作说明,虽然是英文,但有图片介绍,很容易理解,是GWR模型入门的好工具,适合经济学、数据挖掘等人员使用(GWR can realize geographically weighted regression calculation, including GWR4 operation instructions. Although it is in English, it has pictures to introduce, and is easy to understand. It is a good tool for GWR model entry. It is suitable for personnel such as economics and data mining.)
    2018-03-16 17:17:11下载
    积分:1
  • qb神经网络
    从数据库获取车辆在一段时间内的所有行驶记录的相关数据,确定所需数据为GPS经纬度坐标和驾驶时长等,QB模型采用MDF的思想,其基本思想为:通过平均直接翻转距离函数定义两条轨迹之间的距离,两条轨迹需要具有相同的经纬度点数,具有相同点数的轨迹最大的优点是对轨迹距离成对计算,且相同轨迹之间具有更高的分辨率,对于轨迹聚类的结果有一定的优化。(Retrieved from the database cars all over a period of time, record the related data, determine the required data for the GPS latitude and longitude coordinates, and the driving time, QB model by adopting the idea of MDF, its basic idea is: flip directly by the average distance function definition of the distance between two trajectories, two tracks will have the same latitude and longitude points, and has the biggest advantages of the same points of trajectory track distance calculation in pairs, and has higher resolution, between the same trajectory for trajectory clustering results have certain optimization.)
    2020-06-23 08:00:01下载
    积分:1
  • 从零开始学Python网络爬虫源代码+教学PPT
    说明:  《从零开始学爬虫》的配套资料(PPT和源码)("Learning Reptiles from Zero" (PPT and Source))
    2019-03-18 22:06:06下载
    积分:1
  • 文本分类(采用Java语言)
    资源描述利用分类算法实现对文本的数据挖掘,主要包括: 1. 语料库的构建,主要包括利用爬虫收集Web文档等; 2. 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,理解所选 的分类算法的建模原理、实现过程和相关参数的含义; 4. 对测试集的文本进行分类 5. 对测试集的分类结果利用正确率和召回率进行分析评价。 
    2022-02-13 04:15:07下载
    积分:1
  • mocc3
    说明:  
    2018-02-06 13:33:06下载
    积分:1
  • House_price
    主要是对二手房房价的因变量房价和其相关的因变量之间的关系进行简单的描述统计分析(Mainly for the second-hand house price dependent variable housing prices and its related variables of the relationship between the simple description of statistical analysis)
    2017-11-10 15:40:51下载
    积分:1
  • 频繁项集算法
    频繁项集挖掘算法,能在大量局部特征中发现频繁空间配置,这些空间配置可以作为词语,加入到特征包中进行分类,实现图像分类。
    2022-03-23 21:38:47下载
    积分:1
  • 决策树Java源代码
    资源描述决策树是建立在信息论基础之上,对数据进行分类挖掘的一种方法。其思想是,通过一批已知的训练数据建立一棵决策树,然后利用建好的决策树,对数据进行预测。决策树的建立过程可以看成是数据规则的生成过程。由于基于决策树的分类方法结构简单,本身就是人们能够理解的规则。其次,决策树方法计算复杂度不大,分类效率高,能够处理大数据量的训练集;最后,决策树方法的分类精度较高,对噪声数据有较好的健壮性,符合一般系统的要求。
    2022-03-12 14:04:11下载
    积分:1
  • Hands-on programming with R
    说明:  本书精心策划了三个虚拟项目,将数据科学家必需的专业技能融合其中,教会读者如何将数据存储到计算机内存中,如何在必要的时候转换内存中的数据值,如何用R编写自己的程序并将其用于数据分析和模拟运行。读者将跟随世界一流的RStudio培训师掌握宝贵的编程技能,并借助这些技能成为优秀的数据科学家。(Introduction to R Language)
    2019-05-30 15:04:30下载
    积分:1
  • emd program-matlab
    说明:  EMD经验模态分解算法程序,适合非线性,非平稳时间序列的处理(EMD empirical mode decomposition algorithm program)
    2019-01-14 20:43:57下载
    积分:1
  • 696518资源总数
  • 104269会员总数
  • 31今日下载