登录
首页 » Others » 模式识别——基于ID3算法的三次改进

模式识别——基于ID3算法的三次改进

于 2020-12-07 发布
0 150
下载积分: 1 下载次数: 1

代码说明:

ID3算法是决策树的鼻祖,最早于1986年由Quinlan提出,全称是Iterative Dichotomiser 3 [1]。在这篇课程报告中,我将对经典的ID3做出三次改进:1.把 info gain 改进为 gain ratio;2. 把简单投票的过程改进为朴素贝叶斯的方法;3. 将许多颗ID3决策树打造成随机森林。本人将在Weka平台进行二次开发,并且用Weka-Experiment做大量实验,和其它著名的算法进行比较,最后做出综述。项目的源代码开源在本人的GitHub主页上。未来工作有以下几点:是那么容易就可以随机出来的1.在 Improvement Two中,3树的生长的深度限3.可以把这三种改进方法糅合在一起,看看三种制在多少,可以进行进一步的研究改进组合在一起,能不能产生性能更加的算法2.在 Improvement Three中,本人费劲心思写出来4.上述所有方法都是基于属性为 nominal的数据的“随机森林”,正确率反而比D3更差。虽然集,可以进一步研究属性为 numerical,甚至是很使我伤心,但是我在写代码、调试代码、还有两者混合的数据集。思考的过程中有了不少长进。看来随机森林不L己ta3et(1 caitao.I(2) caita (3 caita (4 caita (5) trees (6)treesca置,色va1 eatlon(100)B9.19|81.36*92.85V78.日9*94.43W93.40Vweather. symbolic100)79.00|56.507s.0079.57.506,50{v!/*)|(0/1/1)(1/1/0(011/1)(1/1/0)(1/1/0Re1)caia。,工3"-26936786470963225612) CaILE。 gainRatio.工D311-2693678647096322561(3 caitao naiveBayes. ID3-26936786470963225614)cata0 andomforest,ID31-2593678647096322561{5) trees. NBTree"-47160057070582560866) trees. Randomforest"-10-4-51- depth101-2260823972777004705图-7: Weka-experiment实验结果。总共6个算法,2个数据集。6个算法中(1是原始的1D3算法,后面(2)-(4)是本人的改进算法,(5)和(6)是Weka平台自带的算法。GitHub较风趣;另一方面,蒋老师在我上机实习的过程过,本次模式识别上机实刁的代码,全部公开在本人的回答了我不少疑惑,虽然这些疑惑对于蔣老师而言GitHub主页上面,ur地址如下:可能十分幼稚,但是依然完整解决了我的问题。1. Improvement one:https://github.com/caitaozhan/id3improvements/treREFERENCES/gain ratio2. Improvement TwoJhttps://en.wikipedia.org/wiki/id3algorithmhttps://github.com/caitaozhan/id3_improvements/tre[2]决策树,蒋良孝的PPTChapter2-8e/naive bayes[3] Data Mining Practica/ Machine Learning Tools and3. Improvement threTechniques--Chapter4.3https://github.com/caitaozhan/id3improvements/tre[4贝叶斯分类,将良孝的PPTChapter3-15e/random forest[5]http://archive.ics.uci.edu/ml/datasets/car+evaluation[6]https://en.wikipediaorg/wiki/random_subspace_methodAcknowledgements感谢蒋良孝老师对于我的指导。一方面,蒋老师上课讲解十分到位,关键部位一点就通了,不仅如此还比

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 电子时钟/万年历设计报告 基于AT89c51
    1.硬件﹑软件方案的设计说明。2.用PROTEL工具软件画出系统电路原理图,系统元件布局﹑布线图。3.系统的元器件清单。4.提供程序流程图。5.提供源程序清单(带中文注释)。6.提供系统的使用和操作说明。7.对创新设计和功能,请特别加以陈述。有闹钟 按键有无声转换 整点提示 闹钟状态查看日期 时间可调及转换显示
    2020-12-01下载
    积分:1
  • 烟雾报警器课设计论文
    本论文以电阻式烟雾传感器和单片机技术为核心并与其他电子技术相结合, 设计出一种技术水平较好的烟雾报警器。其中选用MQ-2型半导体可燃气体敏感元件烟雾传感器实现烟雾的检测,具有灵敏度高、响应快、抗干扰能力强等优点,而且价格低廉,使用寿命长。选用的STC12C5410AD单片机,其整合了A/D转换、硬件乘法器、硬件脉宽调制器等资源,具 有高速、低功耗、超强抗干扰等优点,是目前同类技术中性价比较高的产 品。 以STC12C5410AD单片机和MQ-2型半导体电阻式烟雾传感器为核心设计的烟雾报警器可实现声光报警、故障自诊断、浓度显示、报警限设置、延时报警及与上位机串口通信等功能。是一种结构简单、性能
    2020-12-12下载
    积分:1
  • 使用 VC/VS++ 调用微软蓝牙 API 函数的示例代码
    使用 VC++ 调用微软蓝牙 API 函数的示例代码。可以使用 VC++6.0 至 VC++2010 编译代码
    2021-05-06下载
    积分:1
  • halcon NCC模板匹配案检测简单案例
    halcon    NCC模板匹配案检测简单案例
    2020-12-07下载
    积分:1
  • 用gmm模型来对em算法进行应用
    用gmm模型来对em算法进行编程,可以用其聚类
    2021-05-07下载
    积分:1
  • stm32库函数中文使用手册
    stm32库函数中文使用手册,stm32开发中经常会需要查文档,但是全部是英文的,特意找了一个中文版的给大家分享
    2020-12-10下载
    积分:1
  • STM32F103ZET6原理图+PCB文件
    STM32F103ZET6的原理图+PCB文件. STM32F103ZET6原理图+PCB文件
    2020-12-11下载
    积分:1
  • Cadence高速电路板设计与仿真 信号与电源完整性分析 第4版 含光盘实例
    本资源包含PDF图书和随书的光盘资料。本书以Cadence Allegro SPB 16.3为基础,以具体的高速PCB为范例,详尽讲解了IBIS模型的建立、高速PCB的预布局、拓扑结构的提取、反射分析、串扰分析、时序分析、约束驱动布线、后布线DRC分析、差分对设计等信号完整性分析,以及目标阻抗、电源噪声、去耦电容器模型与布局、电源分配系统、电压调节模块、电源平面、单节点仿真、多节点仿真、直流分析、交流分析、模型提取等电源完整性分析内容。
    2020-12-04下载
    积分:1
  • 接收机处理曲线(ROC),检测概率,虚警概率
    利用MATLAB绘制接收机处理曲线(ROC),其中标明了检测概率和虚警概率的关系,可以用于给定信噪比下接收机的设计。
    2020-12-04下载
    积分:1
  • 网络爬虫的设计与实现+毕业论文
    网络爬虫是一种自动搜集互联网信息的程序。通过网络爬虫不仅能够为搜索引擎采集网络信息,而且可以作为定向信息采集器,定向采集某些网站下的特定信息,如招聘信息,租房信息等。 本文通过JAVA实现了一个基于广度优先算法的多线程爬虫程序。本论文阐述了网络爬虫实现中一些主要问题:为何使用广度优先的爬行策略,以及如何实现广度优先爬行;为何要使用多线程,以及如何实现多线程;系统实现过程中的数据存储;网页信息解析等。 通过实现这一爬虫程序,可以搜集某一站点的URLs,并将搜集到的URLs存入数据库。
    2020-12-06下载
    积分:1
  • 696518资源总数
  • 104269会员总数
  • 42今日下载