登录
首页 » Others » 基于Gabor小波+PCA+LDA特征提取方法的人脸表情识别

基于Gabor小波+PCA+LDA特征提取方法的人脸表情识别

于 2020-12-01 发布
0 305
下载积分: 1 下载次数: 4

代码说明:

基于Gabor小波+PCA+LDA特征提取方法的人脸表情识别20机电技术2011年12月=∑cm=∑mc×(-0509-n)U=(a-n(2×3.1415926)×vm第四步:初始模型确定下来以后,采用则将该待识别人脸表情判别为第讠类表情Baum- Welch算法对参数进行重估计,迭代调整模3人脸表情实验及分析型参数以达最优化。这样就完成了训练建模工作,获得了在粗分本文在JAFF( (Japanese Female Facial Expre类层次下代表7种人脸表情的HMM模型sso)表情数据库中进行实验。 JAFFE人脸表情库1=(A,B,n)(=1,2,…7)。由10个人,共213幅图像组成,每人都包含愤怒、23HMM人脸表情分类厌恶、恐惧、高兴、悲伤、惊讶和中性7种表情,每人每种表情2~4幅,每种表情共有27幅。对待识别的人脸表情图像,按本节22中模型本文实验与 Micael等的测试方法相似,把数训练步骤的第一步获得观察向量O,然后计算观据库中的210张图像分成3个部分,每个部分包含察向量O与已训练好的HMM模型1=(A,B,)10个人,且每个人包含7幅不同表情图像,每次使的似然概率P(O|λ)(=12,…,7)。通过用其中的一个部分训练各个表情的HMM模型,剩Forward -Backward算法来计算似然概率,如果下的两个部分用来测试。循环操作3次,然后对这P(O|4),ie(12…,7在P(O|4)(=1,2…,7)3次取平均值,得出表情识别率。本方法获取的表中最大,即情识别率见表1P(Oa )=max p(oa)表1人脸表情识别结果愤怒厌恶恐惧高兴中性悲伤惊讶识别率/%愤怒91.67厌恶5400009000恐惧559167高兴00095.00中性549000悲伤9333惊讶5693.33整体识别率92.14从表1中可以看出,本方法可以获得较好的表高的问题,提出了一种新的人脸表情识别方法。情识别率,但是,从实验中也可发现,不管是有本方法通过更加有效的 Gabor小波+PCA+LDA表没有减少分类类别数,实验中始终存在误识别。情特征提取方法,然后结合HMM模型建立7个对从实验数据库中发现,库中某些人的7种表情变化应基本表情+中性表情的模型,进行识别分类,并并不明显,即使人眼也无法确定其表情类别,以且取得了92.14%的整体识别率。同时,在实验中致算法在识别时出现错误。发现,由于人脸实验数据库中某些人的7种表情变4结论化并不明显,即使人眼也无法确定其表情类别,以致算法在识别时出现错误。本文针对目前人脸表情的整体识别率普遍不(下转第35页)第6期林彩丽等:磁流变阻尼器减振系统的分数阶微分方程研究[2] DROZDOVAD Mechanicsofviscoelasticsolids[M]. New York: John Wiley &Sons Ltd, 1998: 21-65[]LAKESR S. Viscoelastic solids[M]. London: CRC Press, 1998: 63-110[4] Stanway R, Sproston, J L, Stevens N G Non-liner modeling of an electrorheological vibration damper. J. Electrostatics,1987,20.[5]周强,瞿伟廉磁流变阻尼器的两种力学模型和试验验证地震工程与工程振动2002240).[6] Gamoto D R, Filisko F E Dynamic mechanical studies of electrorheological materials: moderate frequencies. I. Rheology,1991,35(3)[7]汪建晓孟光.磁流变阻尼器用于振动控制的理论及实验研究门]振动与冲击,2001,20(2)[8] Wen Y K Method of random vibration of hysteretic systems[]. Joumal of Engineering Mechanics Division, ASCE,102(EM2),1976[9]Spencer Jr. B F, Dyke S J, Sain M K, Carlson, J D Phenomenological model of a magnetorheological damper. J Engrg. MechASCE1997,123[10薛定宇陈阳泉高等应用数学问题的 MATLAB解DM清华大学出版社,2010[l]周云谭平.磁流变阻尼控制理论与技术DM科学出版社200712]王振滨曹广义分数微积分的两种系统建模方法系统仿真学报,2004,64):810812(上接第20页)参考文献[1] ZHAO Quan-you, PAN Bao-chang, PAN Jian- jia, et al. Facial expression recognition based on fusion of Gabor and LBPfeatures[A]. In: Proceedings of the 2008 International Conference on Wavelet Analysis and Pattern Recognition[C], HongKong,IEEE,2008(8):362-367[2]Tang Fang-qi, Deng Ben-zai. Facial Expression Recognition using AAM and Local Facial Features [A]. In: Proceedings ofthe Third Intcmational Conference on Natural Computation[C], Haikou, China, IEEE, 2007(8): 632-635[3]陈培俊基于静态图像的人脸表情识别研究成都西南交通大学,2007[4] Lades M, Vorbruggen J C, Buhmann J. Distortion invariant object recognition in the dynamic linkarchitecture[].IEEE Transactions on Computers, IEEE, 1993, 42(3): 300-311[5]彭辉张长水荣钢等基于KL变换的人脸自动识别方法清华大学学报自然科学版,2007,37(6:6770[6]DudaR O, Hart P E, Stork DG Pattern Classification(second edition). New York: Wiley, 2001[7李云霞李治柱吴亚栋基于HMM的关键词识别系统门计算机工程200,30(7:130-132谨致作者敬请本刊作者允诺:稿件中没有侵犯他人著作权或其它权利的内容并且文责自负;投寄给本刊的稿件(论文、图表、照片等)自发表之日起,其专有出版权和网络传播权即授于本刊,并许可本刊在本刊网站或本刊授权的网站上传播及中国核心期刊(遵选)数据库、中国学术期刊综合评价数据库、中文科技期刊数据库、中国台湾华艺数据库全文收录。对上述合作若有异议者,烦请来稿时向本刊申明,未作中明者,本刊将视为同意,谢谢合作。并致诚挚敬意。《机电技术》编辑部基于 Gabor小波十PCA+LDA征提取方法的人脸表情识别旧数据文接作者:李烈熊,苏两河作者单位李烈熊(福硅船政交通职№学院,福廷福州,350007),苏河(福建电力职技术学院,福建泉州刊名:机电技术英文刊名:MECHANICAL AND ELECTRICAL TECHNOLOGY年,卷(期)201,34(6)参考文献(7条)1. ZHAO Quan-you; PAN Bao-chang PAN Jian-jia Facial expression recognition based on fusion of Gabor and LBPfeatures 20082. Tang Fang-qi; Deng Ben-zai Facial Expression Recognition using AAM and Local Facial Features 20073.陈培俊基丁静态图像的人脸表情识别研究20074. Lades M: Vorbmggen J C; Buhmann J Distortion invariant object recognition in the dynamic link architecture1993(03)5.彭辉;张长水;荣钢基于K-变换的人脸自动识别方法2007(6)6. Duda R 0: Hart P E Stork D G Pattern Classificat ion(second edition) 20017.李云霞;李治柱:吴亚栋基于HM的关键词识别系统[期刊论文]计算机工程2004(07本文链接http://d.g.wanfangdata.comcn/periodiCaljdjs201106005.aspx

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 信赖域算法matlab实现
    使用matlab实现的信赖域算法,中文注释
    2020-12-04下载
    积分:1
  • UMAP Journal 2017 ICM Contest:美国大学生数学建模特等奖论文全集
    UMAP Journal 2017 ICM Contest:美国大学生数学建模特等奖论文全集
    2020-01-13下载
    积分:1
  • 动态贝叶斯网络
    动态贝叶斯网络(Dynamic Bayesian Network, DBN),是一个随着毗邻时间步骤把不同变量联系起来的贝叶斯网络。这通常被叫做“两个时间片”的贝叶斯网络,因为DBN在任意时间点T,变量的值可以从内在的回归量和直接先验值(time T-1)计算。DBN是BN(Baysian Network)的扩展,BN也称作概率网络(Probabilistic Network)或信念网络(Belief Network)。前言不确定性理论在人工智能机器学习、自动控制领域已经得到越来越广泛的应用。本书以当前国际上不确定性研究领域的核心工具—动态贝叶斯网络为线索,进行了动态网络推理算法、平稳系统动态贝叶斯网络结构学习模型设计、非平稳系统动态网络变结构学习模型设计、基于概率模型进化算法的动态贝叶斯网络结构寻优算法的研究。推理算法以隐变量作为划分依据,讨论了离散、连续、混合模型的推理算法,并进行了算法复杂度及应用领域的讨论;结构学习研究首先从度量体制人手,讨论了动态网络度量体制的可分解性,提出了平稳及非平稳系统网络结构学习模型,以及基于贪婪算法思想的遗传算法寻优思想;最终将推理及结构学习理论用于无人机路径规划、战场态势感知、动态数据挖掘、自主控制领域,并通过大量仿真检验。本书的研究工作得到了西安工业大学专着甚金及国家自然科学基金重大研究计划(90205019)的资助。本书全面系统地介绍了动态贝叶斯网络的相关理论,重点介绍了动态网络的经典应用和国内外的新发展。全书共分9章。第1章概述了动态贝叶斯网络的产生与发展、基本操作及表达。第2章和第3章为本书的理论基础部分,首先从静态网络已经取得的理论成果及研究内容人手,由浅入深引出动态贝叶斯网络的基本概念及研究方向,确定本书将要解决的主要问题:DBN推理问题和连续变量的DBN结构学习问题。第4章在第3章基础上,详细讨论了三类动态贝叶斯网络的推理即隐变量离散、隐变量连续、隐变量混合DBN推理;隐马尔科夫模型是所有离散动态网络的基础,故首先介绍其表达及推理,由此派生出其他离散动态网络,并讨论了奶何将复杂离散网络转化为简单HMM的方法,通过算法复杂度实验分析,明确了离散动态网络的相应属性,得出了相应结论,为合理选择DBN推理算法提供依据;在推理中,若系统参数未知或为时变系统,必然涉及参数学习,故在讨论三类网络的推理中亦涉及参数学习问题。第5章从静态网络结构度量机制入手,讨论并推导出动态贝叶斯网络结构用于网络结构度量的BIC及BD度量机制;通过描述基于概率模型进化算法的构图基础,引出动态贝叶斯网络结构学习机制,即基于贝叶斯优化(BOA)的动态网络结构寻优算法,BOA算法的关键是根据优良解集学习得到动态贝叶斯网络,以及根据动态贝叶斯网络推理生成新个体,前者更为重要,按照本书提出的基于贪婪箅法思想的遗传算法解决动态网络学习,然后应用动态贝叶斯网络前向模拟完成后一步。第6章在此基础上,刻画了基于BD度量体制的平稳动态系统DBN结构学习模型设计,并通过仿真验证了其有效性针对非平稳随机系统DBN的结构学习模型,提出了一种自适应窗口法用于在线自适应学习变结构DBN结构,仿真结果可行。第7章在第4章DBN推理理论的基础上,从以往UCAⅴ路径规划中使用的方法以及涉及的定义、术语等出发,讨论了静态路径规划、动态路进规划及空间路径规划三方面的基本问题,通过对原始 Voronoi图的改进,提出了平面改进型Voronoi图、空间改进型 Voronoi图的概念,以及平面及空间动态路径重规划区域原则等,为动态路径规划提供有力的整体构型支撑,进而应用前几章理论基础,建立基于DBN的战场环境感知模型,仿真结果均表明了构图及动态决策模型的正确性。第8章在DBN推理及结构学习的理论基础上,将其用于自主优化及动态数据挖掘。将BOA及基于概率模型的遗传算法的静态图形的优化机制进行推广,提出了一种动态优化的新方法,利用DBN作为t到t+1代转移网络,适时改变优化的基本条件,实时确立新的种群及优化的方向,使得自主智能体在无人干预下顺利完成一系列复杂任务成为可能,将变结构DBN结构学习模型设计用于动态数据挖掘,实时确定个因素之间的关系。第9章通过两个典型的应Ⅳ用实例,将DN推理学习理论进行融合,并用于实际模型。附录给出了与DN结构度量相关定理、性质的证明,为读者进一步研究和学习动态贝叶斯网络提供参考。本书是作者近年来潜心学习和研究国内外不确定性算法理论、方法和应用成果的一个总结。在本书的编写过程中,得到了西安电子科技大学焦李成教授和清华大学戴琼海教授及英国BankUniversity陈大庆教授的热心指导和鼓励,新加坡南洋理工大学的王海芸博土后审阅了书稿,并提出了许多宝贵意见,特向他们表示衷心的感谢。由于涉及内容广泛及限于作者的学识水平,书中疏漏和不当之处在所难免,希望读者不吝赐教指正。作者目录第1章图模型与贝叶斯网络1.1图模型简介1.2动态贝叶斯网络鲁+垂香曲1.3动态贝叶斯网络应用研究1.3.1动态时序数据分析与挖掘曾··會世57781.3.2无人机的态势感知与路径规划1.3.3.进化算法与动态贝叶斯网络混合优化…10第2章静态贝叶斯网络…112.1静态贝叶斯置信网络2.2贝叶斯网络的特点与应用范围……………152.3贝叶斯网络的研究内容162.3.1计算复杂性162.3.2网络结构的确定问题2.3.3已知结构的参数确定问题…………182.3.4在给定结构上的概率计算…4福通而看高自曲着看西画192.3.5贝叶斯网络推理算法…………………19第3章动态贝叶斯网络基础283.1从静态网到动态网283.1.1概述283.1.2推导…………………………293.1.3动态贝叶斯网络表达要鲁垂鲁鲁中t曲·曹市壘曾曹吾普·量313.2动态贝叶斯网络的研究内容…………353.2.1动态贝叶斯网络推理……………………363.2.2动态贝叶斯网络学习…………………………39第4章动态贝叶斯网络推理464.1隐变量离散动态网络推理464.1.1模型数学描述…………………464.1.2马尔科夫的研究内容…4.1.3隐马尔科夫推理学习仿真…534.1.4隐马尔科夫其他拓扑形式…………564.1.5一般离散动态网络和隐马尔科夫关系584.2动态贝叶斯网络推理算法性能分析604.2.1动态网络转化隐马尔科夫仿真…614.2.2离散动态网络推理算法比较仿真……634.2.3连续动态网络推理比较仿真………724.3模糊推理与隐马尔科夫结合炮火校射……………754.3.1概述…音曲曹香音音音吾晋自粤吾·自·754.3.2模糊动态网络环境感知框架754.4隐变量连续动态网络推理4.4.1模型数学描述…794.4.2卡尔曼滤波图模型推理·日·曹曹曾鲁····804.5混合隐状态动态贝叶斯网络834.5.1模型数学描述……b音量章申曾要中命要即命·甲看834.5.2混合动态贝叶斯网络推理864.5.3混合动态贝叶斯网络学习89第5章动态贝叶斯网络结构学习算法……915.1动态贝叶斯网络结构度量体制…………915.1.1概述…………915.1.2动态网络的贝叶斯信息度量935.1.3动态贝叶斯网络BD度量965.2动态贝叶斯网络度量分解性能分析省着带鲁曹曹曹鲁鲁鲁虚鲁鲁中·985.3构建动态网络结构寻优算法…1145.3.1基于概率模型的进化算法…1155.3.2基于贝叶斯优化构造动态网络结构算法…1165.3.3学习动态贝叶斯网络……………1185.3.4动态夏叶斯网络推理1275.4基于贝叶斯优化构建动态网络结构算法仿真…128第6章动态贝叶斯网络结构学习模型1346.1平稳系统动态网络结构学习模型设计1346.1.1模型设计1356.1.2仿真试验1386.2变结构动态网络自适应结构学习模型设计…………1446,2,1模糊自适应双尺度1446.2.2动态系统非平稳程度和平稳性的测量1516.3非平稳系统网络结构学习仿真试验153第7章基于动态贝叶斯网络的路径规划1657.1无人机平面静态路径规划…1657.1.1基本概念……………1657.1.2基于相同威胁体的路径规划…1667.1.3不同威胁体下平面路径规划1717.1.4路径细化暨要命要曹吾帝吾辛事壶要面要吾吾曹中垂要晋吾曹事1767.2无人机动态路径规划1787,2.1概述1797.2.2平面动态环境下局部路径构图原则1797.2.3威胁变化下无人机平面路径规划………1827.2.4突发威胁体下无人机平面路径重规划研究1867.3无人机空间路径规划研究………………………1907.3.1空间改进型 Voronoi图………1907.3.2威胁变化下局部路径构图区域原则1957.3.3局部路径选择原则及战场感知模型…197第8章基于动态贝叶斯网络的自主控制…1998.1概述…1998.2快速构建决策网络结构方法…2008.2.1链形决策网络模型的建立………2018.2.2决策网络树形模型结构学习算法…2048.2.3一般决策网络结构学习算法2058.3进化算法与动态网络混合优化……2068.3.1算法基本思想2068.3.2转移网络作用中鲁鲁··章鲁···自··………2108.3.3混合优化自主控制算法描述…2108.3.4混合优化自主控制算法软件实现………211第9章无人机自主控制应用研究2249.1基于混合优化的无人机路径重规划.2249.1.1自主控制过程描述2249.1.2混合优化无人机路径规划仿真…2259.2无人机攻击多目标路径规划………………2379.2.1自主控制过程描述……………2389.2.2初始动态网络图构型2399.2.3无人机自主攻击多随机运动目标仿真240附录贝叶斯网络局部结构度量数学基础250A.1链形模型局部结构度量250A.2树形模型局部结构度量253A.3局部贝叶斯网络度量………………………………257参考文献…………………………………262
    2021-05-06下载
    积分:1
  • 基于Xgboost的商业销售预测
    基于Xgboost的商业销售预测,以德国Rossmann商场的数据为例,通过对数据的探索性分析,以相关背景业务知识体系为基础,通过可视化分析,提取隐含在数据里的特征,使用性能较优的Xgboost方法进行规则挖掘,取得较好效果。第3期饶泓等:基于 Boost的商业销售预测277·(3)eta:收缩步长,即学习速率,取值范围是,3.1数据来源默认为0.3。在更新叶子节点的时候,权重乘以本文所有数据均来自 Haggle中的 Rossmanneta,以避免在更新过程中的过拟合。商店销售额数据集。 Rossmann是商人 Dirk ross(4) max _ depth:每棵树的最大深度,取值范围mann创立的德国首家平价日用品商店,现在的是,默认为6。树越深,越容易过拟合。Rossmann公司逼布欧洲7个国家,分店达100多(5) subsample:训练的实例样本占整体实例样家。论文通过位于德国的1115所 Rossmann连锁本的比例取值范围是(0.1],默认为1。值为0.5商店的历史数据预测未来48天商店的销售额时意味着 Boost随机抽取一半的数据实例来生成Haggle给出了三个数据集: train、test、 store,分树模型,这样能防止过拟合别是训练集测试集和商店基本信息的数据集,对训(6) colsample bytree:在构建每棵树时,列(特练集建模训练,对测试集进行预测。征)的子样本比,参数值的范围是(0,1]数据集基本信息如下(7) objective:默认为reg: linear;(1)训练集 train.csv:时间范围为2013年01月(8)sccd:随机数种子,为确保数据的可重现01日到2015年07月31日,共942天,1017209条性,默认为0。数据。2.2K折交叉验证方法(K一CV(2)测试集test.csv:时间范围为2015年08月论文采用K折交叉验证方法。将原始数据0日到2015年09月17日,共48天,41088条数分为K个子集,每个子集分别验证一次,剩余的K据组子集作为训练数据,这样可得到K组训练集(3)商店基本信息数据集 store.csv:1115条数和测试集以最终的分类平均精度作为性能指标。据,共1115家商店的信息。在实际应用中,K值一般大于或等于2,需要建立K3.2数据的可视化分析及原始特征提取个模型来进行K折交叉验证的实验,并计算K次为了获取影响销售额的基本数据特征,论文对测试集的平均辨识率Gaggle提供的 Rossmann数据集进行了可视化分K折交叉验证的结果能较好说明模型效果,有析,提取原始特征集。效地避免欠拟合与过拟合。在 Boost中,通过(1)顾客数和销售额之间的关系xgb.cv函数来做交叉验证。从图1中可以看出,顾客数和销售额之间存在2.3独热编码(One- hot encoding紧密的正相关关系。由于 Boost仅适用于处理数值型向量,因此处理训练集和测试集时需要将所有其它形式的数10.0据转换为数值型向量,本文采用独热编码将特征值转专换为数值。50独热编码也称一位有效编码,即对于任意时间任意给定的状态,状态向量中只有一位为1,其余6各位为0,将n类特征值转化成n位二进制数串,将顾客数特征的每个对应类设置为1。独热编码将每一个特图1顾客数与销售额的关系曲线征的个取值通过独热编码后转换成了n个二元特(2)促销对销售的影响的可视化分析征,通过该方法将特征转变成稀疏矩阵6。独热编图2和图3中 Promo取1表示当天有促销活码能够解决分类器不好处理属性数据的问题并在动取0表示没有促销活动。从图中可以看出促销一定程度上扩充了特征活动对顾客数并没有太大影响,但销售量却明显提3数据预处理高了,即促销活动并没有吸引更多的顾客,但提高了顾客的购买力,从而提高了销售额。通过查询原始为了获取数据中的有效特征,论文采用探索性数据发现没有促销的情况下顾客平均消费8.94欧数据分析方法对数据进行可视化分析获得数据分元,有促销活动的情况下平均消费10.18欧元布特征,理解原始数据的基本特征,发现数据之间的(3)星期( DayOf Week)对销售影响的可视化分潜在模式.找出数据中的有效特征析21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net278南昌大学学报(理科版)2017年40000表2商店薮据基本特征集30000特征名称含义值批20000ore商店号取值:1到1115商店类型10000商店类别分类:逢础类met最近的党争对手的距薮卷:桊商店0离里有761个商店有PromoCompetition-图2促销对销售额的影响Open SinceMonth竞争对手开张的月份月份Open since year竞争对手开张的年份年份数据6000P持续性的促销活动0:无,1:有的4000Prom2 Since Week开始参加Pomo2促销日历上的第几周数的日历周值2000Pomo2 Sincerer开始参加Pm2i年份数据PromoPromoInterval参加Pomn2促销开始Jan,Apr,Jo)e的月份列表Feb, May, Aug, Nov".图3促销对顾客数的影响Mar, Jun, Sept, Dec从图中可以看出,星期日的销售额中位数和上不同的分类特征在训练集和测试集中的比例见四分位数远远高出正常营业日,但是下四分位数却表3~6低于正常营业日,即有些商店星期日营业额高于平表3Open特征取值比例时,但也有一部分商店的销售额低于正常营业日。从图中也可以看出,从周一到周六,周一的销售额偏16.99高一些,星期六的销售额偏低一些test/yo14.5585,4440000表4Prom特征取值比例30000Pramo0凝train61.8538,15批2000test/%50.4239.5810000表5 Stateholiday特征取值比例y星期几1.990.660.40图4销售额在星期1~7中的分布情况test/%99.560.44由于篇幅的关系,对数据的可视化分析不表6 Schoolholiday特征取值比例列岀。根据这些数据的可视化化析,我们提取出如Schoclholiday表1所示和表2所示的训练数据和测试数据原始特test/%55.6544.35征集以及商店数据基本特征集。表1数据原始特征集3.3数据预处理持征名称含义3.3.1数据清洗为获得可训练用数据,我们对原tcre有店号取值:1到1115始数据进行清洗,具体过程如下:DayOfWeek星期几取值:1到7(1)标记异常数据。如商店是开门的,但是销Date时间如2013-01-01Sales销售额数值售额为零的数据为异常数据Customers顾客数数值(2)对训练集的 Sales销售额字段取对数,设置是否开店关店,1:开店为 Saleslog字段;P当天是否有促销0:无促销,1:促销0:非假日,a:公共假日;b:(3)缺失值用一1填充;State Holiday假日复活节,c:圣诞节(4)合并训练集和测试集,添加Set字段,用以SchoclHoliday学校假日0非假日,1:假日分训练集和测试集,值1为训练集,0为测试集;(3)数值化分类特征值。原始数据集中, State21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net第3期饶泓等:基于 Boost的商业销售预测holiday分类特征取值为0、a、b、c,无法代入模型计算因此重新编码为0、1、2、3; Store Type分类特4实验结果及分析值为a、b、c、d, Assortment分类特征值为a、b、c,采4.1实验条件用同样方法用整型数据重新编码(1)软件环境(6)分解特征。将原始数据集中Date特征分(a)操作系统: Windows7x64解为 DatcDay、 Datc Wcck、 DatcMonth、 Datc ycar(b)开发平台: Python2.7+R3.4.2DateDay OfYear5个特征(c)第三方库: Python: numpy+ pandas+(7)增加字段 PateNt,即Date转换为整型的 atplotlib I xgboost;R3.4.2库: data table|gg形式lot2tlubridate-zoo-dplyr+scales+xgboost+(8)规范化特征表达。对 Competition- forecast glmnetpen sinceRer和 CompetitionOpenSinceMonth字(2)硬件环境段合并成普通年月的表达,并转化为整型;将Pro处理器:Iner(R)Core(TM)i3-4160CPUcmoZsincc ycar和 Promo2 Since wcck字段合并成普3.60GHz通年月的表达,并转化为整型,增加字段内存:8GBPromo2 SinccInt4.2单 Boost模型()删除偏差大于2.5的异常数据。对特征工程后的所有特征用 Boost模型进行(10)删除存在异常的数据点,如图5所示的异训练,参数如表7所示。常数据。表7单 Boost模型参数25000参数值参数值15000thread500M4M小人Activereg: linear subsamplegrounds20000colsample bytearly stop. round250004.3组合模型0%时你以根据模型的作用将模型分为三类:商店模式模型、数据合并模型、混合模型。商店模式模型:下面采用单个模型是对每个商图5异常数据店进行单独拟合。这类模型关注商店各自的特性,3.3.2特征处理论文根据相关信息背景对数据但是它也错过了可在其他相似商店的模式中获取的进行特征处理:信息(1)增加字段 Competition OpenInt(1)线性模型lm拟合趋势,不带特征交互的(2)添加一些额外的特征,如商店的位置特征 Boost模型拟合残差StoreState发薪日效应特征 PayDay(在一个月的第(2)线性模型lm拟合趋势,带特征交互的Ⅹg个工作日设置特征值为3在随后的两天设置为 boost模型拟合残差2、1)(3)线性模型lm拟合趋势,不同参数值的(3)增加商店平均每天的销售额 Sales PerDay、 glmnet模型拟合残差平均每天的顾客数 CustomersPerDay、平均每天每(4)tslm模型拟合趋势丨季节性,Ⅹ gboost模位顾客的销售额 SalesPerCustomers Per Day作为新型拟合残差。的特征。(5)tslm模型拟合趋势十季节性, glmnet模型(4)增加特征组合,如: store; DayofWeek,拟合残差store: Dayofweek: Promo等等。(6)tslm模型拟合趋势十季节性,Ⅹ gboost模型+ gemnet模型拟合残差。(7)每个商店直接用Ⅹ gboost模型拟合残差。21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net·280·南昌大学学报(理科版)2017年这些模型中,含有 Boost模型的模型参数设1.5- A. train-rmspe- B. train-rmspe置如表8,其中模型7中参数 rounds值设为500。1.0-A.validation-rmspe-B validation表8组合 Boost的模型参数0.5参数值0150030004500600075009000参数值RMSPEreg: linear eta0.013C0max _ depth图6在训练集 train和验证集 validation上的 RMSPE值colsamplc bytrcc0.8subsample3.95图7给出了 Boost模型中非组合特征的重要数据合并模型:下列模型使用合并有 store数度得分,从图中可以看出时间类特征和有关竞争对据集和trai训练集的数据集。各个模型的参数设手的特征得分非常髙,这意味着这些特征对模型具置如表9-11有非常大的影响。表9没有特征工程的 Boost模型DateWeek参数参数CompetitionopenIntreg: lineareta0.01SalesperDayPromorounds3000max _depthcolsample bytreesubsampleAssortment 152100000020000003000000F score特征重要度表10有特征工程的 Boost模型图?特征重要度得分参数参数值bjectivereg: linear eta为了对比各模型的泛化效果,我们给出了单类模型(线性模型LM、时间序列线性模型TSLM、基4000subsoIl0.9于 Lasso和 Elastic net正则广义线性模型 glmnet、early stop. round100cclsample bytree极端梯度上升模型ⅹ gboost)和它们之间的组合模型在测试集上 RMSPE值,从而评价模型在测试集表11153个特征十特征交互的 Xgboost模型上的泛化能力。如表13所示参数值参数表13各模型 RMSPE值比较objectivereg: linear etaC.015max depth18模型RMSPE值.20657300CLM一简单的特征处理rounds. 1l.7TSLM+筒单的特征处理cCanvTree0.12751early stop. round100random forest-简单的特征处理glmnet+简单的特征工程3.11974组合模型:通过组合数据合并模型来获取跨多个商Boost十简单的特征工程0.11839店之间共同的特质。模型的残差用商店模式模型中Boost+特征工程Boost+ glmnet+特征工程0.11262的模型来拟合,从而获得每个商店的特质。用Igloos+ glmnet+tslm+lm+特征工程0.1114Gprcomp函数从数据中提取50个主成分,并用Xg从表中可以看出,Ⅹ ghost单模型的能力就优bost模型来拟合、计算残差。模型说明如下:于其它模型,在进行了简单特征工程后, Boost(1)使用线性模型lm拟合趋势,带特征交互的和 gemnet模型相比, Boost模型依然效果更好。glmnet模型+ Boost模型拟合残差,最后我们结合TSLM|LM在处理趋势和季节性上(2)使用tslm拟合趋势和季节性,带特征交互的优势,采用集成方法对 Xgboost+ glmnet进行组的 Boost模型拟合残差。合得出优化模型Ⅹ gboost+ glmnet+tslm+lm+特图6给出模型在训练集和验证集上的 RMSPE征工程, RMSPE值得到较大提升,泛化性能最优的变化过程,横坐标是次数,纵坐标是 RMSPE的值A是人工删除了异常点的数据中的异常数据5结论并没有删除。可以发现在训练集上训练的前500次本论文研究基于 Boost方法对实体零售业销RMSPE的值就迅速的降低到0.2,然后在1750次售额进行预测。论文以德国零售业 Rossmann公就在0.1左右了,可以看出在训练集上效果很好。司1115家实体门店的商场信息和销售数据为薮据21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net第3期饶泓等:基于 Boost的商业销售预测281·源,采用 Boost方法对公司销售额进行预测。参考文献通过在特征工程中对原始数据进行特征提取、L1」赵啸彬.基于数据挖掘的零售业销售预测LD.上海:选择和构建,筛选岀用于训练的特征属性;对比Xα上海交通大学.2010boost、随机森林、 GLMNET以及IM、TSIM模型2 CHEN T,HET. Higgs Boson Discovery with boosted等不同方法对销售额的预测结果,表明 Xgboosτ方TreesLCI.JMLR: Workshop and Conference Proceed法无论是训练速度还是在 RMSPE评价标准上都具2015.42:6980有明显的优势。3 ROBERT E. Banfield, Lawrence (. Hall. Kevin WBowyer. W. P. Kegelmeyer, A Comparison of Decision为了进一步提高 Boost预测模型的精度和泛Tree Ensemble Creation Techniques LI]. IEEE Trans-化能力,本文通过大量的特征工程,尝试多种模型的actions on Pattcrn Analysis and machinc intelligence集成学习方法和参数调优,利用 GLMNET和Xg2007,29(1):173-180boost模型拟合残差,并结合IM、TSLM在趋势和[]李航.统计学习方法[M]北京:清华大学出版社,李节性预测的优点,获得组合优化模型。实验表明2012该组合模型在性能上优于单一 Boost预测模型。[5]闻玲·移动平均季节模型在商品销售收入预测中的应这种基于Xⅹ gboost的组合模型不仅适用于对德AJ. Market Modernization, 2010(28):43-45国零售业销售额的预测还可以将此方法应用于国6黄伟陶俊才.一种基于k- means聚类和关监督学习内零售实体业甚至电商平台的销售额预测,对于提的医学图像分割算法[J].南吕大学学报(理科版),2(14,33(1):31-35高商店的运营生产模式、日常管理、价格管理、配送[7 RICE J Mathematical Statics and Data Analysis[M]方式及精准营销具有重要的意义cand Edition, Plymouth: Duxbury Press, 2006: 221-21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
    2021-05-06下载
    积分:1
  • 灰色神经网络Matlab代码
    利用灰色关联调整神经网络隐层权重,得出的结果精度比较高。。。。。。。。。。。。
    2020-11-30下载
    积分:1
  • 基于QT5.6写Echart动态交互示例(仪表盘)-修改版
    在原有QT编写Echart动态交互示例(仪表盘)进行修改,满足基于Qt5.6版本进行运行
    2020-12-01下载
    积分:1
  • 基于JADE的盲源分离算法
    基于JADE的盲源分离算法程序unction B = jadeR(X,m)% B = jadeR(X, m) is an m*n matrix such that Y=B*X are separated sources% extracted from the n*T data matrix X.% If m is omitted, B=jadeR(X) is a square n*n matrix (as many sources as sensors)%% Blind separation of real signals with JADE. Version
    2020-12-04下载
    积分:1
  • stm32 利用CAN控制电机
    stm32 利用CAN控制电机,利用定时器对电机进行速度控制
    2020-12-02下载
    积分:1
  • 多功能数字时钟 数字电子技术课设计.rar
    【实例简介】多功能数字时钟 数字电子技术课程设计 里面包括3个文档和maxplus2仿真文件,非常详细
    2021-11-21 00:50:31下载
    积分:1
  • python基础代码大全
    python代码大全,适用于基础python学习者,里面的代码基本上是基础学习者必经过程。Python学习入门很快,但学习之路任重道远
    2020-06-28下载
    积分:1
  • 696518资源总数
  • 106222会员总数
  • 14今日下载