登录
首页 » Others » 人工萤火虫算法

人工萤火虫算法

于 2020-11-06 发布
0 158
下载积分: 1 下载次数: 1

代码说明:

最新智能算法matlab,具有较好的效果方便学习交流,具有很好的价值

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 用于时频分析的广义s变换变换代码(时频分析特别有用)
    用于时频分析的广义s变换变换代码(时频分析特别有用),采用matlab编写
    2020-11-27下载
    积分:1
  • 模糊c-均值聚类算法-matlab实现
    模糊c-均值(FCM)聚类算法在matlab中实现,已测试通过
    2020-12-07下载
    积分:1
  • 支持向量机的matlab代码
    这是用matlab写的支持向量机的代码,写得比较详细,希望对各位有用
    2020-12-05下载
    积分:1
  • norad基于SDP4/SGP4模型的卫星轨道预报TLE
    norad用c#和c++两种语言实现的基于SDP4/SGP4模型的卫星轨道预报,测试可用,数据计算较为准确。工具包中有Demo示例。输入卫星两行轨道参数TLE,测站坐标。可获取信息:卫星任意时刻轨道位置、速度,相对测站的AE角、距离、速度等信息。
    2020-06-25下载
    积分:1
  • 无刷电机控制源
    分享别人高价买来的STC51系列单片机做的全功能无刷电机控制源程序方案 包括PCB设计原图及清单等。
    2020-12-02下载
    积分:1
  • NS-2网络模拟基础与应用
    这是国防工业出版社《NS-2网络模拟基础与应用》书中的源代码,全部通过编译,没有错误,是初学NS2者必不可少的资料
    2020-12-02下载
    积分:1
  • STM32F103C8开发板 STM32最小系统核心板 AD硬件原理图+PCB封装文件
    STM32F103C8开发板 STM32最小系统核心板 AD硬件原理图+PCB封装文件,手册,软件开发历程
    2020-06-29下载
    积分:1
  • 基于压缩感知的二维雷达成像算法
    【实例简介】压缩感知理论能够有效地降低高分辨率雷达成像系统的数据率。该文通过对复基带雷达回波信号模型的稀疏性分析,提出了一种具有保相性的压缩感知距离压缩法。在此基础上建立了距离向采用压缩感知距离压缩算法,方位向采用传统的雷达成像算法处理的雷达2 维成像方案。通过对仿真和实测逆合成孔径雷达数据的成像处理验证了方案的有效性。
    2021-11-09 00:31:02下载
    积分:1
  • 风控建模等奖
    使用拍拍贷数据,建模全过程,从数据预处理开始到最后的模型比较。仅用于交流学习。队伍介绍队名“不得仰视本王”,队伍由五个小伙伴组成,我们是在一个类以的比赛(微额借款用户人品预测大赛)认识的,对数据挖掘竹热爱让我们走到了一起,以下是成员简介:姓名学校、学历比赛经历匚陈靖」中国科学技术大学研二天泡科学家总分第三,微额借贷用户人品预测大赛季军朱治亮浙江大学研二淘宝穿衣搭配比赛李军,微额借贷用户人品预测大赛李军质耀重庆邮电大学研二微额借贷用户人品预测大赛冠军匚赵蕊」重庆邮电大学研微额借贷用户人品预测大赛亚军黄伟鹏北京大学研一微额借贷用户人品预测大赛冠军解决方案概述2.1项目介绍与问题分析拍拍贷“魔镜风控系统”从平均400个数据维度评估厍户当前的信用状态,给每个告款人打出当前状态的信用分,在此基础上再结合新发标的信息,打出对于每个标约6个月内逾期率的预沨,为没资人提供关键的决策依据。本次竞赛目标是根据用户历史行为数据来颈测用户在六来6个月内是否会逾期还款的概率。问题转换成2分类问题,评估指标为AUC,从 Master, LogInfo, Update Info表中构建恃征,考虑评估指标为AUC,其本质是排序优化问题,所以我们在模型顶层融合也使用基于排序优化的 RANK AVG融合方法。2.2项目总体思路本文首先从数据清洗开始,介绍我们对缺失值的多维度处、对离群点的剔除方法以及对字符、空格等的处理;其次进行特征工程,包括对地理位置信息的特征构建、成交玉间特征、类别特征编码、组合特征构建、 Lpdatelnfo和 Log Info表的特征提取等;再次进行特征选择,我们采用了 boost, boost的训练过栏即对特征重要性的排序过程;然后处理类别的不平衡度,由于赛题数据出现了类不平衡的情况,我们采用了代价敏感学习和过采样两和方法,重点介绍我们所使用的过采样方法;最后一部分是模型设计与分析,我们采用了二业界广泛应用的逻辑回归模型、数据挖掘比赛大杀器 ghost.,创新性地揆索了large- scale sⅧm的方法在本赛题二的应用,玟得了不错的效果,此外还介绍了模型融合方、数据清洗3.1缺失值的多维度处理在征信领域,用户信总的完善程度可能会影响该层户的信用评级。一个信息完苦程度为100%的户比起完善程度为50%的用户,会更加容易官核通过并得到借款。从这一点亡发,我们对缺失值进行了多维度的分析和处理按列(属性)统计缺失值个数,进一步得到各列的缺失比率,下图(图1)显示了含有缺失值的属性和相应的缺失比率sing rate of Attributes图1.属性缺失比枣WeblogInfo_1和 WeblogInfo3的缺失值比率为97%,这两列属性基本不携带有用的信息,直接剔除。 Uscr Info_11、 Userinfo_12和 Uscr info_13的缺失值比率为63%,这三列属性是类别型的,可以将缺失值用-1垣充,相当于“是否缺失”当成另一种类别。其他缺失值比卒较小的数值型属性用中值填充按行统计每个样本的属性缺矢值个数,将缺失值个数从小到大排序,以序号为横坐标,缺失值个数为纵坐标,画出如下散点图(图2)test set16016014014C12012Cw9mczE100400060008000Order Numbe(sort ircreasinglyOrde Nt mber(sort increasing ly)图2.样本属性缺失个数对比 trainset和 testset上的样本的属性缺失值个数,可以发现其分有基本一致,但是trainset上出了几个缺失值个数特别多的样本(红框区域内),这几个样本可以认为是离群点,将其剔除另外,缺矢值个数可以作为一个特征,衡量用户信息的完善程度。3.2剔除常变量原始数据宁有190维数值型特征,通过计算每个数值型特征的标准差,剔除部分变亿很小的特征,下表(表1)列出的15个特征是标准差接近于0的,我们剔了这15维特征表1.剔除数值特征标准差属性标准差属性标准差属忾标准差Webloglnfo_10 0.0707 WeblogInfo_41 0.0212 Webloglnfo_490.0071Webloglnfo_23.0939 WeblogInfo_43 0.0372 Webloglnfo_5200512Webloglnfo_31.0828 Webloglnfo_44.0166 Webloglnfo_5400946Webloglnfo_32 0.0834 Webloglnfo_46.0290 WeblogInfo_5500331Webloglnfo_40.0666 Webloglnfo_47 0.0401 WeblogInfo_58006093.3高群点剔除在样本空间中与其他样本点的一般行为或特征不一致的点称为离群点,考虑到离群点的异常特征可能是多维度的组合,我们通过分析样本属性的缺矢值个数,剔除了极少量的离群点(见3.1节)此外,我们还采用了另外一种简单有效的方法:在原始数捶上训练ⅹ gboost,用得到的xgb模型输出特征的重要性,取最重要的前20个特征(如图3所示),统计每个栏本在这20个特征上的缺失值个数,将缺矢值个数大于10的样本作为离群点。ThrciParty Ifn PeriodIntrAparty nto HerodThrcPorty hfo Penod3ardiParty hfo Period?ThirdParty Info Penod图3.Xgb特征重要性通过这个方法,易除了400多个样水。这些样在重要特征上的取值是缺失的,会使得模型学习变得因难,从这个角度妖说,它们可以看成是离群点,应剔除掉。3.4其他处理(1)字符大小写转换Userupdate Info表宁的 Userupdate Info1字段,属性取值为英文字符,包含了大小写,如Q"和”qQ",很玥显是同一和取值,我们将所有字符统一转换为小写(2)空格符处理Mastor表中 UserInfo9字段的取值包含了空格字符,如“中国移动”和“中国移动”它们是同一种取值,需要将空格符去除。(3)城市名处理Userinfo_8包含有“重庆”、“重庆市”等取僬,它们实际上是同一个城市,需要把字符中的“市”全部去掉。去掉“市”之后,城市数由600多下降到400多。四、特征工程4.1地理位置的处理对地理位置信(类别型变量)最简单的处理方式是独热编码(one- hot encoding),但是这样会得到很高维的稀疏特征,影响糢型的学习,我们在独热编码旳基础上,做了特征选择。下面介绍具体的方法。赛题数据提供了用户的地挛位置信息,包括7个字段: Userinfo2、 Userinfo4、UserInfo7、 UserInfo8、 UserInfo I9、 UserInfo20,其中 UserInfo_7和 UserInfo19是省份信息,其余为城市信息。我们统计了每个省份和城市的违约率,下图以 Userinfo_7为例图1.省分违约率可视化图5可视化了每个省份的违约率,颜色越深代表违约率越大,其中违约率最大的几个省份或直辖市为四川、湖南、湖北、吉林、天津、山东,如下图所示:图5.违约深突出省份可视化因此我们可以构建6个二值特征:“是否为四川省”、“是否为湖南省”...“是否为山东省”,其取值为或1。其实这相当于对地理位置信息做了独热编码,然后保留其中有判别性的菜些列。这里 UserInfo_7何含32和取值,编码后可以得到32维的稀疏特征,而我们只保留其宇的6维以上我们是通过人工的分析方法去构延二值特征,在处理省份信息时还是匕较直观的,但是处理城市信息,比如 Userinfo2,包含了33个减市,就没有那么直观了。为了得到有判别性的二值特征,我们首先对 Userinfo2进行独热编码,得到333维的二值特征,然后在这333维稀疏特征上训练ⅹgb模型,再根据xgb输出的特征重要性刷选二值痔征,以下是选取到的部分二值特征(对应的城市):“淮纺市”、“九江市”、“三门峡市”、“汕头市”、“长春市”、“铁岭市”、“济菊市”、“成都市”、“淄博市”、“牡丹江市”。按城市等级合并类别型特征取值个数太多时,独热编码后得到太高维的稀疏特征,除了采用上面提到的特征选择方法外,我们还使用了合并变量的方法。按照城市等级,将类别变量合并,例如线城市北京、上海、广州、深圳合并,赋值为1,同样地,二线城市合并为2,三线城市合并为3>经纬度特征的引入以上对地理位置信息的处理,都是基于类别型的,我们另外收集了各个城市的经纬度,将城市名用经纬度替换,这样就可以将类别型的变量转化为数值型的变量,比如北京市,用经纬度(39.92,116.46)替换,得到北纬和东经两个数值型特征。加入经纬度后,线下的cross validation有千分位的提升。城市特征向量化我们将城可特征里的城市计数,并取Log,然后等值离散化到610个区间内。以下图为例,将 serino2这个特征里面的325个城市离散为一个6维向量。向量“100000”表示该城位于第一个区间。线下的 cross validation有千分位的提升。Loglui2 num)6.城市特征离散化地理位置差异特征如图8所示,1,2,1,6列郗是城市。那么我们构建一个城市差异的特征,比妇diff_12表示1,2列的城市是否相同。如此构建 diff l2,diff_14,diff_l6,diff_24,diff26,diff46这6个城市差异的特征。线下的 cross validation有千分位的提升。⊥aJse⊥nfa2 userinfo4 Userinfo7 Userinfo8 Userinfo19uer⊥nf。201C013郴州1C020惠州1C033零1c035深圳东东东东建东福建省10038济104连云港远言港带1C042德州1c043青岛聊拔东自聊城市46深圳汕广东广东省汕尾市105所多工新乡图7.地理位置差异样例4.2成交时间特征按日统计训练集中每天借贷的成交量,正负样本分别统计,得到如下的曲线图8,横坐标是日期(20131101至20141109),纵坐标是每天的借贷量。蓝色由线是违约的样本每天的数量(为了对比明显,将数量乘上了2),绿色曲线对应不违约的样本train set1200count o10008004002广外从20030350Date20131101~20141109图8.每日借贷量统计可以发现拍拍贷的业务量总体是在埤长的,而违约数量一开始也是缓慢增长,后面基本保持不变,总体上违约率是平稳甚至下降的。在横坐标300~350对应的日期区间,出现了些借贷量非鸴大的时间苄点,这些可能隐减着苿些信息,我们尚未挖掘出来。考虑到违约率跟时间线有关,我们将戒交时间的字段 Listinginfc傲了几种处理,一和是直接将其当做连续值特征,也就是上图对应的横坐标,另一和是离散化夂理,每10天作为一个区间,乜就是将日期0`10离散化为1,日期1120离散化为2.4.3类别特征的处理除了上面提到的对菜些类别特征进行特殊处理外,其他类别特征都做独热编码。44组合特征Xgboost的训练完成后可以输出特征的重要性,我们发现第三方数据特征ThirdParty Info Period XX”的 feature score比较大(见图3),即判别性比较高,于是用这部分特征构建了ξ合特征:将特征两两相除得到7000个特征,然后使用 boost对这7000多个特征单独训练模型,训练完成后得到特征重要性的排序,取其中top500个特征线下cv能达到0.73+的AUC值。将这500个特征添加到原始特征体系中,线下cv的AC值从0.777捉高到0.7833。另外,也组合了乘法特征(取对数):10g(x*y),刷选出其中的270多维,加入到原始特征休系中,单模型cv又提高到、0.785左右。4.5 Upadte Info表特征根据提供的修改信息表,我们从中抽取了用户的修改信息特征,比如:修改信息次数,修改信息时间到成交时间的跨度,每和信息的修改次数等等特征。46 LogInfo表特征类似地,我们从登录信息表里提取了用户的登录信息特征,比如登录天数,平均登录间隔以及每种操作代码的次数等47排序特征对原始特征中190维数值型特征接数值从小到大进行排序,得到190维排序特征。排序特征对异常数据有更强的鲁棒性,使得模型更加稳定,降低过拟合的风险。五、特征选择在特征工程部分,我们构建了一系列位置信息相关的特征、组合特征、成交时间特征、排序特征、类别稀疏侍征、 updateinfo和1 oginfo相关的特征等,所有特征加起来将近1500维,这么多维特征一方面可能会导致维数灾难,另一方面很容易导致过拟合,需要做降维处理,降维方法赏用的有如PCA,tSNE等,这类方法的计算复杂度比较高。并且根据以往经验,在数据挖掘类的匕赛中,PCA或t-SNE效果仨往不好。除了釆用降维算法之外,也可以通过特征选择来降低特征维度。特征选择的方法很多:最大信息系数(MIC)、皮尔森相关系数(衡量变量间的线性相关性)、正则化方法(L1,L2)、基于模型的特征排序方法。比较高效的是最后一种,即基于学习模型的特征排序方法,这种方法有一个好处:模型学习的过程和特征选择的过程是同时进行的,医此我们采用这和方法,基于 boost来做特征选择, xgboost模型洲练完成后可以输岀特征的重要性(见3.3图),据此我们可以保留TopN个特征,从而达到特在选择的目的。
    2020-06-23下载
    积分:1
  • 5G网络技术架构
    主要讲述当前网络挑战与发展趋势,以及网络总体设计和5G网络的功能特是哪个,和关键技术 。最后总结和展望未来AT-2◇21MT202056/推进组5G无线技术架构白皮书引言在过去的三十年里,移动通信经历了从语音多址技术之外,大规模天线、超密集组网和全频业务到移动宽带数据业务的飞跃式发展,不仅深谱接入都被认为是5G的关键使能技术。此外,新刻地改变了人们的生活方式,也极大地促进了社型多载波、灵活双工、新型调制编码、终端直通会和经济的飞速发展。移动互联网和物联网作为(2)、全双工(又称同时同频全双工)等也未来移动通信发展的两大上要驱动力,为第五代是潜在的5G无线关键技术。5G系统将会构建在以移动通信(5G)提供了广阔旳应用前景。面向新型多址、大规模天线、超密集组网、全频谱接2020年及未来,数据流量的千倍增长,千亿设备入为核心的技术体系之上,全面满足面向2020年连接和多样化的业务需求都将对5G系统设计提出及未来的5G技术需求。严峻挑战。与4G相比,5G将支持更加多样化的当前,5G愿景与需求已基明确,概念与技场景,融合多种无线接入方式,并充分利用低频术路线逐步清晰,国际标准制定工作即将启动。和髙频等频谱资源。同时,5G还将满足网络灵为此,迫切需要尽快细化5G技术路线,整合各种活部署和高效运营维护的需求,大幅提升频谱效无线关键技术,形成5G无线技术框架并推动达成率、能源效率和成本效率,实现移动通信网络的产业共识,以指导5G国际标准及后续产业发展。可持续发展传统的移动通信升级换代都是以多址接入技术为主线,5G的无线技术创新来源将更加丰富。除了稀疏码分多址(SCMA)、图样分割多址(PDMA)、多用户共享接入(MUSA)等新型AT-292◇MT2020(5G)推进组5G无线技术架构白皮书场景与技术需求与以往移动通信系统相比,5G需要满足更加低功耗大连接场景主要面向环境监测、智多样化的场景和极致的性能挑战。归纳未来移动能农业等以传感和数据采集为目标的应用互联网和物联网主要场景和业务需求特征,可提场景,具有小数据包、低功耗、低成本炼出连续广域覆盖、热点高容量、低时延高可靠海量连接的特点,要求支持百万/平方公里和低功耗大连接四个5G主要技术场景。连接数密度。·连续广域覆盖玚景是移动通信最基本的覆总之,5G的技术挑战主要包括盖方式,在保证用户移动性和业务连续性0.1-1GbDs的用广体验速率,数十Gbps的的前提下,无论在静止还是高速移动,覆峰值速率,数十Tbυs/km的流量密度,1盖中心还是覆盖边缘,用户都能够随时随百万/平方公里的连接数密度,毫秒级的地获100Mbps以上的体验速率。端到端时延,以及百倍以上能效提升和单热点高容量场景:要面向室内外局部热点位比特成本降低。区域,为用户提供极高的数据传输速率,满足网络极高的流量密度需求。要技术挑战包括 1Gbps用户休验速率、数|Gbps峰值速率和数十Tbps/km的流量密度低时延高可靠场景主要面向车联网、工业控制等物联网及垂直行业的特殊应用需求,为用户提供亳秒级的端到端时延和或接近100%的业务可靠性保证。AT-2◇2M-2020(56推进组5G无线技术架构白皮书5G无线技术路线面对5G场景和技术需求,需要选择合适的5G将通过工作在较低频段的新空口来满足无线技术路线,以指导5G标進化及产业发展。大覆盖、高移动性场景下的用户体验和海量设综合考虑需求、技术发展趋势以及网络平滑演备连接。同时,需要利用高频段丰富的频谱资进等因素,5G空口技术路线可由5G新空口(含源,来满足热点区域极高的用户体验速率和系低频空口与高频空口)和4G演进两部分组成。统容量需求。综合考虑国际频谱规划及频段传LTE/LTE一 Advanced技术作为事实上的播特性,5G应当包含工作在6GHz以下频段的统一4G标准,已在全球范围内大规模部署。为低频新空口以及工作在6GHz以上频段的高频了持续提升4G用户体验并支持网络平滑演进新空口。需要对4G技术进一步增强。在保证后向兼容的5G低频新空口将采用全新的空口设计,前提下,4G演进将以LE/LTE- advanced技引入大规模天线、新型多址、新波形等先进技术梹架为基础,在传统移动通信频段引入增强术,攴持更短的帧结构,更精简的信令流程,技术,进一步提升4G系统的速率、容量、连接更灵活的双工方式,有效满足广覆盖、大连接数、时延等空口性能指标,在一定程度上满足及髙速等多数场景下的体验速率、时延、连接5G技术需求。数以及能效等指标要求。在系统设计时应当构受现有4G技术框架的约東,大规模天线建统一的技术方案,通过灵活配置技术模块及超密集组阏等增強技术的潜力难以完仝发挥,参数来淸足不同场景差异化的技术需求。全频谱接入、部分新型多址等先进技术难以在5G高频新空口需要考虑高频信道和射频器现有技术框架下采用,4G演进路线无法满足5G件的影响,并针对波形、调制编码、天线技术极致的性能需求。因此,5G需要突破后向兼容等进行相应的优化。同时,高频频段跨度大的限制,设计全新的空口,充分挖掘各种先进候选频段多,从标准、成本及运维角度考虑,技术的潜力,以全面满足5G性能和效率指标要应当尽可能采用统一的空口技术方案,通过参求,新空口将是5G主要的演进方向,4G演进将数调整来适配不同信道及器件的特性。是有效补充。髙频段覆盖能力弱,难以实现全网覆盖,需要与低频段联合组网。由低频段形成有效的3AT-22MT2020(5G)推进组5G无线技术架构白皮书网络覆盖,对用户进行控制、管理,并保证基本的数据传输能力;高频段作为低频段的有效补充,在信道条件较好情况下,为热点区域用户提供高速数据传输。5G无线技术路线主要场景连续广域覆盖6-100GHZ5G高频新空口冷热点高容量5G低频新空口低时延高可靠
    2020-12-05下载
    积分:1
  • 696518资源总数
  • 104269会员总数
  • 42今日下载