matlabtosolve
代码说明:
基于MATLAB实现的说话人识别程序,分别用bp、pnn、som、rbf、lvq等算法,对语音文件进行训练和测试,效果不错。~..~ 下面说明一下bprengong程序: 数据分别用来训练和测试两部分。 具体程序分为两部分,第一部分为:计算识别模型 变量v是mfcc处理以后的矢量。因为数据可能长短不一,所以放在同一进行截取。p的每一行代表一个语音数据(共15个)。变量Pr为每一行的最大最小值。变量T为目标值。输出神经元个数为15。 在训练阶段,如果用于训练的输入训练样本的类别标号为i(即语音数据的标号),则训练时设第i个节点的期望输出设为1。其余节点期望输出均为0。 在识别时,当一个未知类别的样本作用到输入端时,考查各输出节点的输出,并将这个样本的类别判定为输出值最大的那个节点对应的类别。 (err)
文件列表:
bprengong.m
cfmfcc.m
data
....\test
....\....\s1.wav
....\....\s10.wav
....\....\s11.wav
....\....\s12.wav
....\....\s13.wav
....\....\s14.wav
....\....\s15.wav
....\....\s2.wav
....\....\s3.wav
....\....\s4.wav
....\....\s5.wav
....\....\s6.wav
....\....\s7.wav
....\....\s8.wav
....\....\s9.wav
....\train
....\.....\s1.wav
....\.....\s10.wav
....\.....\s11.wav
....\.....\s12.wav
....\.....\s13.wav
....\.....\s14.wav
....\.....\s15.wav
....\.....\s2.wav
....\.....\s3.wav
....\.....\s4.wav
....\.....\s5.wav
....\.....\s6.wav
....\.....\s7.wav
....\.....\s8.wav
....\.....\s9.wav
demo1.m
demo2.m
demo3.m
ENFRAME.M
lvqrengong.m
MELBANKM.M
melfb.m
mfcc.m
pnnrengong.m
rbfrengong.m
somrengong.m
vad.m
说明.txt
下载说明:请别用迅雷下载,失败请重下,重下不扣分!