预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共49页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

模式识别理论及其应用简介模式识别计算过程示意图有监督模式识别(判别分析)无监督模式识别(聚类分析)常用术语注意事项模式识别的数据预处理特征抽提模式间相似度的度量马氏距离(MahalanobisDistance)马氏距离(MahalanobisDistance)K-NearestNeighborsDiscriminationMethodK最近邻法考查未知样本点的K个近邻(K为单数整数),若近邻某一类样本最多,则可将未知样本判为该类。 为了进行定量判别,可先找出待分类样本的最近邻,并事先约定最近邻区域中的训练集样本数。如果只取一个最近邻样本点,即样本数为1,则称1NN法;如果取2个最近邻样本点,即样本数为2,则称2NN法;如果样本数为K,则称K近邻法,简称KNN法。KNN算法简化的KNN法—类重心法将上表数据进行归一化处理后计算两 类的重心得: C1=[-0.0103,0.0402,-0.0246,0.0166, 0.0313,-0.0246,-0.0174]´ C2=[0.0103,-0.0402,0.0246,-0.0166, -0.0313,0.0246,0.0174]´ 地层I、II的每一个矢量与C1和C2的距 离分别如表a和表b所示:线性学习机法Linearlearningmachine—LLM例:现有甲状腺病人(记为类1)和正常人(记为类2)各10例,分别测试5项功能指标,测试结果见表a和表b所示。以每一类的前8个样本作为训练集(表a),后2个作为测试集(表b)。用LLM法对其进行判别。基于主成分对近红外光谱进行discriminationanalysis的方法原理无监督模式识别法常用聚类分析方法有: 分级聚类分析法—Hierarchicalclusteringmethods 最小(大)生成树法—Minimun(Max)SpanningTreeMethod K均值聚类法—K-meansClusteringMethod 模糊聚类法—Fuzzyclusteringmethod PCA投影分类法等等1基于PCA的聚类分析法主成分分析的数学与几何意义示意图Projectiondiscriminationbasedonprincipalcomponentanalysis2基于相似统计量的分类方法i)若选出的一对样本在已形成的组中均未出现过,则将它们形成一个独立的新组。 ii)若选出的一对样本中有一个在已经分好的组中出现过,则把另一个样品加入该组中。 iii)若选出的两对样品都分别出现在两个组中,则把这两个组合并为一个组。 iv)若选出的一对样品都在同一组中则不需再分组。 某铜镍矿床样品的聚类分析谱系图上图点与点之间的数据叫作路径强度,表示两样本点间的相似程度。如果一个路径的起点与终点重合,称这条路径构成一个回路,对于图中砍去某些边得到的树叫生成树。若某生成树所有路径的强度都大于或等于其它生成树的路径强度,则称此生成树为最大生成树。 只要找到相似关图的最大生成树,就可以根据最大生成树进行模糊聚类分析,其分类准则是:对于规定的阈值水平,路径强度大于的顶点可归为一类。根据最大生成树进行聚类分析的方法如下: (1)先连接路径强度最大的两点,然后连接路径强度次大的两点; (2)继续连接所剩下点的最大路径强度的两点,直到所有的点都被连接; (3)对连接所得到的树进行检查,找到最小路径的边,将其割断就得到两类,如此继续分割,直至类数已达到所要分的类数。 模式识别在分析化学中的应用计算机图谱解析技术: (1)数据库图谱显示方法—将大量已知化合物的图谱存入数据库,通过检索的方祛来识别谱图。 (2)模式识别法—利用已知谱图作训练集,对未知物的谱图作分类、鉴别以至结构测定等等(例如近红外仪软件中的定性分析软件)。模式识别方法有某种“举一反三”的功能, 能从大量已知化合物图谱抽提具有较普遍意 义的规律,用来对未知化合物的谱图分类。 这使得模式识别方法在谱图解析、分析化学、 结构确定等方面有重要的实际意义。 迄今为止,质谱、原子光谱、红外光谱、核 磁共振谱、γ射线谱、色谱、极谱等的谱图 识别都已用了模式识别方法,不同程度地收 到效果。这方面的研究工作是现代分析化学 的前沿课题之一。(3)模式识别在核磁共振谱解析中的应用