• (两会受权发布)最高人民检察院检察长简历 2019-09-16
  • В Пекине закрылась первая сессия ВСНП 13-го созыва 2019-09-16
  • 新疆规范法律服务事中事后监管 实现科学有效监管 2019-09-13
  • 抢先试驾新一代唐 更接地气的多面手 2019-09-13
  • 关于人类所有的知识问题,其实都是社会问题。就“社会”两个字。 2019-09-05
  • “绿水青山就是金山银山”的生动实践——国家生态文明建设示范地区发展纪实 2019-09-01
  • 新时代新气象新作为 2018天津网媒记者走基层 2019-09-01
  • 魏占军的专栏作者中国国家地理网 2019-08-23
  • 厌式房间:用设计触动用户 2019-08-23
  • 端午节旅游远离人群与繁华 来这四个冷门却有独特风情之地 2019-08-22
  • 女性之声——全国妇联 2019-08-16
  • 2018第二届大同重机国际摩托车滚雷巡游节开幕 2019-08-16
  • 与欧盟“共斗”特朗普?日本要求参加WTO对美磋商 2019-08-15
  • 传媒每周热闻第358期:我国部署监测和清查儿童邪典视频 口碑之作《神秘巨星》票房飘红 2019-08-15
  • 走高端路线 北汽与麦格纳拟成立合资公司 2019-08-10
  • 3d走势图(带线专业版):一种新的聚类判别分析框架及其实证研究

    计算机应用论文 时间:2018-03-08 我要投稿

    双色球开奖号码 www.nsjl.net   又快到一年一季的毕业季节啦,各大高校的童鞋们又要开始疯狂滴写论文改论文啦,小编在这里对你们表示深深的同情。同情之余,小编也为大家带来了毕业论文范文——一种新的聚类判别分析框架及其实证研究,供大家阅读参考!

      摘要:在分析经典聚类判别分析方法实质的基础上,提出了一种新的聚类判别分析框架,改进了一种基于样本指标值频度计算的两总体判别分析算法,提高了在对所有参与建立判别模型的样本进行判别时的计算速度;给出了建立在此改进判别分析算法基础上的一种动态聚类判别分析算法的设计,并实现了所有算法。进行相应的实证研究,结果表明以此聚类判别分析框架对给定样本集合进行分析,可以迅速得到多个合理的聚类结果以及对聚类结果的清晰解释,既可以对已有的聚类结果进行验证,又可以进行数据的探索性分析。

      关键词:聚类分析; 判别分析; 动态聚类

      0 引言

      经典聚类分析算法是基于距离计算的。然而除马氏距离定义外,其他距离定义都存在样本指标的量纲处理问题;除马氏距离和斜交空间距离定义外,其他距离定义都存在样本指标的相关性处理问题;另外,包括马氏距离在内的所有距离定义都存在将用于聚类的指标同等对待的缺点,不能反映不同指标对聚类结果的贡献程度。

      一般情况下,在确定样本间距离计算方法的基础上,用不同的聚类分析方法得到聚类的结果是不会完全一致的。这是因为在实际应用中,许多对象在不同类之间本身并无清晰的划分。这导致了在既定用于聚类的指标组合的情况下,用不同的聚类方法对同一组样本进行分析会得到不同的聚类结果。如上所述,即使使用同一种聚类方法,有时由于样本的排列顺序不同,也可能导致不同的分类结果。这就提出了对不同的聚类方法进行评价的问题。关于所用方法好坏的评价,现在还没有一个合适的标准。Edwards 和CAVALL I?sforza (1965) 曾建议把样本分成两类,使得两类间的离差平方和最大[1]。D.Fisher Walter也指出,应该寻找使类内差异最小的聚类方法[2]。因此,评价不同聚类方法的一个重要方面,就是看这些方法得到的聚类结果在类内的接近程度和在类间的相隔程度。一个较好的分类方法应该得到类内差异较小、类间差异较大的聚类结果。在实际应用中,一般采用以下两种处理方法:a)根据分类问题本身的专业知识,结合实际需要来选择分类的方法,并确定分类的个数;b)用多种方法对数据进行分析处理,把结果的共性取出来。如果用几种方法的某些结果都一样,则说明这样的聚类确实反映了事物的本质。将有争议的样本暂放一边,或者用其他方法如判别分析进行处理归类。另外,在聚类分析方法既定的情况下,同一组样本采用不同的指标组合进行聚类分析,通常也会得到不同的分类结果。产生不同结果的原因主要是由于不同的指标组合测度是样本间的不同侧面的相似程度,在进行聚类分析时存在指标组合选择的问题。一般是根据聚类的实际需要进行指标的选择,这是一个比较复杂并且带有主观性的问题。实践中,在开始进行聚类分析时,通常是先选择多种指标组合分别进行聚类,然后对聚类分析的结果进行对比分析,以确定出合适的测度指标。

      判别分析产生于20世纪30年代,是利用已知类别的样本建立判别模型,为未知类别的样本判别的一种统计方法。近年来,判别分析在自然科学、社会学及经济管理学科中都有广泛的应用。判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。当遇到新的样本点时,只要根据总结出来的判别公式和判别准则,就能判别该样本点所属的类别。判别分析按照判别的组数来区分,可以分为两组判别分析和多组判别分析。本文仅研究两组判别分析。在众多的判别分析方法中,最直观的是距离判别法。

      距离判别的思想是计算待判样本到第?i?类总体的平均数的距离。哪个距离最小就将它判归到哪个总体。所以,距离判别法的任务就是构造一个恰当的距离函数,通过样本与某类别之间距离的大小判别其所属类别。这里仅讨论两个总体的距离判别法。距离判别只要求知道总体的数字特征,不涉及总体的分布函数。当参数未知和协方差时,就用样本的均值和协方差矩阵来估计。

      从距离判别法可以看到判别规则是一个线性函数。由于线性判别函数使用简便,希望能在更一般的情况下建立一种线性判别函数。Fisher判别法由Fisher在1936年提出,是根据方差分析的思想建立起来的一种能较好区分各个总体的线性判别法。该判别方法对总体的分布不作任何要求。

      从两个总体中抽取具有?p?个指标的样本观测数据,借助于方差分析的思想构造一个线性判别函数:

      距离判别法是基于距离计算的,用构造线性判别函数方法进行样本判别的Fisher判别法也存在着类似基于距离计算的聚类分析方法当中的不足:

      a)将总体和样本的多个指标赋予了同等的判别能力,而这与现实是不相符合的,即不同的指标在判别样本的归属时具有不同的判别能力。

      b)没有对用于建立判别分析模型的总体指标进行筛选。这在两总体的某指标没有显著差异时进行判别分析的意义不大,误判的概率很大[3,4]。

      c)距离的计算不可避免地会带来量纲上的问题[5]。

      d)距离判别方法简单实用,但没有考虑到每个总体出现的机会大小,即先验概率,没有考虑到错判的损失。Bayes判别法正是为了解决这两个问题提出的判别分析方法,其判别效果更加理想,应用也更广泛。本文将在实证研究部分用Bayes 判别方法对涉及的问题进行分析,作为与新算法计算效果的一个对比。

      在回归分析中,变量的好坏直接影响回归的效果。在判别分析中也有类似的问题。用于建立判别准则的指标的选择是判别分析中的一个重要问题。如果在某个判别问题中,将最重要的指标忽略了,相应的判别函数的效果一定不好;另一方面,如果引入了一些判别能力不强的指标,不仅会增加计算量,还会严重地影响判别的效果。但是在许多问题中,事先并不知道哪些是主要指标。因此筛选变量的问题就非常重要,从而产生了逐步判别法。逐步判别法与逐步回归法的基本思想类似,都是采用有进有出的算法,即逐步引入变量,每引入一个重要的变量进入判别式,同时也考虑较早引入判别式的某些变量。如果其判别能力随新引入的变量而变为不显著了(如其作用被后引入的某几个变量的组合所代替),应及时从判别式中把它剔除,直到判别式中没有不重要的变量需要剔除,而剩下的变量也没有重要的变量可以引入的判别式时,逐步筛选结束。这个筛选过程实质就是作假设检验。通过检验找出显著性变量,剔除不显著的变量,得到用于建立判别式的变量组合后,可用各种方法建立判别函数和判别准则。

    相关推荐
  • (两会受权发布)最高人民检察院检察长简历 2019-09-16
  • В Пекине закрылась первая сессия ВСНП 13-го созыва 2019-09-16
  • 新疆规范法律服务事中事后监管 实现科学有效监管 2019-09-13
  • 抢先试驾新一代唐 更接地气的多面手 2019-09-13
  • 关于人类所有的知识问题,其实都是社会问题。就“社会”两个字。 2019-09-05
  • “绿水青山就是金山银山”的生动实践——国家生态文明建设示范地区发展纪实 2019-09-01
  • 新时代新气象新作为 2018天津网媒记者走基层 2019-09-01
  • 魏占军的专栏作者中国国家地理网 2019-08-23
  • 厌式房间:用设计触动用户 2019-08-23
  • 端午节旅游远离人群与繁华 来这四个冷门却有独特风情之地 2019-08-22
  • 女性之声——全国妇联 2019-08-16
  • 2018第二届大同重机国际摩托车滚雷巡游节开幕 2019-08-16
  • 与欧盟“共斗”特朗普?日本要求参加WTO对美磋商 2019-08-15
  • 传媒每周热闻第358期:我国部署监测和清查儿童邪典视频 口碑之作《神秘巨星》票房飘红 2019-08-15
  • 走高端路线 北汽与麦格纳拟成立合资公司 2019-08-10
  • 大赢家心水主论坛13637 大了透开奖开奖结果查询 斗牛单机手机免费下载 足彩胜负14场怎么买 2019网络赚钱新方法 云南快乐十分必赢技巧 誉京华大乐透12098 海南体彩41开奖查询 请问今晚3d试机号多少 福彩25选5开奖历史记录表 青海11选5几点开始 456棋牌 26选5最新开奖查询 赛马会一波中特 2元彩票网