• 【重庆天气】最新重庆今天天气,实时提供重庆气温、空气质量、24小时天气预报、生活指数查询 2019-10-16
  • 秦珂:联盟不是生态圈本身,是生态圈的过程 2019-10-16
  • 运城市两部微电影喜获全国奖 2019-10-13
  • 黔张常铁路龙山段线下工程完工 2019-10-07
  • 网友举报货车扰民 交管部门用这个锁定"肇事车" 2019-10-07
  • 返程路上,铁路仍在“扬鞭奋蹄” 2019-10-04
  • 互联网药品信息服务资格证书 (京)-经营性-2009-0016 2019-09-29
  • 一语惊坛(5月30日):磋商,不等于反复折腾。 2019-09-26
  • 设计师默默吐槽的这些话 你想听吗 2019-09-24
  • 高清:埃及今晚对阵乌拉圭 萨拉赫有望登场 2019-09-24
  • 岚山区拨付595 万元补助农村危房改造 2019-09-21
  • 江西日报社社长王晖祝贺人民日报创刊70周年 2019-09-21
  • 吴尊送儿子上学晒自拍 父子颜值超高Max笑容灿烂 2019-09-21
  • (两会受权发布)最高人民检察院检察长简历 2019-09-16
  • В Пекине закрылась первая сессия ВСНП 13-го созыва 2019-09-16
  • 排列三和值走势图500期:计算机应用论文-数据挖掘技术研究

    计算机应用论文 时间:2018-03-08 我要投稿

    双色球开奖号码 www.nsjl.net   即将毕业的大学生,毕业论文是不可缺少的一项,但是毕业论文又是十分难写的,让很多同学挠破头皮也难以下笔。在这里小编为大家展示一篇计算机应用论文——数据挖掘技术研究,希望能够帮到同学们!

      【摘要】 本文主要介绍了数据挖掘的基本概念,以及数据挖掘的方法。

      【关键词】 数据挖掘 数据挖掘方法

      随着信息技术迅速发展,数据库的规模不断扩大,产生了大量的数据。但大量的数据往往无法辨别隐藏在其中的能对决策提供支持的信息,而传统的查询、报表工具无法满足挖掘这些信息的需求。因此,需要一种新的数据分析技术处理大量数据,并从中抽取有价值的潜在知识,数据挖掘(Data Mining)技术由此应运而生。

      一、数据挖掘的定义

      数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等。它可帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为。数据挖掘的过程也叫知识发现的过程。

      二、数据挖掘的方法

      1.统计方法。传统的统计学为数据挖掘提供了许多判别和回归分析方法,常用的有贝叶斯推理、回归分析、方差分析等技术。贝叶斯推理是在知道新的信息后修正数据集概率分布的基本工具,处理数据挖掘中的分类问题,回归分析用来找到一个输入变量和输出变量关系的最佳模型,在回归分析中有用来描述一个变量的变化趋势和别的变量值的关系的线性回归,还有用来为某些事件发生的概率建模为预测变量集的对数回归、统计方法中的方差分析一般用于分析估计回归直线的性能和自变量对最终回归的影响,是许多挖掘应用中有力的工具之一。

      2.关联规则。关联规则是一种简单,实用的分析规则,它描述了一个事物中某些属性同时出现的规律和模式,是数据挖掘中最成熟的主要技术之一。关联规则在数据挖掘领域应用很广泛适合于在大型数据集中发现数据之间的有意义关系,原因之一是它不受只选择一个因变量的限制。大多数关联规则挖掘算法能够无遗漏发现隐藏在所挖掘数据中的所有关联关系,但是,并不是所有通过关联得到的属性之间的关系都有实际应用价值,要对这些规则要进行有效的评价,筛选有意义的关联规则。

      3.聚类分析。聚类分析是根据所选样本间关联的标准将其划分成几个组,同组内的样本具有较高的相似度,不同组的则相异,常用的技术有分裂算法,凝聚算法,划分聚类和增量聚类。聚类方法适合于探讨样本间的内部关系,从而对样本结构做出合理的评价,此外,聚类分析还用于对孤立点的检测。并非由聚类分析算法得到的类对决策都有效,在运用某一个算法之前,一般要先对数据的聚类趋势进行检验。

      4.决策树方法。决策树学习是一种通过逼近离散值目标函数的方法,通过把实例从根结点排列到某个叶子结点来分类实例,叶子结点即为实例所属的分类。树上的每个结点说明了对实例的某个属性的测试,该结点的每一个后继分支对应于该属性的一个可能值,分类实例的方法是从这棵树的根结点开始,测试这个结点指定的属性,然后按照给定实例的该属性值对应的树枝向下移动。决策树方法是要应用于数据挖掘的分类方面。

      5.神经网络。神经网络建立在自学习的数学模型基础之上,能够对大量复杂的数据进行分析,并可以完成对人脑或其他计算机来说极为复杂的模式抽取及趋势分析,神经网络既可以表现为有指导的学习也可以是无指导聚类,无论哪种,输入到神经网络中的值都是数值型的。人工神经元网络模拟人脑神经元结构,建立三大类多种神经元网络,具有非线形映射特性、信息的分布存储、并行处理和全局集体的作用、高度的自学习、自组织和自适应能力的种种优点?!?.遗传算法。遗传算法是一种受生物进化启发的学习方法,通过变异和重组当前己知的最好假设来生成后续的假设。每一步,通过使用目前适应性最高的假设的后代替代群体的某个部分,来更新当前群体的一组假设,来实现各个个体的适应性的提高。遗传算法由三个基本过程组成:繁殖(选择)是从一个旧种群(父代)选出生命力强的个体,产生新种群(后代)的过程;交叉〔重组)选择两个不同个体〔染色体)的部分(基因)进行交换,形成新个体的过程;变异(突变)是对某些个体的某些基因进行变异的过程。在数据挖掘中,可以被用作评估其他算法的适合度。

    相关推荐
  • 【重庆天气】最新重庆今天天气,实时提供重庆气温、空气质量、24小时天气预报、生活指数查询 2019-10-16
  • 秦珂:联盟不是生态圈本身,是生态圈的过程 2019-10-16
  • 运城市两部微电影喜获全国奖 2019-10-13
  • 黔张常铁路龙山段线下工程完工 2019-10-07
  • 网友举报货车扰民 交管部门用这个锁定"肇事车" 2019-10-07
  • 返程路上,铁路仍在“扬鞭奋蹄” 2019-10-04
  • 互联网药品信息服务资格证书 (京)-经营性-2009-0016 2019-09-29
  • 一语惊坛(5月30日):磋商,不等于反复折腾。 2019-09-26
  • 设计师默默吐槽的这些话 你想听吗 2019-09-24
  • 高清:埃及今晚对阵乌拉圭 萨拉赫有望登场 2019-09-24
  • 岚山区拨付595 万元补助农村危房改造 2019-09-21
  • 江西日报社社长王晖祝贺人民日报创刊70周年 2019-09-21
  • 吴尊送儿子上学晒自拍 父子颜值超高Max笑容灿烂 2019-09-21
  • (两会受权发布)最高人民检察院检察长简历 2019-09-16
  • В Пекине закрылась первая сессия ВСНП 13-го созыва 2019-09-16
  • vr三分彩杀号技 AG视讯内部人 金龙娱乐返彩金 足球14场胜负10118 快速时时彩走势图 斗地主下载赢话费 京东彩票官网首页 乐彩骗我30万 pk10不定位34567打法 天津快乐10分投注 黑龙江时时彩麻将 上海快三开奖结果查询 篮球多少钱 11选五走势图贵州 广东11选5任5遗漏