本地搜

数据挖掘有哪些误区

2020年12月09日 13:44 发布人: zcmf 1290

  数据挖掘是一种非常有力的分析工具,它可以帮助企业主管们通过了解顾客的历史行为的信息来预测他们将来的行为。它找到了解开顾客行为秘密的模式。这些发现可被用于创造利润,缩减成本,以及抓住商业机会,获得新的竞争优势。那么对于数据挖掘大家会产生怎样的误解呢?


  误区1:数据挖掘提供了即时的未来预测


  数据挖掘既不是水晶球也不是一按按钮就能魔术般出现答案的技术。它是一个多步骤的处理过程,其中包括:定义业务问题,扫描并按条件搜索数据,开发模型,运用获得的知识。典型情况是,企业花费大量时间预处理并且按照条件搜索数据,保证其干净、一致、良好整合,以便于应用他们所需要的商务智能。数据挖掘全部围绕着数据,成功的数据挖掘需要能够准确反映业务的数据。


  企业必须懂得,数据挖掘的威力在于:抓住那些能够从本质上被预测或者被描述的特殊的业务难题。其中包括:


  顾客分类


  预测顾客的购买倾向


  监测欺诈


  优化供应和发货渠道


  误区2:数据挖掘对于商务应用程序仍然是不可用的


  数据挖掘是一种可用的技术,并且由于他的商业效果受到了很高的评价。这个谎言似乎是那些需要解释为什么他们不能使用这个处理过程,并且在下面这两句话中转来转去的人所编造的。第一句是:“大的数据库不能被有效地挖掘”。第二句是:“数据挖掘不能在数据仓库引擎中完成”。这两句话都曾经是正确的;就像飞机曾经无法离开地面一样。


  让我们同时分析这两句话。因为今天的数据库是这样的大,企业都担心数据挖掘项目所需的额外的IT体系结构会带来巨大的成本,以及每个项目的数据处理过程都会消耗太长时间。但是今天的某些数据库使用的并行技术使得数据库内部的挖掘成为可能。通过在数据库内部进行挖掘,企业可以消除数据移动,利用并行处理的性能,最小化数据冗余,以及消除数据挖掘专用的整个新的冗余的数据库的创建及维护成本。


  误区3:数据挖掘需要单独的、专用的数据库


  数据挖掘产品供应商会强调你需要一个昂贵的、专用的数据库、数据中心或者分析服务器来进行数据挖掘,因为需要将数据转换为一种特别的格式来进行有效地处理。这些数据中心不仅采购和维护成本很高,每个单独的数据挖掘项目还需要单独抽取数据,而数据的抽取是很昂贵并且非常费时的。


  数据库技术的发展使得现在数据挖掘再也不需要在一个单独的数据中心进行了。实际上,有效的数据挖掘需要一个企业范围的数据仓库,它的全部投资成本也比使用独立的多个数据中心便宜得多了。


  误区4:只有拥有博士学位才可以进行数据挖掘


  一些人认为数据挖掘非常复杂,以致必须拥有至少三个博士才可以执行它:一个是统计学或者计量方法专业博士,一个是能够懂得客户的商务博士,一个是计算机专业博士。


  实际情况是在成功项目的实施者中根本用不到一个博士。例如,Teradata最近完成了一个南美电信公司的项目,它成功地追踪了顾客行为变化,帮助公司在电信市场开放期间保住了98%的高价值客户。通过协力工作,一个多学科的小组成功地完成了任务。


  数据挖掘是一项需要三个专业领域的技术专家共同合作的工作。商务人员必须通过创建一组商业问题来引导项目,解释凸现的模式。具有对数据挖掘技术、统计学和工具的充分了解的分析建模人员构建可靠的模型。IT人员提供对处理过程的深刻观察,理解数据,并提供关键的技术支持。


  误区5:数据挖掘是给那些拥有大量客户数据的大公司提供的


  一个简单的事实就是,一个公司,无论大小,只要拥有能够精确反映业务或者客户情况的数据,都能在这些数据基础上构建模型,对应重要的业务挑战。公司处理的顾客数据量从来就不是关键。


  数据挖掘有哪些误区.中琛魔方大数据平台(www.zcmorefun.com)表示数据挖掘所产生的误解的部分原因是人们并不十分了解它究竟是什么。从最本质上讲,数据挖掘就是一套用于发现和解释详细数据的未知模式的复杂的数学技术。