本地搜

干货!大数据分析的九种思维

2019年07月08日 14:34 发布人: zcmf 1596

  在数据分析方面,人们经常提到数学技能、统计知识或编程技能,每种技能都很难学习,因此往往令人气馁。事实上,一些数据分析方法对数学能力没有那么高的要求,更重要的是,它们有数据分析的思想。接下来,给您分享一下。


  1.分类分类分析的目标是将一组人(或对象)划分为若干类别,或预测他们属于每个类别的概率。举个例子吧:“京东的哪位用户会在618订购?”这是一个典型的两类问题:买还是不买。分类分析(基于历史信息)产生模型,该模型预测新人(或事物)将属于哪个类别,或属于类别的概率。


  2.回归回归任务的目标是根据某个属性变量给每个人(或对象)一个数字(以衡量他的好坏)。继续举个例子:每个用户在618订购京东多少钱?注意,回归和分类之间的区别在于分类输出的结果是几个固定选项之一,并且回归的结果是连续数,并且可能的值是无限的。


  3.聚类聚类任务的目标是给一组人(或对象),并在不指定目标的情况下查看哪些人(或事物)更近。例子:是否可以为一组用户分成几种类型的购买记录?注意聚类与上述分类和回归之间的本质区别:分类和回归将有一个给定的目标(无论是否下订单,贷款违约,房价等),并且聚类没有给定的目标。


  4.相似匹配类似匹配任务的目标是基于已知数据确定哪些人(或事物)与特定(一批)人(或事物)更相似。例子:了解一群去年在双十一中投入超过1万元的用户,哪些用户与他们相似?


  5.频繁集发现频繁发现剧集的目的是找到经常共同发生的人(或事物)。这是着名的“啤酒和尿布”的一个例子。


  6.统计(属性、行为、状态)描述统计描述任务的目标是最好的理解:人们在什么状态下做什么状态(或事物)。例子:5月份7天内京东各用户的无条件退货数量统计描述通常是用户欺诈检测。想象一下,用户每月返回100次以上。会是什么情况?


  7.联系预测联系预测的目标是预测应该存在关系的人(或事物)。栗子:你可能知道xxx?你可能想看xxx?


  8.数据压缩数据压缩的目的是减小数据集的大小并增加信息密度。栗子:京东想要分析用户对进口巧克力的偏好,筛选掉所有国内的产品。大数据虽然数据越多越好,数据带来更多信息,但噪音也会增加。


  9.因果分析顾名思义,因果分析的目标是找出事物之间的关系。比如:广告的效果是否有所改善,因为广告内容是好还是传递给更准确的用户?数据分析非常强大,但当然有必要使用科学的分析方法在特定情况下产生有价值的结果。


  干货!大数据分析的九种思维.中琛魔方大数据(www.zcmorefun.com)表示:数据分析非常强大,但当然,在特定情况下,严格的选择假设,使用科学的分析方法来产生有价值的结果。数据说谎的经典例子是安慰剂效应。