咨询热线:0931-8277276
当前位置

大数据及常见的大数据分析模型应用

现如今会上如果不说两句大数据、云计算、区块链、边缘计算等名词,就感觉被时代抛弃一样。那今天我们主要为大家讲解下什么是大数据;在做大数据可视化时,有哪些常见得到数据分析模型。
http://mmbiz.qpic.cn/mmbiz_jpg/6qt4vSmjicMKkgoWqQVGq0gVibPr2wZ53MYkLXHvFB92If7icDvgZKz670PSibEqicekiaM476CoIaD1jA5jX6NzZ6KA/0


那么什么是大数据呢?


大数据(Big Data)概念是1998年由SGI首席科学家John Masey在USENIX大会上提出的。他当时发表了一篇名为Big Data and the Next Wave of Infrastress的论文,使用了大数据来描述数据爆炸的现象。但大数据真正得到业界关注,则是其后多年的事情了。其中大数据最重要的发酵素则是2003-2006年Google发布的GFS、MapReduce和BigTable三篇论文。


大数据是指海量数据或巨量数据,其规模巨大到无法通过目前主流的计算机系统在合理时间内获取、存储、管理、处理并提炼以帮助使用者决策。


大数据有哪些特征呢?


大数据的5V特征,即Variety (多样化)、Volume (大量化)、Velocity(快速化)、Value  (价值密度低)、Veracity(真实性)其中,Variety表示来源多和格式多,数据可以来源于搜索引擎、社交网络、通话记录、传感器等等,这些数据要么以结构化形式存储,要么以非结构化数据存储;Volume表示数据量比较大,从TB级别,跃升到PB级别。尤其是在移动互联时代,视频、语言等非结构化数据快速增长;Velocity表示数据存在时效性,需要快速处理,并得到结果出来,这一点也是和传统的数据挖掘技术有着本质的区别;Value表示大量不相关信息,不经过处理则价值较低,属于价值密度低的数据。Veracity(真实性)数据质量因数据来源以及记录方式等影响因素的不同,会出现较大的差异,而这种差异性会极大程度地影响数据分析的精确性


大数据处理流程是怎么样的呢?
一般的大数据处理流程都有以下几个过程:数据采集、数据存储、数据处理、数据展现。如下图所示。
http://mmbiz.qpic.cn/mmbiz_jpg/6qt4vSmjicMKkgoWqQVGq0gVibPr2wZ53M82C9pa5ItBT6ocJU0cCBaqoaSKNicPMXdFaMicjCVSsBic5WRyNNx7Eag/0
简而言之,大数据就是数据量非常大、数据种类繁多、无法用常规归类方法应用计算的数据集成。



有了这么多的大数据,我们如何使用呢?

通过不同渠道采集来的数据,经过对数据清洗后,那接下来就是应用大数据的时候了。根据我们的需求目标定义不同的数据模型,通过数据模型对数据进行筛选,获得我们需要的数据。那么在我们日常工作中有哪些常用的大数据模型呢?今天我们主要分析几个常用的模型做简单的介绍。供大家参考。 


1、行为事件分析


行为事件分析法:顾名思义主要通过事件的行为来分析,获得有效的数据。目前主要是用来来研究某行为事件的发生对企业组织价值的影响以及影响程度。那么我们的企业可以借此来追踪或记录的用户行为或业务过程。比如用户注册、浏览产品详情页、购买、提现等,通过研究与事件发生关联的所有因素来挖掘用户行为事件背后的原因、交互影响等。


在日常工作中,运营、市场、产品、数据分析师根据实际工作情况而关注不同的事件指标。如最近三个月来自哪个渠道的用户注册量最高?变化趋势如何?各时段的人均充值金额是分别多少?上周来自北京发生过购买行为的独立用户数,按照年龄段的分布情况?每天的独立 Session 数是多少?诸如此类的指标查看的过程中,行为事件分析起到重要作用。


行为事件分析法具有强大的筛选、分组和聚合能力,逻辑清晰且使用简单,已被广泛应用。行为事件分析法一般经过事件定义与选择、下钻分析、解释与结论等环节。尤其是电商公司通过前期的用户行为数据的采集,在促销活动中就可以有目的的区域性,定制性用户广告投放。通过精准的用户行为数据分析,可获得更高精准用户的转化率。


2、漏斗分析模型


漏斗分析是一套流程分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。其实企业经营中经常使用到,最简单的应该是我们销售部门的销售项目漏斗。销售管理者通过项目漏斗来分析接下来重点项目跟进和赢单概率。销售漏斗也是一种数据分析模型。


漏斗分析模型在电商平台也是广泛应用。主要在流量监控、产品目标转化等日常数据管理工作中。例如在一款产品服务平台中,直播用户从激活APP开始到花费,一般的用户购物路径为激活APP、注册账号、进入直播间、互动行为、礼物花费五大阶段,漏斗能够展现出各个阶段的转化率,通过漏斗各环节相关数据的比较,能够直观地发现和说明问题所在,从而找到优化方向。对于业务流程相对规范、周期较长、环节较多的流程分析,能够直观地发现和说明问题所在。


3、留存分析模型


留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。简要的说就是您举办一场活动,邀请了1000人参会,在参会过程中陆续有人对这个活动不感兴趣了,就中途退出了活动现场,还有部分用户坚持下来了,那么坚持下来的用户一定是您的目标客户吗?那么也未必对吧。我们就需要一个工具来识别留存下来的用户哪些才是真正的用户。这就是用来衡量产品对用户价值高低的重要方法。留存分析可以帮助回答以下问题:


一个新客户在未来的一段时间内是否成为您期许目标用户的行为?如发生购买行为,参与活动等;某个平台改进了用户在线体验,邀请有兴趣的用户参与,看是否有成功转化?


 4、分布分析模型


分布分析是用户在特定指标下的频次、总额等的归类展现。它可以展现出单用户对产品的依赖程度,分析客户在不同地区、不同时段所购买的不同类型的产品数量、购买频次等,帮助运营人员了解当前的客户状态,以及客户的运转情况。如订单金额(100 以下区间、100 元 - 200元区间、200 元以上区间等)、购买次数(5 次以下、5 - 10次、10 以上)等用户的分布情况。 


分布分析模型的功能与价值:科学的分布分析模型支持按时间、次数、事件指标进行用户条件筛选及数据统计。为不同角色的人员统计用户在一天/周/月中,有多少个自然时间段(小时/天)进行了某项操作、进行某项操作的次数、进行事件指标。


5、点击分析模型


即应用一种特殊高亮的颜色形式,显示页面或页面组(结构相同的页面,如商品详情页、官网博客等)区域中不同元素点击密度的图示。包括元素被点击的次数、占比、发生点击的用户列表、按钮的当前与历史内容等因素。


点击图是点击分析方法的效果呈现。点击分析具有分析过程高效、灵活、易用,效果直观的特点。点击分析采用可视化的设计思想与架构,简洁直观的操作方式,直观呈现访客热衷的区域,帮助运营人员或管理者评估网页的设计的科学性。


6、用户行为路径分析模型


用户路径分析,顾名思义,用户在APP或网站中的访问行为路径。为了衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,时常要对访问路径的转换数据进行分析。


以电商为例,买家从登录网站/APP到支付成功要经过首页浏览、搜索商品、加入购物车、提交订单、支付订单等过程。而在用户真实的选购过程是一个交缠反复的过程,例如提交订单后,用户可能会返回首页继续搜索商品,也可能去取消订单,每一个路径背后都有不同的动机。与其他分析模型配合进行深入分析后,能为找到快速用户动机,从而引领用户走向最优路径或者期望中的路径。


7、用户分群分析模型


用户分群即用户信息标签化,通过用户的历史行为路径、行为特征、偏好等属性,将具有相同属性的用户划分为一个群体,并进行后续分析。我们通过漏斗分析可以看到,用户在不同阶段所表现出的行为是不同的,譬如新用户的关注点在哪里?已购用户什么情况下会再次付费?因为群体特征不同,行为会有很大差别,因此可以根据历史数据将用户进行划分,进而再次观察该群体的具体行为。这就是用户分群的原理。


 8、属性分析模型


顾名思义,根据用户自身属性对用户进行分类与统计分析,比如查看用户数量在注册时间上的变化趋势、查看用户按省份的分布情况。用户属性会涉及到用户信息,如姓名、年龄、家庭、婚姻状况、性别、最高教育程度等自然信息;也有产品相关属性,如用户常驻省市、用户等级、用户首次访问渠道来源等。


属性分析模型的价值是什么?一座房子的面积无法全面衡量其价值大小,而房子的位置、风格、是否学区、交通环境更是相关的属性。同样,用户各维度属性都是进行全面衡量用户画像的不可或缺的内容。


属性分析主要价值在:丰富用户画像维度,让用户行为洞察粒度更细致。科学的属性分析方法,可以对于所有类型的属性都可以将“去重数”作为分析指标,对于数值类型的属性可以将“总和”“均值”“最大值”“最小值”作为分析指标;可以添加多个维度,没有维度时无法展示图形,数字类型的维度可以自定义区间,方便进行更加精细化的分析。

联系咨询