标签 数据分析 下的文章

数据预测分析的四个关键因素

大数据预测分析(Big Data Predictive Analytics)可谓是大数据的圣杯,也是众多数据分析人士的终极梦想。谁不想帮助企业做出英明的业务决策、卖出更多商品和服务、让客户更开心同时避免灾难的发生呢?但是预测分析同时也是一个极端困难的任务,实施成功的预测分析有赖于以下四大关键因素:

一、数据质量。数据是预测分析的血液。数据通常来自内部数据如客户交易数据和生产数据。但我们还需要补充外部数据源,如行业市场数据、社交网络数据和其他统计数据。与流行的技术观点不同,这些外部数据未必一定是“大数据”。数据中的变量是否有助于有效预测才是关键所在。总之,你手里的数据越多,相关度和质量越高,你找出原因和结果的可能性越大。

二、数据科学家。数据科学家必须理解业务需求和业务目标,审视数据,并围绕业务目标建立预测分析规则,例如如何增加电子商务的销售额、保持生产线的正常运转、防止库存短缺等。数据科学家需要拥有数学、统计学等多个领域的知识。看看2008年Netflix大奖(点击查看获奖算法)得主——Formulas Galore(2006年开始,在线电影租赁公司Netflix用百万美元悬赏,奖励能够将其电影推荐算法准确性提高至少10%的人。),那才是真正的科学。幸运的是,大多数预测分析解决方案要求没有这么高。

三、预测分析软件。数据科学家必须借助预测分析软件来评估他们的分析模型和规则,预测分析软件通过整合统计分析和机器学习算法发挥作用。IBM SPSS和SAS是两个数据科学家常用的分析软件。R项目则是一个非常流行的开源工具。如果数据量大到“大数据”的程度,那么你可能还需要一些专门的大数据处理平台如Hadoop或数据库分析机如Oracle Exadata。

四、运营软件。如果你很幸运找到了合适的预测规则,下一步就是将规则植入你的应用。你的预测分析软件应该能以某种方式产生代码,例如预测分析厂商KXEN的产品。更重要的是将预测规则需要的数据事先准备好。预测规则也能通过业务规则管理系统和复杂事件处理平台(CEP)进行优化。

转自:http://www.ctocio.com/bigdata/7129.html

数据分析八法

数据分析八法:

  1. 指标对比:横比与纵比
  2. 分组:物以类聚;
  3. 时间数列及动态:非孤立的时期指标值;
  4. 指数:假定其他因素不变,观察某因素变动对总变动的影响;
  5. 平衡:通过构成解构平衡,发现不平衡;
  6. 综合评价:以数据流为基础;
  7. 景气:数据置入宏观与微观环境;
  8. 预测:Excel中的趋势线

1.指标对比分析法

指标对比分析法,又称比较分析法-是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才有鉴别,单独看一些指标,只能说明总体的某些数量特征,得不出什么结论性的认识。
指标对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较,如不同部门、不同地区、不同国家的比较,也叫横向比较;动态比较是同一总体条件不同时期指标数值的比较,也叫纵向比较。
这两种方法既可单独使用,也可结合使用。进行对比分析时,可以单独使用总量指标货相对指标或平均指标,也可将它们结合起来进行对比。

2.分组分析法

指标对比分析法是总体上的对比,但组成统计总体的各单位具有多种特征,这就使得在同一总体范围内的各单位之间产生了许多差别,统计分析不仅要对总体数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。
分组分析法就是根据统计分析的目的要求,把所研究的总体按照一个或几个标志划分为若干个部分,加以整理,进行观察、分析,以揭示其内在的联系和规律性。统计分组法的关键问题在于正确选择分组标值和划分各组界限。

3.时间数列及动态分析法

时间数列,是将同一指标在时间上变化和发展的一系列数值,按时间先后顺序排列,就形成时间数列,又称动态数列。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。
时间数列速度指标,根据绝对数时间数列可以计算的速度指标:有发展速度、增长速度、平均发展速度、平均增长速度。
动态分析法,在统计分析中,如果只有孤立的一个时间指标值,是很难做出判断的。如果编制了时间数列,就可以进行动态分析,反映其发展水平和速度的变化规律。
进行动态分析,要注意数列中各个指标具有的可比性。总体范围、指标计算方法、计算价格、计量单位,都应该前后一致。时间间隔一般也要一致,但也可以根据研究目的,采取不同的间隔期,如按历史时期分。为了消除时间间隔期不同而产生的指标数值不可比,可采用年平均数和年平均发展速度来编制动态数列。

4. 指数分析法

指数是指反映社会经济现象变动情况的相对数,有广义和狭义之分。根据指数所研究的范围不同可以有个体指数、类指数与总指数之分。
指数的作用:一是可以综合反映复杂的社会经济现象的总体数量变动的方向和程度。二是可以分析某种社会经济现象的总变动受各因素变动影响的程度,这是一种因素分析法。操作方法是:通过指数体系中的数量关系,假定其他因素不变,来观察某一因素的变动对总变动的影响。
用指数进行因素分析,因素分析就是将研究对象分解为各个因素,把研究对象的总体看成是个因素变动的共同结果,通过对各个因素的分析,对研究对象总变动中各项因素的影响程度进行测定。因素分析按其所研究的统计指标不同可分为对总量指标的变动的因素分析,对平均指标变动的因素分析。

5. 平衡分析法

平衡分析是研究社会经济现象数量变化对等关系的一种方法。它把对立统一的双方按其构成要素一一排列起来,给人以整体的概念,以便于全局来观察它们之间的平衡关系。平衡分析的作用:一是从数量对等关系上反映社会经济现象的平衡状况,分析各种比例关系相适应状况;二十揭示不平衡的因素和发展潜力;三是利用平衡关系可以从各项已知指标中推算未知的个别指标。

6. 综合评价分析

社会经济分析现象往往是错综复杂的,社会经济运行状况是多重因素综合作用的结果,而且各个因素的变动方向和变动程度是不同的。如对宏观经济运行的评价,涉及生活、分配、流通、消费各个方面;对企业经济效益的评价,涉及人、财、物合理利用和市场销售状况。如果只用单一指标,就难以得到恰当的评价。
进行综合评价包括四个步骤:
* 确定评价指标体系,这是综合评价的基础和依据,要注意指标体系的全面性和系统性
* 搜集数据,并对不同计量单位的指标数据进行同度量处理。可采用相对化处理、函数化处理、标准化处理等方法。
* 确定各指标的权数,以保证评价的科学性,根据各个指标所处的地位和对总体影响程度不同,需要对不同指标赋予不同的权数
* 对指标进行汇总,计算综合分值,并据此作出综合评价。

7. 景气分析法

经济波动是客观存在的,是任何国家都难以完全避免的。如何避免大的经济波动,保持经济的稳定发展,一直是各国政府和经济专家在宏观调控和决策中面临的重要课题,景气分析正是适应这一要求而产生和发展的。景气分析是一种综合评价分析,可分为宏观景气分析和企业景气调查分析。

8.预测分析法

宏观经济决策和微观经济决策,不仅需要了解经济运行中已经发生了实际情况,而且更需要预见未来将发生的情况。根据已知的过去和现在推测未来,就是预测分析。
统计预测属于定量预测,是以数据分析为主,在预测中结合定性分析。统计预测的方法大致可分为两类:一类是主要根据指标时间数列自身变化与时间的依存关系进行预测,属于时间数列分析;另一类是根据指标之间相互影响的因果关系进行预测,属于回归分析。
预测分析的方法有回归分析法、滑动平均法、指数平滑法、周期(季节)变化分析和随机变化分析等。比较复杂的预测分析需要建立计量经济模型,求解模型中的参数又有许多方法。

摘自:http://weibo.com/betterdata?is_all=1