大数据分析是指对规模巨大的
数据
进行分析。大数据可以概括为5个V, 数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)
[1]
。
- 中文名
- 大数据分析
- 外文名
- Big data analysis
- 含 义
- 是指对规模巨大的数据进行分析
- 大数据概括
- 数据量大、速度快(高性能)
- 分析步骤
- 可视化分析
前端展现
用于展现分析商用分析工具有
Style Intelligence
、
RapidMiner Radoop
、
Cognos
, BO, Microsoft
Power BI
,
Oracle
,Microstrategy,
QlikView
、
Tableau
。
数据仓库
大数据分析的六个基本方面
4. Semantic Engines(语义引擎)
假如大数据真的是下一个重要的技术革新的话,我们最好把精力关注在大数据能给我们带来的好处,而不仅仅是挑战。
[2]
数据仓库是为了便于多维分析和多角度展示数据按特定模式进行存储所建立起来的
关系型数据库
。在商业
智能系统
的设计中,数据仓库的构建是关键,是商业智能系统的基础,承担对
业务系统
数据整合
的任务,为商业智能系统提供
数据抽取
、转换和加载(
ETL
),并按主题对数据进行查询和访问,为联机数据分析和数据挖掘提供数据平台。
[3]
开源大数据
2. Hypertable是另类。它存在于Hadoop生态圈之外,但也曾经有一些用户。
一体机数据仓库
IBM PureData(Netezza), OracleExadata, SAP Hana等等。
与往届
世界杯
不同的是:数据分析
[4]
成为巴西世界杯赛事外的精彩看点。伴随赛场上球员的奋力角逐,大数据也在全力演绎世界杯背后的分析故事。一向以严谨著称的
德国队
引入专门处理大数据的足球解决方案,进行比赛数据分析,优化球队配置,并通过分析对手数据找到比赛的“制敌”方式;
谷歌
、
微软
、Opta等通过大数据分析预测赛果...... 大数据,不仅成为赛场上的“第12人”,也在某种程度上充当了世界杯的"
预言帝
"。
1.
积极主动
&预测需求: 企业机构面临着越来越大的竞争压力,它们不仅需要获取客户,还要了解客户的需求,以便提升
客户体验
,并发展长久的关系。客户通过分享数据,降低数据使用的隐私级别,期望企业能够了解他们,形成相应的互动,并在所有的接触点提供无缝体验。
为此,企业需要识别客户的多个
标识符
(例如手机、
电子邮件
和地址),并将其整合为一个单独的客户ID。由于客户越来越多地使用多个渠道与企业互动,为此需要整合传统数据源和数字数据源来理解客户的行为。此外,企业也需要提供情境相关的实时体验,这也是客户的期望。
2. 缓冲风险&减少欺诈: 安全和欺诈分析旨在保护所有物理、财务和
知识资产
免受内部和
外部威胁
的滥用。高效的数据和
分析能力
将确保最佳的欺诈预防水平,提升整个企业机构的安全:威慑需要建立有效的机制,以便企业快速检测并预测欺诈活动,同时识别和跟踪肇事者。
将统计、网络、路径和大数据方法论用于带来警报的预测性欺诈倾向模型,将确保在被实时威胁检测流程触发后能够及时做出响应,并自动发出警报和做出相应的处理。数据管理以及高效和透明的欺诈事件报告机制将有助于改进欺诈风险
管理流程
。
此外,对整个企业的数据进行集成和关联可以提供统一的跨不同
业务线
、产品和交易的欺诈视图。多类型分析和数据基础可以提供更准确的欺诈趋势
分析和预测
,并预测未来的潜在操作方式,确定欺诈审计和调查中的漏洞。
4. 个性化&服务: 公司在处理
结构化数据
方面仍然有些吃力,并需要快速应对通过
数字技术
进行客户交互所带来的不稳定性。要做出实时回应,并让客户感觉受到重视,只能通过先进的分析技术实现。大数据带来了基于客户个性进行互动的机会。这是通过理解客户的态度,并考虑实时位置等因素,从而在多渠道的
服务环境
中带来个性化关注实现的。
5. 优化&改善客户体验
运营管理
不善可能会导致无数重大的问题,这包括面临损害客户体验,最终降低
品牌忠诚度
的
重大风险
。通过在流程设计和控制,以及在商品或服务生产中的业务运营优化中应用分析技术,可以提升满足
客户期望
的
有效性
和效率,并实现运营。
通过部署先进的分析技术,可以提高现场运营活动的生产力和效率,并能够根据业务和
客户需求
优化组织人力安排。数据和分析的最佳化使用可以带来
端对端
的视图,并能够对关键运营指标进行衡量,从而确保持续不断的改进。
例如,对于许多企业来说,库存是当前资产类别中最大的一个项目——库存过多或不足都会直接影响公司的
直接成本
和
盈利能力
。通过数据和分析,能够以最低的成本确保不间断的生产、销售和/或客户
服务水平
,从而改善
库存管理
水平。数据和分析能够提供目前和计划中的
库存情况
的信息,以及有关库存高度、组成和位置的信息,并能够帮助确定存库战略,并做出相应决策。客户期待获得相关的无缝体验,并让企业得知他们的活动。
[5]
异步处理
的大数据分析中遵守了捕获、存储加分析的流程,过程
中数据
由
传感器
、网页服务器、
销售终端
、
移动设备
等获取,之后再存储到相应设备上,之后再进行分析。由于这些类型的分析都是通过传统的
关系型数据库管理系统
(
RDBMS
)进行的,数据形式都需要转换或者转型成为RDBMS能够使用的
结构类型
,例如行或者列的形式,并且需要和其它的数据相连续。