大数据技术第一章大数据概述
目录
大数据技术第一章:大数据概述
大数据概述
1.1.1三次信息化浪潮
第一次浪潮:
- 时间:1980年前后
- 标志:个人计算机
- 解决问题:信息处理
第二次浪潮:
- 时间:1995年前后
- 标志:互联网
- 解决问题:信息传输
第三次浪潮:
- 时间:2010年前后
- 标志:物联网云计算和大数据
- 解决问题:信息爆炸
1.1.2 信息科技为大数据时代提供技术支撑
需要解决的问题:信息存储,信息传输,信息处理
- 存储设备容量不断增加
- cpu处理能力大幅度提升
- 网络带宽不断增加
正是因为这些科技的进步带来了这三个问题,同时也为解决这三个问题提供了支持
1.1.3数据产生的方式
- 运营式系统阶段
- 用户原创阶段
- 感知式系统阶段
1.2大数据概念
大数据的4V
- 数据量大(Volume)
- 数据种类多(Variety)
- 处理速度快(velocity)
- 数据价值密度地(Value)
1.3大数据的影响
大数据对科学研究影响
实验,理论,计算和数据范式
- 实验科学
- 理论科学
- 计算科学
- 数据密度集型科学
大数据对思维的影响
- 全面的而非抽样的
- 效率的而非精确的
- 相关的而非因果的
1.4大数据的关键技术
- 数据采集与预处理
- 数据存储和管理
- 数据处理与分析
- 数据安全和隐私
大数据计算模式
- 批处理计算
- 解决问题:针对大规模数据额批量处理
- 代表:MapReduce,spark
- 流计算
- 解决问题:针对流数据的实时计算
- 代表:storm 银河流数据处理平台
- 图计算
- 解决问题: 针对大规模图数据的处理
- 代表: pregel
- 查询分析计算
- 解决问题:大规模数据的存储管理查询分析
- 代表:hive