大数据概述hdu第一章笔记
目录
大数据概述(hdu)第一章笔记
1.2 大数据的定义和主要特征
大数据不仅仅是数据的“ 规模性 ”,而是包含“ 高速性 ”、“ 多样性 ”和 “ 价值性 ”等多重属性。
规模性:
大数据摩尔定律:根据IDC作出的估测,人类社会产生的数据量一直都在以每年50%的速度增长,即每两年产生的数据量就会增加一倍。
小tip:1 PB = 1024 TB,1 EB = 1024 PB,1 ZB = 1024 EB(ZB > EB >PB)
多样性:
高速性:
1秒定律 :1秒定律是互联网进入大数据时代对数据处理速度的要求,即秒级的时间内给出响应结果。这是大数据技术区别于传统数据技术的重要一点。
实时分析 而非批量式分析
价值性:
价值密度低,商业价值高
挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息
1.3 大数据与云计算、人工智能和物联网
1.4 大数据发展现状和趋势
大数据的生命周期:
大数据主要技术:
Hadoop :
Apache Hadoop是一个用java语言实现的软件框架,为用户提供了系统底层细节透明的分布式基础架构,其核心是 分布式文件系统HDFS 和 MapReduce(分布式处理) 。
Hadoop生态:
大数据发展应用和前景:
略