目录

大数据概述hdu第一章笔记

大数据概述(hdu)第一章笔记

1.2 大数据的定义和主要特征

大数据不仅仅是数据的“ 规模性 ”,而是包含“ 高速性 ”、“ 多样性 ”和 “ 价值性 ”等多重属性。

https://i-blog.csdnimg.cn/blog_migrate/f8393976dc6a734f427a233628b869c2.png

规模性:

大数据摩尔定律:根据IDC作出的估测,人类社会产生的数据量一直都在以每年50%的速度增长,即每两年产生的数据量就会增加一倍。

小tip:1 PB = 1024 TB,1 EB = 1024 PB,1 ZB = 1024 EB(ZB > EB >PB)

多样性:

https://i-blog.csdnimg.cn/blog_migrate/385a4eadc2a18a10726376d3fa6348b8.png

高速性:

1秒定律 :1秒定律是互联网进入大数据时代对数据处理速度的要求,即秒级的时间内给出响应结果。这是大数据技术区别于传统数据技术的重要一点。

实时分析 而非批量式分析

价值性:

价值密度低,商业价值高

挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息

1.3 大数据与云计算、人工智能和物联网

https://i-blog.csdnimg.cn/blog_migrate/e408264766af6e9067108ef9534853e5.png

1.4 大数据发展现状和趋势

大数据的生命周期:

https://i-blog.csdnimg.cn/blog_migrate/689eb63457ef6157bdddd470e299a544.png

大数据主要技术:

https://i-blog.csdnimg.cn/blog_migrate/2a3e47a9443b789cbc9e303e0481e321.png

Hadoop :

Apache Hadoop是一个用java语言实现的软件框架,为用户提供了系统底层细节透明的分布式基础架构,其核心是 分布式文件系统HDFS 和 MapReduce(分布式处理) 。

Hadoop生态:

https://i-blog.csdnimg.cn/blog_migrate/9a6a3d5d9874b968cc7c36f91a7e844c.png

大数据发展应用和前景: