大数据的概述
目录
大数据的概述
1.1 大数据的概念
海量数据,具有高增长率,数据类型多样化,一定时间内无法使用常规软件工具进行捕捉,管理和处理的数据集合。
1.2 大数据的特征(4V说法,普遍认可的)
1,volume:巨大的数据量
2,variety:数据类型多样化
- 结构化的数据:即具有固定格式和有限长度的数据
- 半结构化的数据:是一些XML或者HTML格式的数据
- 非结构化的数据:现在非结构化的数据越来越多,就是不定长,无固定格式的数据,例如:网页,语音,视频等
3,velocity:数据增长速度快
4,value:价值密度低,商业价值高
1.3 大数据的应用场景
大数据本身是一个抽象的概念,对当前无论是企业还是政府或高校等单位来说,是一个面临着数据无法存储,无法计算的状态的形容词。
大数据可以做什么,在海量的各种各样类型的价值密度低的数据中,我们要进行的是:数据采集,数据存储,数据清洗,数据分析,数据可视化。
简单一句话,就是大数据让数据产生各种“价值”,大数据的核心作用就是“数据价值化”,这个过程就是大数据要做的主要事情,那么就可以概括成:
- 记录已经发生的一切
- 描述正在发生的一切
- 预测将要发生的一切
案例:预测犯罪。预测流感的爆发。预测选举。根据手机定位和交通数据,来规划城市。根据库存和需求,来实施调价。推动医疗信息化发展,远程医疗。
1.4 大数据的发展前景
1,大数据本身的价值体现:
本身的数据价值化就会开辟出很大的市场空间。目前在互联网领域,大数据技术已经得到较为广泛的应用。
2,大数据推动了科技领域的发展:
不仅体现在互联网领域,还体现在金融,教育,医疗等诸多领域,尤其是现在的人工智能。
3,大数据产业链的形成:
完整的产业链,包括数据采集,整理,传输,存储,分析,呈现和应用。
4,国家大力扶持大数据行业的发展: