大数据的定义与特点
目录
大数据的定义与特点
什么是大数据:
定义1 (Kusnetzky, Dan. What is “Big Data”)
所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成人类所能解读的信息。
定义2 (维克托·迈尔舍恩伯格、肯尼斯·库克耶. “大数据时代”)
不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。
定义3 (“大数据”(Big Data)研究机构Gartner)
“大数据"是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率的信息资产。
大数据特点:
- 多样性,复杂性(Variety):
- 大数据种类繁多,在编码方式、数据格式和应用特征等各个方面都存在差异,因此也常常说大数据有一个重要特点,叫做多源异构(来自多个信息源,构造方式多种多样)
- 速度(Velocity):
- 速度快,数据持续到达,只在特定的时间和空间内数据才有意义
- 须考虑能不能在扫描数据一次以内,甚至在log n复杂性以内解决问题
- 数据量(Volume):
“大”
由于数据量大 必须考虑并行处理、
必须考虑能不能想办法缩减其数据量、必须考虑能不能设计有效的存储结构存储这些数据
- 基于高度分析的新价值(Value):
大数据的应用:
- 预测
- 推荐
- 商业情报分析
- 科学研究