2017年技术分享会-大数据前沿技术分析与应用

2025-01-18 约 1267 字预计阅读 3 分钟

https://bing.ee123.net/img/rand?artid=54911759

2017年技术分享会 - 大数据前沿技术分析与应用

随着互联网、移动互联网和物联网的发展，我们已经切实地迎来了一个大数据的时代。如何对海量数据进行挖掘和分析，已经成为一个非常重要且紧迫的需求。

从2008年Natural正式定义“大数据”开始，以Hadoop为代表的大数据处理和分析工具，以其可伸缩性、健壮性、计算性能和成本上具有无可替代的优势，事实上已成为当前互联网企业主流数据分析平台。大数据相关技术最近几年出现了井喷的趋势，众多技术纷纷出现，典型的系统包括Hadoop、Spark、Flume、Scribe、Kafka、Storm、Mahout、MLlib、Docker等，涵盖网络数据爬取、日志采集、分布式消息订阅、大数据分析挖掘等方面，涉及离线批处理、实时处理、流式处理等多种处理方式。这些技术来源于国外不同的著名大公司和科研院校（例如Storm源自Twitter，Spark源自UC Berkley），且大都以开源方式公开，用于解决不同的应用需求，涉及面广，技术要求高，交叉知识范围广，知识内容更新频繁，要理清其中的关系，从中发现最适合本机构的技术，成为了目前各机构技术专家的一个难点。

面对如此众多的新技术，为协助各机构研究人员对大数据前沿技术有一个深入了解，解决广大系统设计人员深入研究与开发大数据技术的需要，中科院计算所培训中心特举办“大数据前沿技术分析与应用”技术分享会，帮助各单位技术专家准确定位和发现相关的大数据平台和工具。

技术分享会具体事宜如下：

**【

时间

】**

2017年2月28日下午

**【

地点

】**

中科天博大厦一层

地址：北京海淀中关村958楼

**【

会议议程

】**


2017 年2 月28日（星期二）
12:30-13:25	中科天博大厦一层，签到、领资料
13:25-13:30	主持人致欢迎词
主题演讲	大数据前沿技术分析与应用（杨老师）
13:30-15:00 主要议题：	大数据技术基础批处理大数据平台Hadoop 实时大数据平台Spark 流式大数据平台Storm Python网络爬虫
15:00-15:15	茶歇
主题演讲	大数据前沿技术分析与应用（杨老师）
15:15-16:30 主要议题：	大数据日志采集工具Flume及Scribe介绍分布式消息订阅工具Kafka应用介绍 NoSQL技术及云数据库介绍大数据中的类SQL工具大数据挖掘工具Mahout和MLlib 资源虚拟化工具Docker
16:30-16:45	答疑

**【

分享嘉宾

】**

杨老师 主要研究方向为网络信息分析以及云计算相关技术，长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作，包括网络中信息的采集、处理、优化及知识发现，具有丰富的工程实践及软件研发经验。曾任美国朗讯公司贝尔实验室研究员。

**【

联系方式

】**

地址：北京海淀中关村958楼中科天博大厦（100086）

联系人：赵老师

电话：010-82661199-111

传真：010-82661221

E-mail：zhaoxl@tianbo.com.cn

**【

温馨提示

】**

1、因席位有限，每个机构限报名两人，请确定参会后及时将回执表传真或回邮至我处。

2、分享会前一周，发送报到通知给已报名人员，请大家确认回执表信息的准确性。

目录

2017年技术分享会-大数据前沿技术分析与应用

2017年技术分享会 - 大数据前沿技术分析与应用