目录

数据科学与大数据技术

数据科学与大数据技术

大数据科学家学习路线

https://i-blog.csdnimg.cn/blog_migrate/b1eb962b7e1e07a406ba57708d9d8f0a.jpeg

数据科学与大数据技术我个人理解,就是两个方向

一、分析:大数据分析师走向大数据科学家

二、开发:大数据开发工程师走向大数据专家

大数据岗位方向

https://i-blog.csdnimg.cn/blog_migrate/a3474922a367c7715455c540a0dac558.png

Hadoop大数据技原理与应用:

  • VMware Workstation |虚拟机
  • Centos6.7-install.iso |镜像
  • Java |Java环境
  • Eclipse/intellij IDEA |IDE Java环境
  • Maven |项目管理工具
  • SecureCRT |连接虚拟机
  • Hadoopx.x.x-install.gz、zookeeper.gz 、jdk |hadoop软件、zookeeper软件、Java软件

R 语言、大数据统计

  • R语言 |编程语言
  • Rstudio |R IDE

云计算虚拟化技术与应用

  • VMware Workstaion
  • VMware ESXi 6.7

Python数据分析

  • Python |编程语言
  • PyCharm |python IDE
  • 一些库 |pandas、numpy等
  • MySQL、Oracle、PostgreSQL |等关系型数据库
  • Navaicat、DataGrip |等数据库管理工具

数据仓库与数据挖掘

  • SPSS-Modeler v18软件
  • Excel

深度学习

  • Anaconda |环境管理器
  • Python
  • PyCharm
  • Jupyter notebooks |交互计算的应用程序
  • Tensorflow |深度学习框架
  • Keras |深度学习狂降
  • PyTorch |深度学习框架

本质上还是对数据进行处理产生结果。

一些大数据生态圈组件如Hadoop、Spark、Flink、Hive、Kafka等,归根结底是为了让 数据 发挥出它应有的价值。将无序变为有序,将潜藏进行探索;反复提炼有价值的数据,最后将数据归纳总结。才能开花结果!