重庆快乐十分走势图时时彩
知识改变命运 学习成就未来!

北京博雅环球教育科技集团|大学生就业创业培训|云计算|大数据|人工智能|java|Python人工智能|H5全栈|安卓开发|青少年人工智能编程|学历提升

010-53652048


大数据课程大纲(26周)


基础阶段一 计算机基础 1、认知行业,岗位,介绍Hadoop大数据课程体系,就业趋势以及行业未来展望
2、中英文输入
3、Word文档编辑
4、Excel电子表格处理
5、PowerPoint幻灯片制作
6、走进计算机技术世界
7、操作系统基础知识
8、算法与数据结构
9、网络和Internet
10、软件开发过程
 
基础阶段二 Java初中高 1、初识JAVA
2、变量、数据类型和运算符
3、选择结构
4、循环结构                         
5、循环结构进阶                      
6、一维和二维数组
7、类和对象
8、类的无参和带参方法
9、字符串的操作
10、JAVA的特性之继承、封装、多态
11、JAVA异常处理
12、内部类、包装类、常用类
13、JAVA垃圾回?#26632;?#21046;与枚举类型
14、String正则表达式
15、StringBuffer与StringBuilder类的常用方法
16、集合、泛型
17、java文件I/O流
18、类加载和反射
19、多线程
20、网络编程
21、数据库简介、安装及基本概念
22、数据库表操作、约束
23、DNL语句与事务处理
24、SQL查询
25、JDBC编程
 
基础阶段三 Web前后端 1、HTML语言与基础标签
2、表格基础、表单和框架
3、CSS样式、网站设计和页面布局技术
4、JavaScript语法
5、DOM编程-Window对象
6、Jquery和Ajax
7、Servlet和JSP
2周
大数据 大数据基础阶段 1、大数据课程介绍、VMware虚拟机安装和使用
2、Linux安装、Linux系统命令
3、Hadoop介绍,Google三大论文
4、HDFS工作流程、YARN工作流程、MapReduce工作流程
5、Hadoop伪分布式安装,Hadoop的目录介绍,运行wordeount程序
6、Hadoop的集群安装,SSH通讯协议
7、FileSystem.Shell集群命令
8、Hadoop集群静态和动态增删集群节点,历史服务器,集群灾难?#25351;?/td>
9、Java调用Hadoop API 开发HDFS(使用lib开发)
10、Java调用Hadoop API 开发HDFS(使用Maven开发)
11、项目:云网盘需求分析,用户登录注册模块,Hdfs文件存储模块(上传、下载、显示、?#22659;?#31561;)
12、RPC原理,NIO原理,阶段复习和讲解Hadoop源码
 
大数据续 大数据离线阶段一 1、Mapreduce原理知识
2、Shuffie原理知识
3、Mapreduce练习
4、项目:手机流量计费系统
5、Zookeeper理论,Zookeeper集群,安装
6、Zookeeper.shell集群命令
7、基于Zookeeper中Na的HA和YARN的HA(灾难?#25351;矗?br /> 8、Hive理论、Hive安装、基本数据类型、复杂数据类型
9、HQL查询语句
10、?#26234;?#20998;桶、索引、复杂类
11、内置函数
12、UDF自定义函数,Hive优化
13、Hbaon理论、Hbaon表的设计和内存结构,存储格式
14、Hbaon集群安装
15、Hbaon的shell集群管理命令
16、Java操作Hbaon.shell数据操作
17、Flomn收集数据
18、Sqoop对mysql、hdfa、hive、HBase之间的数据导入和导出
19、Qoize和Azbaban任务管理
 
大数据离线阶段二 1、项目:运动微博shell+hive+MR+Hbaon
2、项目:电商用户数据分析shell+hive+MR+Hbaon+S+Myaql
   
大数据在线阶段一 1、Scala环境安装设置
2、Scala基础语法
3、Scala数据类型
4、Scala变量
5、Scala访问修饰符
6、Scala运算
7、Scala   IF……ELSE语句
8、Scala循环类型
9、Scala while循环
10、Scala函数
11、Scala闭包
12、Scala字符串
13、Scala数组
14、Scala集合
15、Scala类与对象
16、Scala模式匹配
17、Scala正则表达式
18、Scala异常处理
19、Scala提取器
20、Scala文件I/O
 
大数据在线阶段二 1、Spark基本理论和计算方法
2、Spark五大功能组件
3、Spark特点和应用场景
4、Spark与MapReduce的比较和集群安装
5、交互模式
6、使用Spark处理Hadoop Datasets分布式数据集
7、设置共享变量
8、了解Mesos
9、Spark工作原理
10、Spark运行机制和作业调度
11、Spark编程模型?#22270;?#26500;设计
12、Spark的Local、YARN、Mesos、Deploy模式架构
13、Spark创建RDD方式
14、Spark RDD中的Runtime流程
15、Spark中Tranaformation信息
16、Spark中Job的Stage划分
17、Spark常见问题
18、Spark内核揭秘
19、Spark程序优化1
20、Spark程序优化2
21、MLlib基本数据类型
22、MLlib数理统计基本概念
23、协同过滤
24、相似度度量
25、MLlib中的交替量小二乘法(ALS算法)
26、随机梯?#35748;?#38477;算法
27、MLlib回归的过拟合
28、MLlib线性回归实战
29、决策树
30、保序回归
31、聚类与分类
32、MLlib中的Kmeans算法
33、Apriori频繁项集算法
34、FP-growth算法
35、奇异值分解(SVD)
36、主成分分析(PCA)
37、TF-IDF
38、词向量化工具
39、基于卡方检验的特征选择
 
大数据在线阶段三 1、项目:Sp电商指标分析?#25945;?br /> 2、总复习、简历指导、面试辅导等    

就业案例

右侧通用报名广告[2017-08-17 21:41:11]

本周精华

重庆快乐十分走势图时时彩 江苏时时彩开奖号码走势图 世界主要的股票指数 吉林十一选五前三直走势图 3d真人游戏下载 456千炮捕鱼 天津双色球天津快乐十分前三组遗漏 急速赛车手中文版 棋牌平台开发 加拿大快乐8开奖视频 喜欢赢话费斗地主