北京曼顿培训网

大数据Hadoop开发培训实践培训班

课程分类 其它
授课老师 钱兴会
课程费用 5800元 会员折扣 无折扣
开课时间 2015-04-17 总时长 3.0天
开课地址 浙江 杭州
相关视频 暂无 相关相册 暂无
关注度 81 评论
在线报名
在线客服:点击这里给我发消息
学员对象:需要使用Apache Hadoop来开发功能强大的数据分析应用的程序开发人员;Hadoop项目规划的咨询师;需要快速掌握Hadoop周边组件
课程收益:

1、了解Hadoop的历史及目前发展的现状、以及Hadoop的技术特点,从而把握分布式计算框架及未来发展方向,在大数据时代能为企业的技术选型及架构设计提供决策参考。
2、全面掌握Hadoop的架构原理和使用场景,并通过贯穿课程的项目进行实战锻炼,从而熟练使用Hadoop进行MapReduce程序开发。课程还涵盖了分布式计算领域的常用算法介绍,帮助学员为企业在利用大数据方面体现自身价值。
3、深入理解Hadoop技术架构,对Hadoop运作机制有清晰全面的认识,可以独立规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对Hadoop集群进行管理和优化。

课程内容:

大数据Hadoop开发培训实践培训班(杭州,4月17-19日)
【举办单位】北京曼顿培训网 www.mdpxb.com 中国培训资讯网 www.e71edu.com
【咨询电话】4006820825 010-56129138 13810210257
【培训日期】杭州,2015年4月17-19日;南京,2015年5月16-18日
【培训地点】南京、杭州
【培训对象】需要使用Apache Hadoop来开发功能强大的数据分析应用的程序开发人员;Hadoop项目规划的咨询师;需要快速掌握Hadoop周边组件开发的人员;需要掌握Java、Linux。

【课程背景】
为响应工业和信息化部信息化高端人才培养的号召,曼顿培训中心特推出了Hadoop技术架构课程培训班,希望通过专业的Hadoop技术架构体系与业界真实案例来全面提高大数据工程师、设计人员的工作水平,旨在培养专业Hadoop技术架构专家,更好地服务于大数据开发。

【培训特色】
项目全过程Hadoop沙盘模拟实战。通过一个完整的大数据开发项目及一组实际项目案例,完全覆盖Hadoop开发过程的各个技术体系的实践应用。该项目是一个课堂实践项目,以项目小组的形式进行沙盘实操练习,重点在于强化理解Hadoop项目各个阶段的工作重点,同时明确并强化作为项目管理者的一些基本素质。
强调互动式教学、强化团队讨论,力争每一个学员在课程中都有上台发言的机会,将有超过50% - 70% 的时间用于讨论、练习及游戏(具体比例可视学员的情况进行调整)。但这一做法需要学员的积极参与,尽可能地将实际项目中地各种问题拿出来讨论,这要求学员前期做一定地准备工作。

【培训目标】
1、了解Hadoop的历史及目前发展的现状、以及Hadoop的技术特点,从而把握分布式计算框架及未来发展方向,在大数据时代能为企业的技术选型及架构设计提供决策参考。
2、全面掌握Hadoop的架构原理和使用场景,并通过贯穿课程的项目进行实战锻炼,从而熟练使用Hadoop进行MapReduce程序开发。课程还涵盖了分布式计算领域的常用算法介绍,帮助学员为企业在利用大数据方面体现自身价值。
3、深入理解Hadoop技术架构,对Hadoop运作机制有清晰全面的认识,可以独立规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对Hadoop集群进行管理和优化。

【课程大纲】
第一天
上午
一、Hadoop入门,了解什么是hadoop
1、 Hadoop产生背景
2、 Hadoop在大数据、云计算中的位置和关系
3、 国内外Hadoop应用案例介绍
4、 国内Hadoop的就业情况分析及课程大纲介绍
5、 分布式系统概述
6、 Hadoop生态圈以及各组成部分的简介
7、 Hadoop核心MapReduce例子说明
二、分布式文件系统HDF
S,是数据库管理员的基础课程
1、 分布式文件系统DFS简介
2、 HDFS的系统组成介绍
3、 HDFS的组成部分详解
4、 副本存放策略及路由规则
5、 NameNode Federation
6、 命令行接口
7、 Java接口
8、 客户端与HDFS的数据流讲解
9、 HDFS的可用性(HA)
第一天
下午 三、初级MapReduce,成为Hadoop开发人员的基础课程
1、 如何理解map、reduce计算模型
2、 剖析伪分布式下MapReduce作业的执行过程
3、 Yarn模型
4、 序列化
5、 MapReduce的类型与格式
6、 MapReduce开发环境搭建
7、 MapReduce应用开发
8、 更多示例讲解,熟悉MapReduce算法原理
第二天
上午
四、高级MapReduce,高级Hadoop开发人员的关键课程
1、 使用压缩分隔减少输入规模
2、 利用Combiner减少中间数据
3、 编写Partitioner优化负载均衡
4、 如何自定义排序规则
5、 如何自定义分组规则
6、 MapReduce优化
7、 编程实战
五、Hadoop集群与管理,是数据库管理员的高级课程
1、 Hadoop集群的搭建
2、 Hadoop集群的监控
3、 Hadoop集群的管理
4、集群下运行MapReduce程序
六、ZooKeeper基础知识,构建分布式系统的基础框架
1、ZooKeeper体现结构
2、ZooKeeper集群的安装
3、操作ZooKeeper
第二天
下午
七、HBase基础知识,面向列的实时分布式数据库
1、 HBase定义
2、 HBase与RDBMS的对比
3、 数据模型
4、 系统架构
5、HBase上的MapReduce
6、表的设计
八、HBase集群及其管理
1、集群的搭建过程讲解
2、集群的监控
3、集群的管理

九、HBase客户端 1、 HBase Shell以及演示
2、Java客户端以及代码演示
第三天
上午
十、Pig基础知识,进行hadoop计算的另一种框架
1、 Pig概述
2、 安装Pig
3、 使用Pig完成手机流量统计业务
十一、Hive,使用sql进行计算的hadoop框架
1、 数据仓库基础知识
2、 Hive定义
3、 Hive体系结构简介
4、 Hive集群
5、 客户端简介
6、 HiveQL定义
7、 HiveQL与SQL的比较
8、 数据类型
9、表与表分区概念
10、表的操作与CLI客户端演示
11、数据导入与CLI客户端演示
12、查询数据与CLI客户端演示
13、数据的连接与CLI客户端演示
14、用户自定义函数(UDF)的开发与演示
第三天
下午
十二、Sqoop,hadoop与rdbms进行数据转换的框架
1、配置Sqoop
2、使用Sqoop把数据从mysql导入到HDFS中
3、使用Sqoop把数据从HDFS导出到mysql中

十三、大数据实战
大数据完整项目架构和开发过程练习

【讲师介绍】
钱兴会老师,中国培训资讯网(www.e71edu.com)资深讲师。大数据专家。在电信、电力、金融行业从事Java开发和架构设计的工作;资深云计算研发工程师。作为项目的主要成员和负责人参与并领导完成了多个大型复杂项目,并成功应用于行业解决方案,如海量数据匹配系统、电力行业实时数据采集分析系统等。设计并实现了实时索引系统-云搜,成功应用与某国企知识库系统。并可应用与互联网行业的搜索等应用。完成多个云计算解决方案的架构,涉及到金融行业海量数据分析与数据处理系统、海量日志分析系统、电力用电信息统计系统等,获得业界认可。

钟运琴老师,中国培训资讯网(www.e71edu.com)资深讲师。任职于某研究所,中国科学院计算技术研究所攻读计算机系统结构博士学位。从 2008 年 12 月起,主要从事云计算和大规模数据管理方面的研究,精通云计算平台和大规模数据库管理系统内部实现细节,包括Hadoop、键值存储系统(KVS) 、NoSQL (HBase、Cassandra、Membase/ Memcached)数据库和数据仓库(HIVE)。

【费用及报名】
1、费用:培训费5800元(含培训费、讲义费);如需食宿,会务组可统一安排,费用自理。
2、报名咨询:4006820825 010-56129138 56028090 13810210257 鲍老师
3、报名流程:电话登记-->填写报名表-->发出培训确认函
4、备注:如课程已过期,请访问我们的网站,查询最新课程
5、详细资料请访问北京曼顿培训网:www.mdpxb.com (每月在全国开设四百多门公开课,欢迎报名学习)


 


标签培训基础知识中国培训培训班管理解决方案数据分析

导入评论...

联系方式

名称: 北京曼顿培训网
联系人: 鲍老师
电话: 010-56028090
手机: 13810210257
传真:
QQ: 1017196103
网址:
地址: 海淀人民大学
等级:
状态: 未认证会员

动态新闻