欢迎访问深圳敏捷云计算科技有限公司!

培训业务

[专项课程]Big Data
  • 描述
  • 大纲
  •  

     

    Big Data 课程将向您介绍基于云的大数据解决方案,例如 (EMR)、Redshift、Kinesis 以及其余的云厂商大数据平台。在本课程中,我们将向您介绍如 何使用 EMR 来利用诸如 Hive 和 Hue 等广泛 Hadoop 工具体系处理数据。授课内容 还包括如何创建大数据环境、如何结合使用 DynamoDB、Redshift 、Quicksight、Athena 和 Kinesis 以及如何利用最佳实践来设计大数据环境, 从而实现安全性和经济性。

  • 课程目标

     

    通过学习本课程,您将能够:

     

      适用大数据体系内的云厂商解决方案

      在 EMR 环境中使用 Apache Hadoop

      了解 EMR 群集的组件

      启动并配置 EMR 群集

      利用 EMR 的常用编程框架,包括 Hive、Pig 和 Streaming

      利用 Hue 提高 EMR 的易用性

      在 EMR 上借助 Spark 使用内存分析

      选择适当的云厂商数据存储选项

      确定使用 Kinesis 以近乎实时的速度处理大数据的优势

      利用 Redshift 有效地存储和分析数据

      理解并管理大数据解决方案的费用和安全性

      保护大数据解决方案

      确定用于获取、传输和压缩数据的选项

      利用 Athena 进行临时查询分析

      借助 QuickSight 使用可视化软件描述数据和查询

      利用 Data Pipeline 编排大数据工作流

     

     

     

     

     

    目标人群

     

    本课程适用于:

     负责设计和实施大数据解决方案的人员,即解决方案架构师

     

     数据科学家和数据分析师有兴趣了解云厂商上大数据解决方案背后的服务和架构模式

     

     

     

     

    先决条件

     

    我们建议参加学习本课程的人员符合以下先决条件:

     

      基本熟悉大数据技术,包括 Apache Hadoop、MapReduce、HDFS 和 SQL/NoSQL 查询

      学员应完成 Big Data Technology Fundamentals 网络培训或具备同等经验

      具有核心云厂商服务和公有云实施工作经验

      学员应完成 Technical Essentials 课程或具备同等经验

      了解数据仓库、关系数据库系统和数据库设计基础授课方式

     

     

     

     

    本课程将结合以下方式授课:

     讲师指导培训 (ILT)

     

     动手实验室

     

    动手实践活动

    本课程允许通过各种实践操作来试验新的技术并将所学知识应用到您的工作环境中

    课程大纲

     

    第1天

     

      大数据概述

      大数据获取和传输

      大数据流式处理和 Kinesis

      实验室 1:使用 Kinesis 流式处理和分析 Apache 服务器日志数据

      大数据存储解决方案

      大数据处理和分析

     

     实验室 2:使用 Athena 查询 S3 的日志数据

     

     

     

     

    第2天

      Apache Hadoop 和 EMR

      实验室 3:在 DynamoDB 上存储并查询数据

      使用 EMR

      Hadoop 编程框架

      实验室 4:在 EMR 上利用 Hive 处理服务器日志

      EMR 上的 Web 界面

      实验室 5:在 EMR 上的 Hue 中运行 Pig 脚本

      EMR 上的 Apache Spark

      实验室 6:在 EMR 上使用 Spark 处理 NY Taxi 数据

     

     

     

     

     

    第3天

      Redshift 和大数据

      大数据的可视化及编制

      实验室 7:使用 TIBCO Spotfire 可视化数据

      管理大数据费用

      保护您的云厂商部署

      大数据设计模式

     

为您推荐

[专项课程]Big Data

请注意:提交后不能修改学员人数及信息