Big Data on AWS课程将向您介绍基于云的大数据解决方案,例如Amazon Elastic MapReduce(EMR)、Amazon Redshift、Amazon Kinesis和其余AWS大数据平台。在本课程中,我们将向您介绍如何使用Amazon EMR来利用诸如Hive和Hue等广泛Hadoop工具体系处理数据。讲授内容还包括如何创建大数据环境、使用Amazon DynamoDB、Amazon Redshift和Amazon Kinesis,利用较佳实践来设计大数据环境,从而实现安全性和经济性。
我们建议参加学习本课程的人员符合以下先决条件:
基本熟悉大数据技术,包括Apache Hadoop、MapReduce、HDFS和SQL/NoSQL查询
学员应完成Big Data Technology Fundamentals网络培训或具备同等经验
具有核心AWS服务和公有云实施工作经验
学员应完成AWS Technical Essentials课程或具备同等经验
了解数据仓库、关系数据库系统和数据库设计基础
本课程中您将学习:
适用大数据体系内的AWS解决方案
在Amazon EMR环境中使用Apache Hadoop
确定Amazon EMR集群的组件
启动并配置Amazon EMR集群
利用Amazon EMR的常用编程框架,包括Hive、Pig和Streaming
利用Hue提高Amazon EMR的易用性
在Amazon EMR上搭配使用内存分析及Spark和Spark SQL
选择适当的AWS数据存储选项
确定使用Amazon Kinesis以近乎实时的速度处理大数据的优势
定义数据仓库和列式数据库的概念
利用Amazon Redshift有效地存储和分析数据
了解和管理Amazon EMR及Amazon Redshift部署的成本和安全性
确定用于获取、传输和压缩数据的选项
使用可视化软件描述数据和查询
利用AWS Data Pipeline编排大数据工作流目标人群