數(shù)據(jù)分析師培訓(xùn)
課程介紹
了解Apache Pig、Apache Hive及Apache Impala如何通過(guò)刪選、連接進(jìn)行數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)分析,以及利用其它常見(jiàn)技術(shù)自定義用戶功能。
Apache Hadoop基礎(chǔ)及數(shù)據(jù)ETL(包括數(shù)據(jù)提取、轉(zhuǎn)換及加載)、如何通過(guò)使用Hadoop相關(guān)工具將數(shù)據(jù)載入Hadoop并進(jìn)行分析處理:
? 如何使用Apache Pig對(duì)多個(gè)關(guān)聯(lián)的數(shù)據(jù)集進(jìn)行join操作以及如何分析不同的獨(dú)立數(shù)據(jù);
? 如何使用Apache Hive:通過(guò)定義合適的表來(lái)組織數(shù)據(jù)、執(zhí)行各種數(shù)據(jù)變換、簡(jiǎn)化復(fù)雜查詢;
? 如何使用Impala來(lái)對(duì)存儲(chǔ)在HDFS里的大規(guī)模數(shù)據(jù)進(jìn)行實(shí)時(shí)和交互式的分析查詢;
? 如何根據(jù)數(shù)據(jù)分析任務(wù)來(lái)選擇合適的數(shù)據(jù)分析工具。
課程目標(biāo)
? 了解Apache Pig、Apache Hive及Apache Impala如何通過(guò)刪選、連接進(jìn)行數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)分析,以及利用其它常見(jiàn)技術(shù)自定義用戶功能。
適合人群
? 需要使用Hadoop來(lái)進(jìn)行數(shù)據(jù)分析的數(shù)據(jù)分析員,商業(yè)分析員,開(kāi)發(fā)員以及系統(tǒng)管理員。
? 面向意欲使用SQL、腳本和基本Linux 操作 Hadoop數(shù)據(jù)的分析師、BI專(zhuān)家、架構(gòu) 師和管理員。培訓(xùn)對(duì)象不要求具有Hadoop 相關(guān)知識(shí)。
數(shù)據(jù)分析
Cloudera Hadoop數(shù)據(jù)分析師培訓(xùn)