課程背景:
隨著云時代的來臨,大數(shù)據(jù)技術(shù)將具有越來越重要的戰(zhàn)略意義。大數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務職能領(lǐng)域,逐漸成為重要的生產(chǎn)要素,人們對于海量數(shù)據(jù)的運用將預示著新一輪生產(chǎn)率增長和消費者盈余浪潮的到來。大數(shù)據(jù)分析技術(shù)將幫助企業(yè)用戶在合理時間內(nèi)攫取、管理、處理、整理海量數(shù)據(jù),為企業(yè)經(jīng)營決策提供積極的幫助。大數(shù)據(jù)分析作為數(shù)據(jù)存儲和挖掘分析的前沿技術(shù),廣泛應用于物聯(lián)網(wǎng)、云計算、移動互聯(lián)網(wǎng)等戰(zhàn)略性新興產(chǎn)業(yè)。雖然大數(shù)據(jù)目前在國內(nèi)還處于初級階段,但是其商業(yè)價值已經(jīng)顯現(xiàn)出來。為加強大數(shù)據(jù)分析創(chuàng)新發(fā)展頂層設計和科學布局,推動相關(guān)人員更好理解和掌握大數(shù)據(jù)分析的關(guān)鍵技術(shù)原理、未來發(fā)展方向,為此培養(yǎng)大數(shù)據(jù)分析高級工程師。
培訓對象:
IT公司數(shù)據(jù)分析師、數(shù)據(jù)中心架構(gòu)師、商業(yè)智能分析師、研發(fā)負責人、研發(fā)工程師、各地政府云計算、物聯(lián)網(wǎng)產(chǎn)業(yè)負責人,CIO、信息中心、技術(shù)總監(jiān),云計算產(chǎn)業(yè)投資團隊,云計算應用開發(fā)商,云計算硬件設備、運營服務提供商,高校、科研院所云計算項目負責人。
高級開發(fā)工程師、設計師、架構(gòu)師、系統(tǒng)管理員、開發(fā)經(jīng)理、測試經(jīng)理、產(chǎn)品經(jīng)理、項目經(jīng)理等。
培訓證書:
工業(yè)和信息化部人才交流中心頒發(fā)的《工業(yè)和信息化領(lǐng)域急需緊缺人才》大數(shù)據(jù)分析高級工程師證書。證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級和晉升職務的重要依據(jù)。詳情請點擊:http://www.wanho.net/hadoop
課程大綱:
第一天
一、大數(shù)據(jù)挖掘分析簡介
大數(shù)據(jù)發(fā)展歷程以及hadoop起源 大數(shù)據(jù)定義和傳統(tǒng)手段遇到的瓶頸 Hadoop怎么解決大數(shù)據(jù)問題的 Hadoop生態(tài)系統(tǒng)簡介 Hadoop體系下主要的分析手段 Hadoop中優(yōu)秀的軟件設計和體系架構(gòu)思想
二、大數(shù)據(jù)與Hadoop
偽分布式和完全分布式hadoop的安裝 Hadoop常用配置項解讀 Hadoop分布式文件系統(tǒng)原理 Hdfs常用命令演示 Mapreduce的工作原理 Hadoop自帶的example演示 手動編寫mapreduce示例程序 Hadoop常見故障分析與解決
第二天
一、大數(shù)據(jù)分析核心工具之mapreduce和pig
高級mapreduce開發(fā)演示:combiners、partitioner;MRUnit;分布式緩存;join;二次排序等) Mapreduce開發(fā)之分布式緩存 mapreduce模擬sql語言的各種操作
二、除mapreduce外的hadoop數(shù)據(jù)分析工具介紹
Pig之piglatin語言 Pig之udf擴展 Pig案例
三、大數(shù)據(jù)分析核心工具之hive以及與現(xiàn)有工具流整合
Hive深入介紹 Hive之hql語言 Hive之udf擴展 Hive示例 一個完整的數(shù)據(jù)分析案例(分別使用mapreduce、pig、hive進行分析) 集成Hadoop到現(xiàn)有工作流(使用sqoop)(關(guān)系數(shù)據(jù)庫管理系統(tǒng);利用Sqoop從關(guān)系型數(shù)據(jù)庫系統(tǒng)中導入數(shù)據(jù)到Hadoop)
第三天
一、大數(shù)據(jù)分析架構(gòu)之分布式數(shù)據(jù)庫:Nosql與Hbase
Nosql簡介 常見Nosql介紹 Hbase介紹 Hbase體系架構(gòu) Hbase安裝(含本地、偽分布式、完全分布式) Hbase操作演示 Hbase應用案例
二、大數(shù)據(jù)分析核心技術(shù)在企業(yè)中的應用以及Hadoop調(diào)優(yōu)
Hadoop調(diào)優(yōu) Hadoop在企業(yè)中如何使用 (企業(yè)案例以及hadoop在企業(yè)IT架構(gòu)中的位置) Hadoop體系中單點解決方案(namenode,jobtracker,hive等) Hadoop生態(tài)環(huán)境其他產(chǎn)品在企業(yè)中的應用
江蘇萬和大數(shù)據(jù)培訓講師
謝老師:江蘇萬和金牌講師、云計算研究員、資深Nutch、Lucene、Solr、Tika、Mahout、Spark、Storm技術(shù)專家。活躍于開源中國、CSDN等開源社區(qū),對于開源數(shù)據(jù)挖掘技術(shù)有著深刻的理解與實戰(zhàn)經(jīng)驗,擅長大規(guī)模云計算及數(shù)據(jù)挖掘系統(tǒng)的程序設計。
對于目前主流數(shù)據(jù)挖掘技術(shù)及分析算法有著深入的研究,項目實施經(jīng)驗豐富。作為項目負責人和主要成員先后參與并領(lǐng)導完成了多個云計算及大數(shù)據(jù)應用開發(fā)項目,如:法國電信運營數(shù)據(jù)分析項目、江蘇移動網(wǎng)廳運營數(shù)據(jù)分析項目、新聞信息分類聚合推薦項目,涉及政府、媒體、通信業(yè)等諸多行業(yè)領(lǐng)域。近幾年陸續(xù)為公安、金融、報社、通信、電商等眾多政企行業(yè)提供了云計算、大數(shù)據(jù)應用及開發(fā)等主題培訓服務,獲得客戶一致好評。
魯老師:江蘇萬和金牌講師、云計算研究員、資深Hadoop技術(shù)專家。活躍于開源中國、CSDN等開源社區(qū),對于開源數(shù)據(jù)挖掘技術(shù)有著深刻的理解與實戰(zhàn)經(jīng)驗,擅長大規(guī)模云計算及數(shù)據(jù)挖掘系統(tǒng)框架的設計。
對于目前主流虛擬化產(chǎn)品及技術(shù)有著深入的研究,項目實施經(jīng)驗豐富。作為項目負責人和主要成員先后參與并領(lǐng)導完成了多個云計算及大數(shù)據(jù)應用開發(fā)項目,如:南京市政府智慧城市項目、美國鋁業(yè)公司生產(chǎn)數(shù)據(jù)挖掘項目、美國RAMBUS數(shù)據(jù)分析項目,涉及政府、制造業(yè)、通信業(yè)等諸多行業(yè)領(lǐng)域。近幾年陸續(xù)為公安、金融、報社、通信、電商等眾多政企行業(yè)提供了云計算、大數(shù)據(jù)應用及開發(fā)等主題培訓服務,獲得客戶一致好評。