hadoop 大數(shù)據(jù)技術培訓 5天

  培訓講師:孫增輝

講師背景:
孫增輝老師講師資質(zhì)?Oracle數(shù)據(jù)庫DBA認證?SAS數(shù)據(jù)分析高級程序員認證?Hadoop大數(shù)據(jù)及數(shù)據(jù)分析講師講師簡介?數(shù)據(jù)庫專家。孫增輝老師多年從事數(shù)據(jù)庫的管理和教學工作。對oracle、sqlserver、mysql等關系型數(shù)據(jù)庫有豐 詳細>>

    課程咨詢電話:

hadoop 大數(shù)據(jù)技術培訓 5天詳細內(nèi)容

hadoop 大數(shù)據(jù)技術培訓 5天


大數(shù)據(jù)處理技術培訓
課程介紹
Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(Hadoop Distributed File System),簡稱HDFS。HDFS有高 容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上;而且它提供高傳輸率(high throughput)來訪問應用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應用程序。    
課程目標
掌握大數(shù)據(jù)方法體系
掌握Hadoop原理技術
熟悉各項大數(shù)據(jù)處理手段和工具的使用。
培訓對象
全省互聯(lián)網(wǎng)分析人員
課程長度
5天
課程內(nèi)容
第1天
主題
Hadoop入門,了解什么是hadoop大綱
1、Hadoop產(chǎn)生背景
2、Hadoop在大數(shù)據(jù)、云計算中的位置和關系
3、國內(nèi)外Hadoop應用案例介紹
4、國內(nèi)Hadoop的課程大綱介紹
5、Hadoop生態(tài)圈以及各組成部分的簡介
6、Hadoop核心MapReduce例子說明
主題
分布式文件系統(tǒng)HDFS
大綱
1、分布式文件系統(tǒng)DFS簡介
2、HDFS的系統(tǒng)組成介紹
3、HDFS的組成部分詳解
4、副本存放策略及路由規(guī)則
5、命令行接口
6、Java接口
7、客戶端與HDFS的數(shù)據(jù)流講解
8、HDFS的可用性(HA)
第2天
主題
初級MapReduce大綱
1、如何理解map、reduce計算模型
2、剖析偽分布式下MapReduce作業(yè)的執(zhí)行過程
3、序列化
4、MapReduce的類型與格式
5、MapReduce開發(fā)環(huán)境搭建
6、MapReduce應用開發(fā)
7、更多示例講解,熟悉MapReduce算法原理
主題
高級MapReduce大綱
1、使用壓縮分隔減少輸入規(guī)模
2、利用Combiner減少中間數(shù)據(jù)
3、編寫Partitioner優(yōu)化負載均衡
4、MapReduce優(yōu)化
5、編程實戰(zhàn)
第3天
主題
Hadoop集群與管理
大綱
1、Hadoop集群的搭建
2、Hadoop集群的監(jiān)控
3、Hadoop集群的管理
4、集群下運行MapReduce程序
主題
HBase基礎知識
大綱
1、HBase定義
2、HBase與RDBMS的對比
3、數(shù)據(jù)模型
4、系統(tǒng)架構
5、HBase上的MapReduce
6、表的設計
第4天
主題
HBase集群及其管理
大綱
1、集群的搭建過程講解
2、集群的監(jiān)控
3、集群的管理
主題
Zookeeper
大綱
1、zookeeper的功能
2、zookeeper集群搭建
3、查看zookeeper中數(shù)據(jù)的存儲
第5天
主題
Hive
大綱
1、數(shù)據(jù)倉庫基礎知識
2、Hive定義
3、Hive體系結(jié)構簡介
4、Hive集群
5、客戶端簡介
主題
HiveQL大綱
1、HiveQL定義
2、HiveQL與SQL的比較
3、數(shù)據(jù)類型
4、表與表分區(qū)概念
5、表的操作與CLI客戶端演示
6、數(shù)據(jù)導入與CLI客戶端演示
7、查詢數(shù)據(jù)與CLI客戶端演示
8、數(shù)據(jù)的連接與CLI客戶端演示
9、用戶自定義函數(shù)(UDF)的開發(fā)與演示  

 

孫增輝老師的其它課程

信息安全課程介紹本課程涵蓋了信息安全從概念到細節(jié)的多個方面。本課程同樣適用于初學者和專業(yè)人員,相對全面地提供了一站式的參考內(nèi)容。課程目標安全基礎數(shù)據(jù)安全如何保護網(wǎng)絡上的資產(chǎn)網(wǎng)絡安全計算機安全應用程序安全安全操作培訓對象相關的技術人員、管理人員、運維人員課程長度5天課程內(nèi)容第1天主題信息安全概述大綱信息保護的重要性信息安全的演變合理的安全投資安全方法論建立一個

 講師:孫增輝詳情


應用容器引擎Docker課程介紹Docker是基于GO語言實現(xiàn)的云開源項目,誕生于2013年初。Docker希望達到應用組件級別的“一次封裝,到處運行”。學員可以簡單將docker容器理解為沙盒。每個容器運行一個應用,不同的容器互相隔離,容器之間也可以建立通信機制。容器的創(chuàng)建和停止十分快速,容器自身對資源的需求也十分有限,遠遠低于虛擬機。很多時候直接把容器黨

 講師:孫增輝詳情


云計算openstack課程介紹云計算從提出到成熟,中間經(jīng)歷了較長的時間。云計算的各種概念也在不斷發(fā)展更新。本課程能夠給想要學習云計算知識的人們,提供一個可供學習的云計算系統(tǒng),幫助大家學習、實驗和使用。課程目標了解云計算,知道云計算產(chǎn)生的原因以及應用場景。了解云存儲,知道云計算系統(tǒng)中大數(shù)據(jù)的存儲方式。私有云和公有云。云計算的兩種不同應用場景,它們的聯(lián)系與區(qū)別

 講師:孫增輝詳情


mysql 4天    12.08

MYSQL數(shù)據(jù)庫課程介紹本課程介紹MySQL的啟動、連接等基礎應用開始,SQL語句的使用、MySQL內(nèi)置函數(shù)、備份與恢復、數(shù)據(jù)庫優(yōu)化、數(shù)據(jù)庫安全等主題,介紹相關開發(fā)實例課程目標了解mysql數(shù)據(jù)庫的體系結(jié)構創(chuàng)建和管理mysql數(shù)據(jù)庫備份和恢復數(shù)據(jù)庫培訓對象軟件開發(fā)人員、數(shù)據(jù)庫管理員課程長度5天(30學時)培訓方式案例分析、情景演練課程內(nèi)容第1天主題體系結(jié)構大

 講師:孫增輝詳情


Oracle數(shù)據(jù)庫管理(DBA)課程介紹本課程是你作為Oracle專業(yè)人員走向成功的第一步。課程設計為你打下基本的數(shù)據(jù)庫管理的堅實基礎并幫助你準備通過OracleCertifiedAssociate考試。課程目標課程中,你將學習如何安裝和維護Oracle數(shù)據(jù)庫。學員將獲得Oracle數(shù)據(jù)庫結(jié)構的概念性理解,以及它的組件是如何彼此協(xié)調(diào)工作的。學員將學習如何創(chuàng)建

 講師:孫增輝詳情


Oracle調(diào)優(yōu)培訓課程介紹該培訓課程面向大中型企業(yè)中的數(shù)據(jù)庫相關的開發(fā)人員和管理人員。課程的主要內(nèi)容是Oracle11g數(shù)據(jù)庫性能調(diào)優(yōu)的各種實例、方法、技巧以及與之對應的原理的講解通過本課程地學習。學員可以大大的提升數(shù)據(jù)庫性能調(diào)優(yōu)的能力。課程結(jié)合大量案例,使學員能夠理論結(jié)合實際,學以致用。課程目標←掌握Oracle11g數(shù)據(jù)庫性能調(diào)優(yōu)的各種實例、方法、技巧

 講師:孫增輝詳情


Oracle數(shù)據(jù)庫調(diào)優(yōu)課程課時:4天1.課程適合對象Oracle數(shù)據(jù)庫運維人員(DBA)2.培訓所需實驗設備及軟件清單編號設備及軟件名稱對應課程1Oracle11g數(shù)據(jù)庫課程安排上午(9:00-12:00)下午(14:00-17:00)第一天(1).Oracle數(shù)據(jù)庫性能診斷工具?最根本的性能信息工具——數(shù)據(jù)庫數(shù)據(jù)字典和動態(tài)性能視圖?診斷性能定位問題工具:S

 講師:孫增輝詳情


SAS數(shù)據(jù)分析從入門到精通課程介紹SAS數(shù)據(jù)分析軟件是應用最廣泛的商業(yè)統(tǒng)計分析軟件之一。本課程是從基礎開始到專業(yè)應用的整體內(nèi)容,幫助您理解數(shù)據(jù)分析的操作。課程目標SAS編程基礎SAS常用函數(shù)及應用SAS數(shù)據(jù)集處理操作SAS宏編程SASPROCSQL描述統(tǒng)計T檢驗方差分析回歸分析。培訓對象數(shù)據(jù)庫管理員、開發(fā)人員課程長度5天(30學時)培訓方式案例分析、情景演練

 講師:孫增輝詳情


Spark數(shù)據(jù)分析課程介紹本課程將關注spark的數(shù)據(jù)分析技術實際應用。課程目標數(shù)據(jù)分析培訓對象開發(fā)人員課程長度5天(30學時)培訓方式案例分析、情景演練課程內(nèi)容第1天主題Spark的環(huán)境搭建與運行大綱Spark的本地安裝與配置Spark集群Spark編程模型主題數(shù)據(jù)分析系統(tǒng)商業(yè)案例大綱個性化目標營銷和客戶細分預測建模與分析機器學習的系統(tǒng)架構第2天主題Spa

 講師:孫增輝詳情


課程名稱課程介紹本課程是大數(shù)據(jù)與使用sas做數(shù)據(jù)挖掘的基礎課。主要內(nèi)容是:1、介紹了大數(shù)據(jù)的定義?;仡櫞髷?shù)據(jù)的時代背景、大數(shù)據(jù)的構成,已經(jīng)大數(shù)據(jù)的“4v”特征。并且介紹了大數(shù)據(jù)的技術與應用范圍。并介紹了大數(shù)據(jù)已經(jīng)對我們產(chǎn)生的影響。以及一個廣受歡迎的大數(shù)據(jù)支撐產(chǎn)品---hadoop軟件的安裝2、大數(shù)據(jù)是數(shù)據(jù)分析的前提,也是從數(shù)據(jù)中產(chǎn)生價值的基礎。真正產(chǎn)生價值,

 講師:孫增輝詳情


COPYRIGT @ 2001-2018 HTTP://fanshiren.cn INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權所有