Spark大數據分析 5天

  培訓講師:孫增輝

講師背景:
孫增輝老師講師資質?Oracle數據庫DBA認證?SAS數據分析高級程序員認證?Hadoop大數據及數據分析講師講師簡介?數據庫專家。孫增輝老師多年從事數據庫的管理和教學工作。對oracle、sqlserver、mysql等關系型數據庫有豐 詳細>>

    課程咨詢電話:

Spark大數據分析 5天詳細內容

Spark大數據分析 5天

Spark數據分析
課程介紹
本課程將關注spark的數據分析技術實際應用。
課程目標
數據分析
培訓對象
開發(fā)人員
課程長度
5天(30學時)
培訓方式
案例分析、情景演練
課程內容
第1天
主題
Spark 的環(huán)境搭建與運行
大綱
Spark 的本地安裝與配置
Spark 集群
Spark 編程模型
主題
數據分析系統(tǒng)商業(yè)案例
大綱
個性化
目標營銷和客戶細分
預測建模與分析
機器學習的系統(tǒng)架構
第2天
主題
Spark 上數據的獲取、處理與準備
大綱
獲取公開數據集
處理與轉換數據
從數據中提取有用特征
主題
構建基于Spark 的推薦引擎
大綱
推薦模型的分類
提取有效特征
訓練推薦模型
使用推薦模型
推薦模型效果的評估.
第3天
主題
Spark 構建分類模型
大綱
分類模型的種類
從數據中抽取合適的特征
訓練分類模型
使用分類模型
評估分類模型的性
改進模型性能以及參數調優(yōu).
主題
Spark 構建回歸模型
大綱
回歸模型的種類
從數據中抽取合適的特征
回歸模型的訓練和應用
評估回歸模型的性能
改進模型性能和參數調優(yōu).
第4天
主題
Spark 構建聚類模型
大綱
聚類模型的類型
從數據中提取正確的特征
訓練聚類模型
使用聚類模型進行預測
評估聚類模型的性能
主題
Spark 應用于數據降維大綱
降維方法的種類
從數據中抽取合適的特征
訓練降維模型使用降維模型第5天
主題
Spark 高級文本處理技術
大綱
處理文本數據有什么特別之處
從數據中抽取合適的特征
評估文本處理技術的作用
主題
Spark Streaming 在實時機器學習上的應用
大綱
在線學習.
流處理.
使用Spark Streaming 進行在線學習

 

孫增輝老師的其它課程

大數據處理技術培訓課程介紹Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡稱HDFS。HDFS有高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上;而且它提供高傳輸率(highthroughput)來訪問應用程序的數據,適合那些有著超大數據集(largedataset)的應用程序。課程目標掌握

 講師:孫增輝詳情


信息安全課程介紹本課程涵蓋了信息安全從概念到細節(jié)的多個方面。本課程同樣適用于初學者和專業(yè)人員,相對全面地提供了一站式的參考內容。課程目標安全基礎數據安全如何保護網絡上的資產網絡安全計算機安全應用程序安全安全操作培訓對象相關的技術人員、管理人員、運維人員課程長度5天課程內容第1天主題信息安全概述大綱信息保護的重要性信息安全的演變合理的安全投資安全方法論建立一個

 講師:孫增輝詳情


應用容器引擎Docker課程介紹Docker是基于GO語言實現(xiàn)的云開源項目,誕生于2013年初。Docker希望達到應用組件級別的“一次封裝,到處運行”。學員可以簡單將docker容器理解為沙盒。每個容器運行一個應用,不同的容器互相隔離,容器之間也可以建立通信機制。容器的創(chuàng)建和停止十分快速,容器自身對資源的需求也十分有限,遠遠低于虛擬機。很多時候直接把容器黨

 講師:孫增輝詳情


云計算openstack課程介紹云計算從提出到成熟,中間經歷了較長的時間。云計算的各種概念也在不斷發(fā)展更新。本課程能夠給想要學習云計算知識的人們,提供一個可供學習的云計算系統(tǒng),幫助大家學習、實驗和使用。課程目標了解云計算,知道云計算產生的原因以及應用場景。了解云存儲,知道云計算系統(tǒng)中大數據的存儲方式。私有云和公有云。云計算的兩種不同應用場景,它們的聯(lián)系與區(qū)別

 講師:孫增輝詳情


mysql 4天    12.08

MYSQL數據庫課程介紹本課程介紹MySQL的啟動、連接等基礎應用開始,SQL語句的使用、MySQL內置函數、備份與恢復、數據庫優(yōu)化、數據庫安全等主題,介紹相關開發(fā)實例課程目標了解mysql數據庫的體系結構創(chuàng)建和管理mysql數據庫備份和恢復數據庫培訓對象軟件開發(fā)人員、數據庫管理員課程長度5天(30學時)培訓方式案例分析、情景演練課程內容第1天主題體系結構大

 講師:孫增輝詳情


Oracle數據庫管理(DBA)課程介紹本課程是你作為Oracle專業(yè)人員走向成功的第一步。課程設計為你打下基本的數據庫管理的堅實基礎并幫助你準備通過OracleCertifiedAssociate考試。課程目標課程中,你將學習如何安裝和維護Oracle數據庫。學員將獲得Oracle數據庫結構的概念性理解,以及它的組件是如何彼此協(xié)調工作的。學員將學習如何創(chuàng)建

 講師:孫增輝詳情


Oracle調優(yōu)培訓課程介紹該培訓課程面向大中型企業(yè)中的數據庫相關的開發(fā)人員和管理人員。課程的主要內容是Oracle11g數據庫性能調優(yōu)的各種實例、方法、技巧以及與之對應的原理的講解通過本課程地學習。學員可以大大的提升數據庫性能調優(yōu)的能力。課程結合大量案例,使學員能夠理論結合實際,學以致用。課程目標←掌握Oracle11g數據庫性能調優(yōu)的各種實例、方法、技巧

 講師:孫增輝詳情


Oracle數據庫調優(yōu)課程課時:4天1.課程適合對象Oracle數據庫運維人員(DBA)2.培訓所需實驗設備及軟件清單編號設備及軟件名稱對應課程1Oracle11g數據庫課程安排上午(9:00-12:00)下午(14:00-17:00)第一天(1).Oracle數據庫性能診斷工具?最根本的性能信息工具——數據庫數據字典和動態(tài)性能視圖?診斷性能定位問題工具:S

 講師:孫增輝詳情


SAS數據分析從入門到精通課程介紹SAS數據分析軟件是應用最廣泛的商業(yè)統(tǒng)計分析軟件之一。本課程是從基礎開始到專業(yè)應用的整體內容,幫助您理解數據分析的操作。課程目標SAS編程基礎SAS常用函數及應用SAS數據集處理操作SAS宏編程SASPROCSQL描述統(tǒng)計T檢驗方差分析回歸分析。培訓對象數據庫管理員、開發(fā)人員課程長度5天(30學時)培訓方式案例分析、情景演練

 講師:孫增輝詳情


課程名稱課程介紹本課程是大數據與使用sas做數據挖掘的基礎課。主要內容是:1、介紹了大數據的定義?;仡櫞髷祿臅r代背景、大數據的構成,已經大數據的“4v”特征。并且介紹了大數據的技術與應用范圍。并介紹了大數據已經對我們產生的影響。以及一個廣受歡迎的大數據支撐產品---hadoop軟件的安裝2、大數據是數據分析的前提,也是從數據中產生價值的基礎。真正產生價值,

 講師:孫增輝詳情


COPYRIGT @ 2001-2018 HTTP://fanshiren.cn INC. ALL RIGHTS RESERVED. 管理資源網 版權所有