大數(shù)據(jù)分析(全面)系統(tǒng)課程

  培訓(xùn)講師:劉暉

講師背景:
劉暉老師通信行業(yè)特約培訓(xùn)導(dǎo)師【專業(yè)資質(zhì)】?北大計(jì)算機(jī)、北郵通信雙學(xué)位?(原)中興通訊學(xué)院高級(jí)講師?大慶油田技術(shù)研究院高級(jí)內(nèi)訓(xùn)講師?15年嵌入式硬件、軟件開發(fā)和系統(tǒng)架構(gòu)設(shè)計(jì)總監(jiān)?有8年多的“云大智物”開發(fā)及實(shí)施經(jīng)驗(yàn)。曾供職于巨龍通信、大唐電信 詳細(xì)>>

劉暉
    課程咨詢電話:

大數(shù)據(jù)分析(全面)系統(tǒng)課程詳細(xì)內(nèi)容

大數(shù)據(jù)分析(全面)系統(tǒng)課程

(1)培訓(xùn)背景

隨著互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)物聯(lián)網(wǎng)、人工智能等科技的快速發(fā)展,經(jīng)濟(jì)發(fā)展已經(jīng)進(jìn)入全球化時(shí)代,企業(yè)的命運(yùn)與國際經(jīng)濟(jì)環(huán)境緊密聯(lián)系,如美國的經(jīng)濟(jì)危機(jī)會(huì)波及到全球各個(gè)國家與地區(qū)和企業(yè),國家和企業(yè)已經(jīng)不是孤立的存在。在經(jīng)濟(jì)全球化時(shí)代商業(yè)環(huán)境極其復(fù)雜,不僅要考慮國內(nèi)、國外經(jīng)濟(jì)環(huán)境,同時(shí)還要考慮不同國家的國家政策,不同民族的民族文化,不同宗教的宗教信仰等,更加加深入了商業(yè)環(huán)境的復(fù)雜程度。在極其復(fù)雜的國際商業(yè)環(huán)境中,作為大型企業(yè)領(lǐng)導(dǎo)者僅憑經(jīng)驗(yàn)與智慧無法全面了解與掌控企業(yè)、了解國際化的商業(yè)環(huán)境,因此很難做出正確的企業(yè)戰(zhàn)略決策,甚至更無法做到企業(yè)精細(xì)化管理,更不可能做到高效運(yùn)營,那么,如何突破因商業(yè)環(huán)境復(fù)雜度而導(dǎo)致的企業(yè)失控呢?并在復(fù)雜的商業(yè)競(jìng)爭(zhēng)環(huán)境中脫穎而出并獲得最大利潤(rùn)呢?答案是掌握企業(yè)數(shù)據(jù)和掌握國際化數(shù)據(jù),并建立高效的數(shù)據(jù)分析體系,探索數(shù)據(jù)、挖掘數(shù)據(jù)高效準(zhǔn)確的獲取國際化的經(jīng)濟(jì)環(huán)境狀況,洞察市場(chǎng)趨勢(shì)提前做出有利于企業(yè)的戰(zhàn)略決策,提高企業(yè)競(jìng)爭(zhēng)力,規(guī)避市場(chǎng)風(fēng)險(xiǎn),數(shù)據(jù)分析則是提升企業(yè)管理水平,實(shí)現(xiàn)上述目標(biāo)的一種行之有效的方法。國際化的競(jìng)爭(zhēng)就是信息的國際化競(jìng)爭(zhēng)。

隨著大數(shù)據(jù)、人工智能的快速發(fā)展,數(shù)據(jù)的價(jià)值越發(fā)突顯,并為海量的高并發(fā)的數(shù)據(jù)分析提供了新的工具與可行性,較以往的傳統(tǒng)數(shù)據(jù)分析工具更為有效,甚至傳統(tǒng)數(shù)據(jù)分析工具做不到的,大數(shù)據(jù)人工智能都能做到。因此不僅僅企業(yè),社會(huì)各個(gè)方面也因大數(shù)據(jù)的價(jià)值而提高了對(duì)數(shù)據(jù)的關(guān)注程度,也加大了數(shù)據(jù)分析的投入力度。無論是企業(yè)管理、戰(zhàn)略決策、精準(zhǔn)營銷、精細(xì)化管理等都無處不體現(xiàn)著數(shù)據(jù)分析的重要性。

數(shù)據(jù)如此重要,如何建設(shè)一個(gè)高效的數(shù)據(jù)分析體系呢?至少要具備以下兩個(gè)條件:一是在宏觀層面上正確理解數(shù)據(jù)分析;二是豐富的IT系統(tǒng)建設(shè)經(jīng)驗(yàn)、分布式技術(shù)和較強(qiáng)的數(shù)據(jù)技術(shù)能力。第一點(diǎn)尤為重要,因?yàn)橐坏┰谒枷牒驼J(rèn)識(shí)層面對(duì)數(shù)據(jù)分析體系理解有誤,那么即使精通于各種技術(shù)方案,所建立起來的也只是一堆技術(shù)架構(gòu)的粗糙堆砌,雖然也能達(dá)到部分數(shù)據(jù)分析的效果,但必定會(huì)事倍功半。構(gòu)建數(shù)據(jù)分析體系包括四個(gè)層面:一是數(shù)據(jù)基礎(chǔ)平臺(tái);二是數(shù)據(jù)報(bào)表與可視化;三是精細(xì)化業(yè)務(wù)分析;四是戰(zhàn)略分析與決策。如下圖為數(shù)據(jù)分析體系結(jié)構(gòu)圖。

<a href=大數(shù)據(jù)體系構(gòu)建">

那么在數(shù)據(jù)基礎(chǔ)平臺(tái)建設(shè)層面,均采用大數(shù)據(jù)平臺(tái),如Hadoop、Spark等大數(shù)據(jù)平臺(tái),其好處是開源、可控,無需從零開始搭建平臺(tái)節(jié)約成本;也避免了因大數(shù)據(jù)的多樣性、隱私性等特點(diǎn)導(dǎo)致供應(yīng)無法深入挖掘數(shù)據(jù)的問題。為什么要自建數(shù)據(jù)分析平臺(tái)呢?不能采購嗎?答案是不能采購,只能自建!因?yàn)閿?shù)據(jù)挖掘一個(gè)持續(xù)的過程,日常企業(yè)經(jīng)常過程產(chǎn)生的數(shù)據(jù)、市場(chǎng)數(shù)據(jù)都是需要分析的,是一個(gè)持續(xù)不斷的工作,不是編寫幾個(gè)算法了事的,所以如果從供應(yīng)商采購必然會(huì)導(dǎo)致分析工作不夠深入與不夠?qū)I(yè),數(shù)據(jù)的價(jià)值是隱藏在數(shù)據(jù)中的,需要不斷的持續(xù)的挖掘才能找的,不是算法和分析工具能做到的。因此企業(yè)需要自建數(shù)據(jù)分析平臺(tái),而不采購分析工具。

Hadoop、Spark生態(tài)系統(tǒng)是大數(shù)據(jù)技術(shù)事實(shí)標(biāo)準(zhǔn),是大數(shù)據(jù)思想、理念、機(jī)制的具體實(shí)現(xiàn),是整個(gè)大數(shù)據(jù)技術(shù)中公認(rèn)的核心框架和具有極強(qiáng)的使用價(jià)值與研究?jī)r(jià)值。Hadoop?系統(tǒng)是一款開源軟件,能夠處理海量的各種結(jié)構(gòu)(包括結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化)的數(shù)據(jù)。

Hadoop是分布式集群框架,可以管理成百上千臺(tái)x86服務(wù)器集群。基于 Hadoop?的解決方案能夠幫助企業(yè)應(yīng)對(duì)多種大數(shù)據(jù)挑戰(zhàn),包括:

  1. 分析海量(PB?級(jí)或者更多)的數(shù)據(jù)

Hadoop?能夠分析所有數(shù)據(jù),使得分析更準(zhǔn)確,預(yù)測(cè)更精確;

  1. 從多個(gè)數(shù)據(jù)類型的組合中獲得新的洞察力

將來自多個(gè)數(shù)據(jù)源的不同類型的數(shù)據(jù)進(jìn)行結(jié)合分析,發(fā)現(xiàn)新的數(shù)據(jù)關(guān)系和洞察力;

  1. 存儲(chǔ)大量的數(shù)據(jù)

由于它不依賴于高端硬件,且是可擴(kuò)展的,所以使存儲(chǔ)大量數(shù)據(jù)變得經(jīng)濟(jì)有效;

  1. 數(shù)據(jù)發(fā)現(xiàn)(data discovery)和研究的沙箱

Hadoop?提供了一個(gè)地方,數(shù)據(jù)科學(xué)家可在此發(fā)現(xiàn)新的數(shù)據(jù)關(guān)系和相互依賴性。

?

工業(yè)和信息化部電信研究院于2014年5月發(fā)布的“大數(shù)據(jù)白皮書”中指出:

“2012?年美國聯(lián)邦政府就在全球率先推出“大數(shù)據(jù)行動(dòng)計(jì)劃(Big data initiative)”,重點(diǎn)在基礎(chǔ)技術(shù)研究和公共部門應(yīng)用上加大投入。在該計(jì)劃支持下,加州大學(xué)伯克利分校開發(fā)了完整的大數(shù)據(jù)開源軟件平臺(tái)“伯克利數(shù)據(jù)分析軟件棧(Berkeley Data Analytics Stack),其中的內(nèi)存計(jì)算軟件Spark的性能比Hadoop?提高近百倍,對(duì)產(chǎn)業(yè)界大數(shù)據(jù)技術(shù)走向產(chǎn)生巨大影響

????????????????????????????????????????? ----來源:工業(yè)和信息化部電信研究院

?

S9~GWDRI[C7VX(O{4OSS9Y1

?

Spark是成為替代MapReduce架構(gòu)的大數(shù)據(jù)分析技術(shù),Spark的大數(shù)據(jù)生態(tài)體系包括流處理、圖技術(shù)、機(jī)器學(xué)習(xí)等各個(gè)方面,并且已經(jīng)成為Apache頂級(jí)項(xiàng)目,可以預(yù)計(jì)的是2014年下半年到2015年在社區(qū)和商業(yè)應(yīng)用上會(huì)有爆發(fā)式的增長(zhǎng)。

US9R2XIE39V0U`OTT9S}A7I

?

國內(nèi)外一些大型互聯(lián)網(wǎng)公司已經(jīng)部署了Spark,并且它的高性能已經(jīng)得到實(shí)踐的證明。國外Yahoo已在多個(gè)項(xiàng)目中部署Spark,尤其在信息推薦的項(xiàng)目中得到深入的應(yīng)用;國內(nèi)的淘寶、愛奇異、優(yōu)酷土豆、網(wǎng)易、baidu、騰訊等大型互聯(lián)網(wǎng)企業(yè)已經(jīng)將Spark應(yīng)用于自己的生產(chǎn)系統(tǒng)中。國內(nèi)外的應(yīng)用開始越來越廣泛。Spark正在逐漸走向成熟,并在這個(gè)領(lǐng)域扮演更加重要的角色。

?

(2)培訓(xùn)目標(biāo)

本次數(shù)據(jù)分析技術(shù)培訓(xùn)課程,整個(gè)課程體系設(shè)計(jì)完備,思路清晰,學(xué)員通過本次課程的系統(tǒng)性學(xué)習(xí)可以掌握如下技能:

  1. 了解數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈,數(shù)據(jù)分析大數(shù)據(jù)等內(nèi)容;
  2. 學(xué)會(huì)數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理。掌握大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容;
  3. 掌握數(shù)據(jù)分析與挖掘基礎(chǔ)。學(xué)習(xí)常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。
  4. 學(xué)習(xí)數(shù)據(jù)分析工具R語言的數(shù)據(jù)分析實(shí)戰(zhàn)。學(xué)習(xí)R語言入門基礎(chǔ),描述性統(tǒng)計(jì)分析, 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容。
  5. 介紹大數(shù)據(jù)工具之Hadoop。深入理解Hadoop原理及組件介紹,Hadoop數(shù)據(jù)分析入門等內(nèi)容。
  6. 介紹大數(shù)據(jù)工具之Spark。深入剖析Spark基本概念,Spark開發(fā)與數(shù)據(jù)分析等內(nèi)容。
  7. 編寫Pyspark集群調(diào)度與數(shù)據(jù)處理程序。使用Python調(diào)度spark集群并進(jìn)行數(shù)據(jù)處理等內(nèi)容。
  8. 學(xué)習(xí)大數(shù)據(jù)可視化技術(shù)。包括數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述,數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
  9. 學(xué)習(xí)Python與數(shù)據(jù)分析實(shí)戰(zhàn)。包括Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機(jī)器學(xué)習(xí),Python數(shù)據(jù)分析案例分享,基于spark集群的python數(shù)據(jù)分析實(shí)戰(zhàn)等內(nèi)容。

?

通過以上的系統(tǒng)學(xué)習(xí),學(xué)員會(huì)建立完整的數(shù)據(jù)知識(shí)體系,使學(xué)員正確認(rèn)識(shí)大數(shù)據(jù),掌握大數(shù)據(jù)思維方法,為工作、生活和學(xué)習(xí)打下堅(jiān)實(shí)的基礎(chǔ),為持續(xù)成長(zhǎng)提供原動(dòng)力。下圖為本次課程結(jié)束后學(xué)員獲取的完整數(shù)據(jù)知識(shí)體系如下圖。

完整數(shù)據(jù)知識(shí)體系

(3)教學(xué)計(jì)劃

本系列課程總共由9門課程組成:

教學(xué)設(shè)計(jì)

NO.

課程名稱

課程天數(shù)

基礎(chǔ)與概述

1

數(shù)據(jù)分析概述

1天

2

數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理

5天

數(shù)據(jù)分析與數(shù)據(jù)挖掘核心技術(shù)講解及案例實(shí)操

3

數(shù)據(jù)分析與挖掘基礎(chǔ)

6天

4

R語言數(shù)據(jù)分析實(shí)戰(zhàn)

6天

大數(shù)據(jù)技術(shù)講解與編程實(shí)操

5

大數(shù)據(jù)工具介紹之Hadoop

2天

6

大數(shù)據(jù)工具介紹之Spark

3天

7

Pyspark集群調(diào)度與數(shù)據(jù)處理

2天

大數(shù)據(jù)可視化

8

大數(shù)據(jù)可視化

2天

Python與數(shù)據(jù)分析實(shí)戰(zhàn)

9

Python與數(shù)據(jù)分析實(shí)戰(zhàn)

13天

?

???????? 第1-2門課屬于基礎(chǔ)與概述,包括數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈,數(shù)據(jù)分析大數(shù)據(jù)等內(nèi)容。大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容。

???????? 第3-4門課程數(shù)據(jù)分析與數(shù)據(jù)挖掘核心技術(shù)講解及案例實(shí)操,包括常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。R語言入門基礎(chǔ),描述性統(tǒng)計(jì)分析, 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容。。

???????? 第5-7門課程主要大數(shù)據(jù)技術(shù)講解與編程實(shí)操,包括Hadoop原理及組件介紹,Hadoop數(shù)據(jù)分析入門等內(nèi)容。Spark基本概念,Spark開發(fā)與數(shù)據(jù)分析等內(nèi)容。使用Python調(diào)度spark集群并進(jìn)行數(shù)據(jù)處理等內(nèi)容。

???????? 第8門是大數(shù)據(jù)可視化。包括數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述,數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。

???????? 第9門是Python與數(shù)據(jù)分析實(shí)戰(zhàn)。包括Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機(jī)器學(xué)習(xí),Python數(shù)據(jù)分析案例分享,基于spark集群的python數(shù)據(jù)分析實(shí)戰(zhàn)等內(nèi)容。

?

(4)具體課程方案(含課程大綱)

課程1:數(shù)據(jù)分析概述-1天

【匹配關(guān)鍵知識(shí)點(diǎn)】

數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈,數(shù)據(jù)分析大數(shù)據(jù)等內(nèi)容。

【課程時(shí)間】

1天(6小時(shí)/天)

【課程簡(jiǎn)介】

本課程介紹大數(shù)據(jù)體系構(gòu)建數(shù)據(jù)平臺(tái),重點(diǎn)內(nèi)容包括數(shù)據(jù)平臺(tái)基礎(chǔ)理論、數(shù)據(jù)集成、數(shù)據(jù)維度等知識(shí)點(diǎn);本課程讓學(xué)員掌握基于大數(shù)據(jù)生態(tài)的數(shù)據(jù)分析知識(shí)、大數(shù)據(jù)生態(tài)體系技術(shù)選型,能夠應(yīng)用建模技術(shù)、大數(shù)據(jù)技術(shù)構(gòu)建數(shù)據(jù)平臺(tái)。

隨著大數(shù)據(jù)時(shí)代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,數(shù)據(jù)分析、數(shù)據(jù)建模、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等重要性越發(fā)突出,本課程是針對(duì)大數(shù)據(jù)時(shí)代的特點(diǎn),尹老師總結(jié)多年數(shù)據(jù)分析經(jīng)驗(yàn),而精心設(shè)計(jì)的課程,課程內(nèi)容涵蓋了數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等內(nèi)容的應(yīng)用范圍、發(fā)展前景剖析。

【課程收益】

1、數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈等內(nèi)容;

2、數(shù)據(jù)分析大數(shù)據(jù)等內(nèi)容;

【課程特點(diǎn)】

數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈,數(shù)據(jù)分析大數(shù)據(jù)等內(nèi)容

【課程對(duì)象】

????? 數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等

????? 將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員

????? 希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員

????? 系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員

【學(xué)員基礎(chǔ)】

????? 具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員

【課程大綱】(1天*6小時(shí))

時(shí)間

內(nèi)容

案例實(shí)踐與練習(xí)

Day1

數(shù)據(jù)分析概述

  1. 數(shù)據(jù)知識(shí)體系
  2. 數(shù)據(jù)倉庫誕生的歷史背景
  3. 大數(shù)據(jù)時(shí)代數(shù)據(jù)倉庫的演變
  4. 大數(shù)據(jù)是一套全新的思維體系
  5. 縱向、橫向擴(kuò)容
  6. 全量分析
  7. 大數(shù)據(jù)是一套全新的技術(shù)體系
  8. 大數(shù)據(jù)思維與傳統(tǒng)軟件思維的區(qū)別
  9. 大數(shù)據(jù)的數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)倉庫的區(qū)別
  10. 硬件成本、軟件技術(shù)積累
  11. 數(shù)據(jù)知識(shí)體系
  12. 數(shù)據(jù)采集
  13. 數(shù)據(jù)ETL
  14. 數(shù)據(jù)挖掘
  15. 數(shù)據(jù)可視化
  16. 商務(wù)智能
  17. 業(yè)務(wù)創(chuàng)新應(yīng)用
  18. 大數(shù)據(jù)生態(tài)體系介紹
  19. 大數(shù)據(jù)支撐----云計(jì)算
  20. 大數(shù)據(jù)核心----海量數(shù)據(jù)
  21. 大數(shù)據(jù)靈魂----大數(shù)據(jù)技術(shù)
  22. 大數(shù)據(jù)價(jià)值----大數(shù)據(jù)商業(yè)思維
  23. 大數(shù)據(jù)企業(yè)應(yīng)用障礙分析

案例練習(xí):通過大數(shù)據(jù)企業(yè)應(yīng)用障礙分析案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:大數(shù)據(jù)企業(yè)應(yīng)用障礙分析

?

課程2:數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理-5天

【匹配關(guān)鍵知識(shí)點(diǎn)】

大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容。

【課程時(shí)間】

5天(6小時(shí)/天)

?

【課程簡(jiǎn)介】

隨著大數(shù)據(jù)時(shí)代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,大數(shù)據(jù)領(lǐng)域如雨后春筍般的出現(xiàn)大量的新技術(shù),如Hadoop、Spark等技術(shù),其中Python語言已經(jīng)成為大數(shù)據(jù)技術(shù)中最為重要的一部分,被越來越多的企業(yè)所使用。Python語言的功能涵蓋了大數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能、大數(shù)據(jù)應(yīng)用開發(fā)等各種不同類型的計(jì)算操作,應(yīng)用范圍廣泛、前景非常廣闊。本課程是尹老師多年工作經(jīng)驗(yàn)的總結(jié)和歸納,從實(shí)際業(yè)務(wù)案例為入口,使學(xué)員從理論層到實(shí)操層面系統(tǒng)的學(xué)習(xí)數(shù)據(jù)處理技術(shù),使學(xué)員深入理解Python語言等數(shù)據(jù)分析工具。通過本課程的學(xué)習(xí),學(xué)員即可以正確的分析企業(yè)的數(shù)據(jù),為管理者、決策層提供數(shù)據(jù)支撐。

【課程收益】

1、大數(shù)據(jù)生成與導(dǎo)入;

2、數(shù)據(jù)分析流程與建模思想;

3、數(shù)據(jù)清洗與數(shù)據(jù)加工。

【課程特點(diǎn)】

大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容。

【課程對(duì)象】

????? 數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等

????? 將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員

????? 希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員

????? 系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員

【學(xué)員基礎(chǔ)】

????? 具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員

【課程大綱】(5天*6小時(shí))

時(shí)間

內(nèi)容

案例實(shí)踐與練習(xí)

Day1

數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理

  1. 數(shù)據(jù)知識(shí)體系
    1. 數(shù)據(jù)采集
    2. 數(shù)據(jù)ETL
    3. 數(shù)據(jù)挖掘
    4. 數(shù)據(jù)可視化
    5. 商務(wù)智能
    6. 業(yè)務(wù)創(chuàng)新應(yīng)用
  2. 數(shù)據(jù)分析挖掘的過程
  3. 建立數(shù)據(jù)庫的方法
  4. 企業(yè)對(duì)數(shù)據(jù)分析挖掘的錯(cuò)誤認(rèn)識(shí)
  5. ETL的設(shè)計(jì)
  6. ETL的實(shí)施
  7. 數(shù)據(jù)源
  8. 數(shù)據(jù)采集
  9. 隨機(jī)抽樣
  10. 數(shù)據(jù)去重
  11. 數(shù)據(jù)缺失值處理
  12. 檢驗(yàn)數(shù)據(jù)邏輯錯(cuò)誤
  13. 離群點(diǎn)檢測(cè)
  14. 數(shù)據(jù)轉(zhuǎn)換
  15. 數(shù)據(jù)分組
  16. 課堂實(shí)操:數(shù)據(jù)整理的編程和應(yīng)用

案例練習(xí):通過數(shù)據(jù)整理的編程和應(yīng)用案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:數(shù)據(jù)整理的編程和應(yīng)用

Day2

數(shù)據(jù)清洗與數(shù)據(jù)加工

  1. ROLAP與多維數(shù)據(jù)庫
  2. OLAP與OLTP的區(qū)別
  3. 多維數(shù)據(jù)庫與數(shù)據(jù)倉庫的關(guān)系
  4. OLAP模型搭建(多維模型)
  5. 確定維度、量度與事實(shí)的關(guān)系
  6. OLAP的應(yīng)用場(chǎng)景
  7. 決策支持技術(shù)
  8. 企業(yè)OLAP模型設(shè)計(jì)案例剖析
  9. 數(shù)據(jù)模型設(shè)計(jì)原則與模型搭建
  10. 星型架構(gòu)與雪花型架構(gòu)
  11. 事實(shí)表與維度表的設(shè)計(jì)
  12. 邏輯設(shè)計(jì)與物理設(shè)計(jì)
  13. 數(shù)據(jù)模型設(shè)計(jì)的常用方法
  14. 數(shù)據(jù)模型設(shè)計(jì)技巧總結(jié)
  15. 數(shù)據(jù)模型分片
  16. 數(shù)據(jù)模型索引
  17. 數(shù)據(jù)模型粒度
  18. 數(shù)據(jù)模型案例分析

?

案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:數(shù)據(jù)模型案例分析

Day3

大數(shù)據(jù)生成與導(dǎo)入

  1. 大數(shù)據(jù)基礎(chǔ)理論介紹
  2. 大數(shù)據(jù)的生成與導(dǎo)入
  3. 大數(shù)據(jù)技術(shù)
  4. CAP理論
  5. BASE思想
  6. 消息機(jī)制
  7. 分布式協(xié)調(diào)器
  8. 心跳機(jī)制
  9. 日志結(jié)構(gòu)文件系統(tǒng)
  10. RWN理論
  11. 跨操作系統(tǒng)調(diào)度資源
  12. 大數(shù)據(jù)企業(yè)實(shí)踐
  13. 電商遇到的問題
  14. 大型互聯(lián)網(wǎng)企業(yè)遇到的問題
  15. 大數(shù)據(jù)主要解決的問題
  16. 實(shí)例分享:淘寶雙十一
  17. 實(shí)例分享:騰訊QQ
  18. 實(shí)例分享:百度文庫
  19. 實(shí)例分享:打車大戰(zhàn)
  20. 大數(shù)據(jù)的作用
  21. Pig?設(shè)計(jì)的目標(biāo)
  22. Pig Latine介紹
  23. Pig關(guān)鍵性技術(shù)
  24. Pig的實(shí)用案例
  25. Hive簡(jiǎn)介
  26. Hive的組件與體系架構(gòu)
  27. Hive架構(gòu)
  28. Hive vs RDBMS
  29. Hive的高可用部署方案
  30. Hive Data Types
  31. Hive安裝模式
  32. Hive安裝部署
  33. Hive Shell
  34. Hive API開發(fā)演示
  35. Hive中UDF和UDAF
  36. Hive數(shù)據(jù)分析
  37. Sqoop簡(jiǎn)介
  38. Sqoop架構(gòu)
  39. Sqoop安裝
  40. Sqoop Shell
  41. Flume簡(jiǎn)介及使用
  42. Flume架構(gòu)
  43. Flume數(shù)據(jù)源類型
  44. Flume收集數(shù)據(jù)2種主要工作模式
  45. 電商客戶日志分析
  46. 大型國企大數(shù)據(jù)應(yīng)用
  47. 大數(shù)據(jù)架構(gòu)案例分享及實(shí)戰(zhàn)演練

案例練習(xí):通過淘寶雙十一案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:淘寶雙十一

Day4

數(shù)據(jù)分析流程

  1. 數(shù)據(jù)分析基本概念
  2. 數(shù)據(jù)分析算法
  3. 數(shù)據(jù)分析工具
  4. 數(shù)據(jù)分析流程
  5. 數(shù)據(jù)分析范疇
  6. 數(shù)據(jù)挖掘基本概念
  7. 數(shù)據(jù)挖掘模型
  8. 數(shù)據(jù)挖掘模型評(píng)估
  9. 數(shù)據(jù)挖掘目標(biāo)
  10. 數(shù)據(jù)挖掘數(shù)據(jù)質(zhì)量
  11. 數(shù)據(jù)挖掘的9大定律
  12. 數(shù)據(jù)挖掘發(fā)展趨勢(shì)

案例研討:通過數(shù)據(jù)挖掘案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:數(shù)據(jù)挖掘

Day5

數(shù)據(jù)分析流程與建模思想

  1. 定義挖掘目標(biāo)
  2. 數(shù)據(jù)取樣
  3. 數(shù)據(jù)探索
  4. 數(shù)據(jù)預(yù)處理
  5. 挖掘建模
  6. 建立模型
  7. 業(yè)務(wù)理解
  8. 模型擬合
  9. 訓(xùn)練集
  10. 測(cè)試集
  11. 模型評(píng)價(jià)
  12. 企業(yè)實(shí)踐案例分享

案例練習(xí):通過企業(yè)實(shí)踐案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:企業(yè)實(shí)踐案例分享

Day5

數(shù)據(jù)的統(tǒng)計(jì)學(xué)知識(shí)和模型

  1. 回歸分析
  2. 貝葉斯算法
  3. 聚類算法
  4. SVM
  5. 決策樹算法
  6. 關(guān)聯(lián)規(guī)則算法
  7. 時(shí)間序列算法
  8. 神經(jīng)網(wǎng)絡(luò)
  9. 深度學(xué)習(xí)
  10. 人工智能
  11. 其他挖掘算法
  12. 以上數(shù)據(jù)模型的應(yīng)用案例剖析

案例練習(xí):通過數(shù)據(jù)模型的應(yīng)用案例剖析案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:數(shù)據(jù)模型的應(yīng)用案例剖析

?

課程3:數(shù)據(jù)分析與挖掘基礎(chǔ)-6天

【匹配關(guān)鍵知識(shí)點(diǎn)】

常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。

【課程時(shí)間】

6天(6小時(shí)/天)

【課程簡(jiǎn)介】

隨著大數(shù)據(jù)時(shí)代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,數(shù)據(jù)分析、數(shù)據(jù)建模、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、人工智能等重要性越發(fā)突出,本課程是針對(duì)大數(shù)據(jù)時(shí)代的特點(diǎn),尹老師總結(jié)多年數(shù)據(jù)分析經(jīng)驗(yàn),而精心設(shè)計(jì)的課程,課程內(nèi)容涵蓋了數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、人工智能等內(nèi)容,以及人工智能的應(yīng)用范圍、發(fā)展前景剖析。

【課程收益】

1、常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述;

2、描述型數(shù)據(jù)分析

3、常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等。

【課程特點(diǎn)】

常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。

【課程對(duì)象】

????? 數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等

????? 將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員

????? 希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員

????? 系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員

【學(xué)員基礎(chǔ)】

????? 具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員

【課程大綱】(6天*6小時(shí))

時(shí)間

內(nèi)容

案例實(shí)踐與練習(xí)

Day1

常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述

  1. 數(shù)據(jù)分析與建模的概念
  2. 數(shù)據(jù)分析與建模過程
  3. 數(shù)據(jù)分析模型開發(fā)過程
  4. 數(shù)據(jù)建模概述
  5. 機(jī)器學(xué)習(xí)概念
  6. 機(jī)器學(xué)習(xí)算法剖析
  7. 算法庫分類
  8. 算法庫
  9. 深度學(xué)習(xí)
  10. 神經(jīng)網(wǎng)絡(luò)
  11. 人工智能
  12. 商業(yè)智能

?

案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:數(shù)據(jù)分析的過程

Day2

描述型數(shù)據(jù)分析

  1. 統(tǒng)計(jì)學(xué)基本概念
  2. 統(tǒng)計(jì)數(shù)據(jù)的計(jì)量尺度
  3. 常用基本統(tǒng)計(jì)量
  4. 集中趨勢(shì)的描述指標(biāo)
  5. 離散趨勢(shì)的描述指標(biāo)
  6. 中心極限定理
  7. 大數(shù)定律
  8. 數(shù)據(jù)的分布
  9. 正態(tài)分布的特征
  10. 偏度和峰度
  11. 檢測(cè)數(shù)據(jù)集的分布
  12. 數(shù)據(jù)的分布擬合檢驗(yàn)與正態(tài)性檢驗(yàn)
  13. 抽樣標(biāo)準(zhǔn)
  14. 假設(shè)檢驗(yàn)
  15. T檢驗(yàn)
  16. 置信區(qū)間

?

案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:描述性數(shù)據(jù)分析

Day3

常見數(shù)據(jù)分析與挖掘算法

  1. 數(shù)據(jù)挖掘的基本任務(wù)
  2. 數(shù)據(jù)挖掘建模過程
    1. 定義挖掘目標(biāo)
    2. 數(shù)據(jù)取樣
    3. 數(shù)據(jù)探索
    4. 數(shù)據(jù)預(yù)處理
    5. 挖掘建模
    6. 建立模型
    7. 業(yè)務(wù)理解
    8. 模型擬合
    9. 訓(xùn)練集
    10. 測(cè)試集
    11. 模型評(píng)價(jià)
  3. 常用的數(shù)學(xué)預(yù)測(cè)模型
    1. 線性回歸
    2. 回歸(預(yù)測(cè))與分類
    3. 決策樹與隨機(jī)森林
    4. 聚類分析(kmeans)
    5. 關(guān)聯(lián)規(guī)則
    6. 時(shí)序模式
    7. 離群點(diǎn)檢測(cè)
    8. 深度學(xué)習(xí)
    9. 人工智能
    10. 神經(jīng)網(wǎng)絡(luò)
  4. 案例:如何從數(shù)據(jù)中挖掘出有價(jià)值的信息

案例研討:通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:常用數(shù)據(jù)分析方法與算法

Day4

樸素貝葉斯與回歸分析

  1. 主成分分析和因子分析(深入剖析主成分分析及因子分析)
  2. 主成分分析
  3. 總體主成分
  4. 樣本主成分
  5. 主成分分析模型
  6. 案例:主成分分析模型實(shí)現(xiàn)
  7. 課堂實(shí)操:主成分分析模型實(shí)現(xiàn)

?

  1. 方差分析(深入剖析方差分析方法及實(shí)現(xiàn))
  2. 單因素方差分析
  3. 單因素方差分析模型
  4. 因素效應(yīng)的顯著性檢驗(yàn)
  5. 因素各水平均值的估計(jì)與比較
  6. 兩因素等重復(fù)試驗(yàn)下的方差分析
  7. 統(tǒng)計(jì)模型
  8. 交互效應(yīng)及因素效應(yīng)的顯著性檢驗(yàn)
  9. 無交互效應(yīng)時(shí)各因素均值的估計(jì)與比較
  10. 有交互效應(yīng)時(shí)因素各水平組合上的均值估計(jì)與比較
  11. 兩因素非重復(fù)試驗(yàn)下的方差分析
  12. 金融案例:方差分析實(shí)現(xiàn)
  13. 課堂實(shí)操:方差分析實(shí)現(xiàn)

?

?

  1. Bayes統(tǒng)計(jì)分析(深入剖析Bayes統(tǒng)計(jì)分析)
  2. Baves統(tǒng)計(jì)模型
  3. Bayes統(tǒng)計(jì)分析的基本思想
  4. Bayes統(tǒng)計(jì)模型
  5. Bayes統(tǒng)計(jì)推斷原則
  6. 先驗(yàn)分布的Bayes假設(shè)與不變先驗(yàn)分布
  7. 共軛先驗(yàn)分布
  8. 先驗(yàn)分布中超參數(shù)的確定
  9. Baves統(tǒng)計(jì)推斷
  10. 參數(shù)的Bayes點(diǎn)估計(jì)
  11. Bayes區(qū)間估計(jì)
  12. Bayes假設(shè)檢驗(yàn)
  13. 案例:實(shí)現(xiàn)Bayes統(tǒng)計(jì)分析建模
  14. 課堂實(shí)操:實(shí)現(xiàn)Bayes統(tǒng)計(jì)分析建模

?

?

  1. 數(shù)學(xué)建模(深入剖析數(shù)學(xué)建模)
  2. 數(shù)學(xué)建模
  3. 數(shù)學(xué)預(yù)測(cè)模型
  4. 模型評(píng)估
  5. 模型參數(shù)優(yōu)化

?

  1. 回歸分析與分類分析原理與應(yīng)用(深入剖析數(shù)據(jù)的回歸分析與分類分析的原理以及應(yīng)用)
  2. 回歸與分類
  3. 回歸分析概念
  4. 線性回歸模型及其參數(shù)估計(jì)
  5. 一元線性回歸
  6. 一元線性回歸模型
  7. 一元線性回歸模型求解參數(shù)
  8. 損失函數(shù)
  9. 求偏導(dǎo)
  10. 回歸方程的顯著性檢驗(yàn)
  11. 殘差分析
  12. 誤差項(xiàng)的正態(tài)性檢驗(yàn)
  13. 殘差圖分析
  14. 統(tǒng)計(jì)推斷與預(yù)測(cè)
  15. 回歸模型的選取
  16. 窮舉法
  17. 逐步回歸法
  18. 嶺回歸分析
  19. 一元線性回歸
  20. 金融案例:一元線性回歸模型檢驗(yàn)
  21. 多元線性回歸概述
  22. 多元線性回歸模型
  23. 金融案例:多元線性回歸實(shí)現(xiàn)航空業(yè)信用打分和評(píng)級(jí)模型

?

?

  1. Logistic回歸分析(剖析Logistic回歸與其它回歸分析方法)
  2. Logistic回歸介紹
  3. Logistic函數(shù)
  4. Logistic回歸模型
  5. 案例:SPSS Logistic回歸實(shí)現(xiàn)
  6. 課堂實(shí)操: Logistic回歸實(shí)現(xiàn)航空業(yè)欺詐預(yù)測(cè)模型
  7. 課堂實(shí)操: Logistic回歸實(shí)現(xiàn)航空業(yè)風(fēng)險(xiǎn)分析模型

?

  1. 非線性回歸原理及應(yīng)用(剖析非線性回歸原理及應(yīng)用實(shí)踐)
  2. 非線性回歸
  3. 雙曲線函數(shù)
  4. 冪函數(shù)
  5. 指數(shù)函數(shù)
  6. 對(duì)數(shù)函數(shù)
  7. S型曲線
  8. 案例:非線性回歸實(shí)現(xiàn)
  9. 課堂實(shí)操:非線性回歸實(shí)現(xiàn)航空業(yè)經(jīng)營分析和績(jī)效分析模型

案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:主成分分析模型實(shí)現(xiàn)

Day5

聚類分析與關(guān)聯(lián)規(guī)則挖掘

?

  1. 數(shù)據(jù)建模常用距離(深入剖析數(shù)據(jù)建模過程中常用的距離模型)
  2. 數(shù)據(jù)挖掘常用距離
  3. 歐氏距離
  4. 曼哈頓距離
  5. 切比雪夫距離
  6. 閔可夫斯基距離
  7. 標(biāo)準(zhǔn)化歐氏距離
  8. 馬氏距離
  9. 夾角余弦
  10. 漢明距離
  11. 杰卡德距離 &?杰卡德相似系數(shù)
  12. 相關(guān)系數(shù) &?相關(guān)距離
  13. 信息熵

?

  1. 聚類分析與建模實(shí)現(xiàn)(深入剖析聚類分析以及通過SPSS聚類算法模型分析數(shù)據(jù))
  2. 聚類分析
  3. 聚類算法
  4. 樣品間相近性的度量
  5. 快速聚類法
  6. 快速聚類法的步驟
  7. 用Lm距離進(jìn)行快速聚類
  8. 譜系聚類法
  9. 類間距離及其遞推公式
  10. 譜系聚類法的步驟
  11. 變量聚類
  12. 案例:SPSS聚類實(shí)現(xiàn)及繪圖
  13. 案例:Kmeans應(yīng)用案例剖析
  14. 課堂實(shí)操:編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例剖析

?

  1. 關(guān)聯(lián)規(guī)則分析與實(shí)現(xiàn)(深入剖析關(guān)聯(lián)規(guī)則分析以及通過SPSS關(guān)聯(lián)規(guī)則算法模型分析數(shù)據(jù))
  2. 關(guān)聯(lián)規(guī)則
  3. 支持度與置信度
  4. 關(guān)聯(lián)規(guī)則挖掘的過程
  5. Apriori算法
  6. 關(guān)聯(lián)規(guī)則案例
  7. 支持度與置信度計(jì)算
  8. 案例:SPSS實(shí)現(xiàn)關(guān)聯(lián)規(guī)則
  9. 課堂實(shí)操:SPSS實(shí)現(xiàn)航空業(yè)數(shù)據(jù)關(guān)聯(lián)規(guī)則分析

案例練習(xí):通過編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例剖析

Day6

決策樹與隨機(jī)森林

?

  1. 決策樹分析與實(shí)現(xiàn)(深入剖析決策樹分析以及通過SPSS決策樹模型分析數(shù)據(jù))
  2. 決策樹分析
  3. 決策樹
  4. 決策樹構(gòu)成要素
  5. 決策樹算法原理
  6. 決策樹法的決策過程
  7. 決策樹算法
  8. 案例:實(shí)現(xiàn)決策樹分析
  9. 課堂實(shí)操:實(shí)現(xiàn)航空業(yè)客戶細(xì)分模型
  10. 隨機(jī)森林

?

?

  1. 數(shù)據(jù)建模時(shí)序模式分析與實(shí)現(xiàn)(深入剖析時(shí)序模式分析)
  2. 時(shí)序模式
  3. 時(shí)間序列分析
  4. 時(shí)間序列分析
  5. 時(shí)間序列
  6. 序列分析的三個(gè)階段
  7. 課堂實(shí)操:實(shí)現(xiàn)航空業(yè)客戶流失模型

案例練習(xí):通過實(shí)現(xiàn)航空業(yè)客戶細(xì)分模型案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

?

研討:實(shí)現(xiàn)航空業(yè)客戶細(xì)分模型

?

課程4:R語言數(shù)據(jù)分析實(shí)戰(zhàn)-6天

【匹配關(guān)鍵知識(shí)點(diǎn)】

R語言入門基礎(chǔ),描述性統(tǒng)計(jì)分析, 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容。

【課程時(shí)間】

6天(6小時(shí)/天)

?

【課程簡(jiǎn)介】

R語言由新西蘭奧克蘭大學(xué)ross ihaka和robert gentleman?開發(fā)。R語言是自由軟件,具有非常強(qiáng)大的統(tǒng)計(jì)分析和作圖功能,而且具有非常豐富的網(wǎng)上資源,目前R軟件有3000多種貢獻(xiàn)包,幾乎可以實(shí)現(xiàn)所有的統(tǒng)計(jì)方法,目前大部分的頂級(jí)統(tǒng)計(jì)學(xué)家和計(jì)量經(jīng)濟(jì)學(xué)家都使用R語言,而且越來越多的數(shù)據(jù)分析實(shí)務(wù)人員也開始使用R語言。學(xué)習(xí)R軟件正成為一種趨勢(shì)。

R語言具有簡(jiǎn)單易學(xué),功能強(qiáng)大,體積小(僅30M),完全免費(fèi),可自由開發(fā)等特點(diǎn),且R語言和S語言語法基本相同,絕大部分程序是互相兼容的。

R軟件最優(yōu)美的地方是它能夠修改很多前人編寫的包的代碼做各種你所需的事情,實(shí)際你是站在巨人的肩膀上。

【課程收益】

1、R語言入門基礎(chǔ);

2、描述性統(tǒng)計(jì)分析;

3、用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容;

【課程特點(diǎn)】

R語言入門基礎(chǔ),描述性統(tǒng)計(jì)分析, 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容。

【課程對(duì)象】

????? 數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等

????? 將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員

????? 希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員

????? 系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員

【學(xué)員基礎(chǔ)】

????? 具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員

【課程大綱】(6天*6小時(shí))

      時(shí)間

      內(nèi)容

      案例實(shí)踐與練習(xí)

      Day1

      R語言入門基礎(chǔ)

      ?

      1. R語言簡(jiǎn)介(介紹R語言工具)
      2. R語言歷史與趨勢(shì)剖析
      3. 安裝R語言
      4. RStudio使用
      5. 工作空間的設(shè)置
      6. R程序包的載入與使用
      7. R資源網(wǎng)上查找方法介紹

      ?

      1. R語言語法介紹(R語言基礎(chǔ)語法介紹)
      2. R語言的數(shù)據(jù)類型介紹
      3. R語言的數(shù)據(jù)結(jié)構(gòu)介紹
      4. 數(shù)據(jù)的讀入和輸出
      5. R語言連接RDBMS數(shù)據(jù)庫介紹
      6. 數(shù)據(jù)庫的讀/寫
      7. R和SQL的交互
      8. 循環(huán)語句
      9. 條件語句
      10. 遍歷
      11. 常用函數(shù)
      12. 常用算法
      13. 定性變量
      14. 離散變量
      15. 連續(xù)變量
      16. 多元變量
      17. 對(duì)向量、矩陣和列表進(jìn)行運(yùn)算
      18. 提取和插入元素
      19. 日期和時(shí)間數(shù)據(jù)的操作處理
      20. 編寫自定義函數(shù)解決復(fù)雜問題
      21. 編程技巧
      22. 編程案例介紹

      案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

      ?

      研討:R語言編程

      Day2

      R語言繪圖功能

      ?

      1. R語言的繪圖功能介紹(R語言的探索性分析與數(shù)據(jù)可視化)
      2. 繪圖函數(shù)
      3. 圖形增強(qiáng)函數(shù)
      4. 圖形互動(dòng)函數(shù)
      5. 高級(jí)繪圖命令
      6. 散點(diǎn)圖
      7. 柱狀圖
      8. 直方圖
      9. R語言數(shù)據(jù)預(yù)處理(R語言的數(shù)據(jù)的讀取、清洗和轉(zhuǎn)換)
      10. 數(shù)據(jù)預(yù)處理
      11. 日期和時(shí)間的處理
      12. 因子變量的操作
      13. 下標(biāo)數(shù)據(jù)整理技術(shù)
      14. 字符串操作
      15. 數(shù)據(jù)子集的篩選
      16. 識(shí)別重復(fù)數(shù)據(jù)和缺失值處理
      17. 函數(shù)映射數(shù)據(jù)轉(zhuǎn)換整理技術(shù)
      18. 變量的重新編碼
      19. plyr、reshape2等包整理數(shù)據(jù)

      案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

      ?

      研討:R語言繪圖

      Day3

      R語言與外部數(shù)據(jù)交互

      ?

      1. 數(shù)據(jù)的讀入和輸出(R語言的數(shù)據(jù)的讀取、加載和寫出)
      2. 數(shù)據(jù)的讀入和寫出
      3. read.table
      4. scan
      5. 內(nèi)置數(shù)據(jù)集的讀取
      6. R語言連接RDBMS數(shù)據(jù)庫介紹
      7. R語言RDBMS數(shù)據(jù)庫操作
      8. 實(shí)操:R和MySQL的交互
      9. 實(shí)操:R和Oracle的交互
      10. 數(shù)據(jù)庫的讀/寫
      11. R和SQL的交互
      12. 實(shí)操:R和Excel的交互
      13. R語言大數(shù)據(jù)操作
      14. 實(shí)操:R編寫Spark程序

      ?

      案例研討:通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

      ?

      研討:R語言與RDBMS交互

      Day4

      描述性統(tǒng)計(jì)分析

      ?

      1. R語言統(tǒng)計(jì)模擬與隨機(jī)抽樣(R語言的算法介紹)
      2. 隨機(jī)數(shù)生成
      3. 蒙特卡洛模擬
      4. 中心極限定理的模擬
      5. 線性模型剖析
      6. 線性模型診斷方法
      7. 多元選擇模型剖析
      8. 隨機(jī)抽樣
      9. 案例:蒙特卡羅模擬的應(yīng)用

      ?

      1. 描述統(tǒng)計(jì)分析與離群點(diǎn)檢測(cè)(掌握R語言用法和基本數(shù)據(jù)分析、數(shù)據(jù)描述統(tǒng)計(jì)分析)
      2. 基本數(shù)據(jù)分析(隨機(jī)數(shù)的生成和統(tǒng)計(jì)模擬)
      3. 單變量數(shù)據(jù)分析與作圖
      4. 雙變量數(shù)據(jù)分析與作圖(二維表分析,并列箱線圖,相關(guān)系數(shù))
      5. 多變量數(shù)據(jù)分析與作圖(多變量相關(guān)系數(shù)矩陣)
      6. 離群點(diǎn)檢測(cè)
      7. 案例1:汽車數(shù)據(jù)描述統(tǒng)計(jì)分析
      8. 案例2:財(cái)政收入與稅收描述統(tǒng)計(jì)分析

      ?

      案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

      ?

      研討:描述性統(tǒng)計(jì)分析

      Day5

      用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)

      ?

      1. 基本數(shù)據(jù)分析數(shù)據(jù)分析和數(shù)據(jù)挖掘基礎(chǔ)介紹)
      2. 中心極限定理
      3. 大數(shù)定律
      4. 正態(tài)分布的特征
      5. 偏度和峰度
      6. 檢測(cè)數(shù)據(jù)集的分布
      7. 概率分布
      8. 隨機(jī)數(shù)生成
      9. 隨機(jī)抽樣
      10. 蒙特卡洛模擬
      11. 用蒙特卡羅方法計(jì)算圓周率π
      12. 案例:蒙特卡羅模擬的應(yīng)用
      13. 實(shí)操:R語言實(shí)現(xiàn)蒙特卡羅求圓周率

      ?

      ?

      1. 回歸與分類(掌握回歸算法與實(shí)際建模分析應(yīng)用,回歸與分類剖析,R語言實(shí)現(xiàn)及預(yù)測(cè)應(yīng)用)
      2. 回歸分析
      3. 回歸分析概念
      4. 線性模型剖析
      5. 一元線性回歸
      6. 一元線性回歸模型
      7. 一元線性回歸模型求解參數(shù)
      8. 損失函數(shù)
      9. 求偏導(dǎo)
      10. 線性模型評(píng)估方法
      11. 實(shí)操:R語言一元線性回歸
      12. 實(shí)操:R語言一元線性回歸模型檢驗(yàn)

      ?

      1. 多元線性回歸(多元線性回歸剖析,R語言實(shí)現(xiàn)及預(yù)測(cè)應(yīng)用)
      2. 多元選擇模型剖析
      3. 多元線性回歸思想
      4. 實(shí)操:R語言實(shí)現(xiàn)多元線性回歸

      ?

      1. 非線性回歸(非線性回歸剖析,R語言實(shí)現(xiàn)及預(yù)測(cè)應(yīng)用)
      2. 雙曲線函數(shù)
      3. 冪函數(shù)
      4. 指數(shù)函數(shù)
      5. 對(duì)數(shù)函數(shù)
      6. S?型曲線
      7. 實(shí)操:R語言非線性回歸
      8. 逐步回歸分析
      9. 嶺回歸分析

      ?

      1. Logistic回歸(Logistic回歸剖析,R語言實(shí)現(xiàn)及預(yù)測(cè)應(yīng)用)
      2. Logistic函數(shù)
      3. 繪制Logistic曲線
      4. Logistic回歸介紹
      5. 案例:用戶離網(wǎng)預(yù)測(cè)
      6. 案例:中國稅收收入增長(zhǎng)案例分析
      7. 案例:新教學(xué)方法的效果
      8. 案例:信用卡違約預(yù)測(cè)

      案例練習(xí):通過用戶離網(wǎng)預(yù)測(cè)案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。

      ?

      研討:用戶離網(wǎng)預(yù)測(cè)

      Day6

      用R語言文本數(shù)據(jù)挖掘?qū)崙?zhàn)

      ?

      1. 文本挖掘應(yīng)用(介紹文本數(shù)據(jù)挖掘的實(shí)際應(yīng)用場(chǎng)景)
      2. 文本結(jié)構(gòu)分析
      3. 文章分類
      4. 文章摘要
      5. 文章聚類
      6. 相似文章推薦
      7. NLP自然語言處理
      8. 命名實(shí)體識(shí)別
      9. 案例分析

      ?

      1. 文本數(shù)據(jù)挖掘過程(介紹文本數(shù)據(jù)挖掘的流程)
      2. 文本預(yù)處理
      3. 文本挖掘
      4. 模式與表示
      5. 模式評(píng)估

      ?

      1. 中文分詞技術(shù)介紹(介紹文本挖掘的基礎(chǔ)中文分詞技術(shù))
      2. 信息檢索
      3. 倒排索引
      4. 文本分詞
      5. 停用詞
      6. 詞根
      7. 主要的分詞方法
      8. 基于規(guī)則的詞性標(biāo)注
      9. 自動(dòng)語義標(biāo)注
      10. 中文分詞軟件包
      11. R語言中文分詞
      12. 代碼實(shí)現(xiàn)中文分詞
      13. TF-IDF算法介紹(介紹TF-IDF文章分類算法以及代碼實(shí)

         

        劉暉老師的其它課程

        【課程特色】1.??課上采用案例式教學(xué),通俗易懂,課下一對(duì)一輔導(dǎo)強(qiáng)化訓(xùn)練,學(xué)與練交叉進(jìn)行強(qiáng)化記憶,你所要做的就是認(rèn)真聽,勤于問,樂于練。2.??清晰的知識(shí)結(jié)構(gòu),根據(jù)應(yīng)用經(jīng)驗(yàn)采用最優(yōu)化授課模式。3.??內(nèi)容充沛、詳略得當(dāng),前后呼應(yīng)。4.??講師資歷豐富,具有豐富的實(shí)踐經(jīng)驗(yàn)。5.??知識(shí)講授+貼身案例+場(chǎng)景故事+互動(dòng)討論+現(xiàn)場(chǎng)演練+落地跟蹤【課程時(shí)間】1天【課程

         講師:劉暉詳情


        【課程背景】住房和城鄉(xiāng)建設(shè)部印發(fā)的《國家智慧城市試點(diǎn)暫行管理辦法》和《國家智慧城市(區(qū)、鎮(zhèn))試點(diǎn)指標(biāo)體系(試行)》兩個(gè)文件指出:建設(shè)智慧城市是創(chuàng)新驅(qū)動(dòng)發(fā)展、推動(dòng)新型城鎮(zhèn)化、全面建成小康社會(huì)的重要舉措。這對(duì)于服務(wù)于千千萬萬城市、社區(qū)、園區(qū)、小區(qū)、樓宇,以及工作和生活在其中的業(yè)主和客戶的物業(yè)管理服務(wù)業(yè)來說,已然迎來最大的發(fā)展機(jī)遇。物業(yè)管理行業(yè)不僅是智慧社區(qū)的受益

         講師:劉暉詳情


        5G+智慧煤礦   12.31

        【課程特色】1.??課上采用案例式教學(xué),通俗易懂,課下一對(duì)一輔導(dǎo)強(qiáng)化訓(xùn)練,學(xué)與練交叉進(jìn)行強(qiáng)化記憶,你所要做的就是認(rèn)真聽,勤于問,樂于練。2.??清晰的知識(shí)結(jié)構(gòu),根據(jù)應(yīng)用經(jīng)驗(yàn)采用最優(yōu)化授課模式。3.??內(nèi)容充沛、詳略得當(dāng),前后呼應(yīng)。4.??講師資歷豐富,具有豐富的實(shí)踐經(jīng)驗(yàn)。5.??知識(shí)講授+貼身案例+場(chǎng)景故事+互動(dòng)討論+現(xiàn)場(chǎng)演練+落地跟蹤【課程對(duì)象】無線網(wǎng)、核

         講師:劉暉詳情


        【課程特色】1.??課上采用案例式教學(xué),通俗易懂,課下一對(duì)一輔導(dǎo)強(qiáng)化訓(xùn)練,學(xué)與練交叉進(jìn)行強(qiáng)化記憶,你所要做的就是認(rèn)真聽,勤于問,樂于練。2.??清晰的知識(shí)結(jié)構(gòu),根據(jù)應(yīng)用經(jīng)驗(yàn)采用最優(yōu)化授課模式。3.??內(nèi)容充沛、詳略得當(dāng),前后呼應(yīng)。4.??講師資歷豐富,具有豐富的實(shí)踐經(jīng)驗(yàn)。5.??知識(shí)講授+貼身案例+場(chǎng)景故事+互動(dòng)討論+現(xiàn)場(chǎng)演練+落地跟蹤【課程對(duì)象】相關(guān)人員【

         講師:劉暉詳情


        5G產(chǎn)業(yè)發(fā)展與應(yīng)用創(chuàng)新【課程背景】隨著5G?技術(shù)的快速發(fā)展,5G?應(yīng)用已成為各界熱議的話題,很多行業(yè)陸續(xù)開展了相關(guān)的實(shí)踐探索。本課程站在科技發(fā)展的前沿,探討了5G在物聯(lián)網(wǎng)、人工智能、無人機(jī)、醫(yī)療、農(nóng)業(yè)、教育、工業(yè)互聯(lián)網(wǎng)、新媒體等行業(yè)的應(yīng)用案例。值得指出的是,案例以運(yùn)營商、一流企業(yè)等機(jī)構(gòu)在5G領(lǐng)域的實(shí)踐為主線,對(duì)5G行業(yè)應(yīng)用創(chuàng)新案例做了詳細(xì)的講解?!菊n程收益】

         講師:劉暉詳情


        【課程背景】隨著5G?技術(shù)的快速發(fā)展,5G?應(yīng)用已成為各界熱議的話題,很多行業(yè)陸續(xù)開展了相關(guān)的實(shí)踐探索?!菊n程收益】1了解5G從信息通信技術(shù)支持到業(yè)務(wù)模式推廣和場(chǎng)景的應(yīng)用,掌握5G在新時(shí)代、新技術(shù)下的行業(yè)發(fā)展趨勢(shì);2以鮮活的應(yīng)用案例和解決方案詳細(xì)掌握5G給環(huán)保行業(yè)方面帶來全新變革的藍(lán)圖和愿景;【課程特色】1.??課上采用案例式教學(xué),通俗易懂,課下一對(duì)一輔導(dǎo)強(qiáng)

         講師:劉暉詳情


        5G賦能工業(yè)互聯(lián)網(wǎng)【課程背景】5G通過技術(shù)創(chuàng)新實(shí)現(xiàn)了增強(qiáng)型移動(dòng)寬帶、超大規(guī)模物聯(lián)網(wǎng)和高可靠、低時(shí)延等三大應(yīng)用場(chǎng)景全覆蓋,把人與人之間的通信拓展到了人與物、物與物之間的通信,從消費(fèi)互聯(lián)網(wǎng)拓展到了產(chǎn)業(yè)互聯(lián)網(wǎng),為行業(yè)數(shù)字化轉(zhuǎn)型提供了關(guān)鍵的數(shù)字基礎(chǔ)設(shè)施。5G和人工智能/大數(shù)據(jù)/云計(jì)算/邊緣計(jì)算/區(qū)塊鏈等新一代信息技術(shù)相結(jié)合,多技術(shù)交織并進(jìn)、深度滲透、協(xié)同應(yīng)用,孕育技

         講師:劉暉詳情


        【課程背景】隨著5G?技術(shù)的快速發(fā)展,5G?應(yīng)用已成為各界熱議的話題,很多行業(yè)陸續(xù)開展了相關(guān)的實(shí)踐探索。本課程站在科技發(fā)展的前沿,探討了5G在物聯(lián)網(wǎng)、人工智能、無人機(jī)、醫(yī)療、農(nóng)業(yè)、教育、工業(yè)互聯(lián)網(wǎng)、新媒體等行業(yè)的應(yīng)用案例。值得指出的是,案例以運(yùn)營商、一流企業(yè)等機(jī)構(gòu)在5G領(lǐng)域的實(shí)踐為主線,對(duì)5G行業(yè)應(yīng)用創(chuàng)新案例做了詳細(xì)的講解?!菊n程收益】1了解5G從信息通信技

         講師:劉暉詳情


        【課程背景】隨著5G?技術(shù)的快速發(fā)展,5G?應(yīng)用已成為各界熱議的話題,很多行業(yè)陸續(xù)開展了相關(guān)的實(shí)踐探索。本課程站在科技發(fā)展的前沿,探討了5G與數(shù)字貨幣、區(qū)塊鏈在金融行業(yè)的應(yīng)用案例。值得指出的是,案例以運(yùn)營商、一流企業(yè)等機(jī)構(gòu)在5G領(lǐng)域的實(shí)踐為主線,對(duì)5G金融行業(yè)應(yīng)用創(chuàng)新案例做了詳細(xì)的講解?!菊n程收益】1了解5G從信息通信技術(shù)支持到業(yè)務(wù)模式推廣和場(chǎng)景的應(yīng)用,掌握

         講師:劉暉詳情


        【課程背景】國家電網(wǎng)“三型兩網(wǎng)、世界一流”戰(zhàn)略、南方電網(wǎng)定位“五者”,轉(zhuǎn)型“三商”戰(zhàn)略,需賦能智能終端,加速電網(wǎng)全面感知,打通數(shù)據(jù)和業(yè)務(wù)壁壘,驅(qū)動(dòng)創(chuàng)新能力。傳統(tǒng)通信方式難以滿足數(shù)字電網(wǎng)發(fā)展需求,電力生產(chǎn)、傳輸、消費(fèi)全過程需要低時(shí)延、大寬帶、大連接,對(duì)5G的訴求十分迫切5G作為最新一代的無線通信技術(shù),其超高速率、超低時(shí)延、超大連接特性對(duì)智慧城市建設(shè)產(chǎn)生巨大的影

         講師:劉暉詳情


         發(fā)布內(nèi)容,請(qǐng)點(diǎn)我! 講師申請(qǐng)/講師自薦
        清華大學(xué)卓越生產(chǎn)運(yùn)營總監(jiān)高級(jí)研修班
        清華大學(xué)卓越生產(chǎn)運(yùn)營總監(jiān)高級(jí)研修班
        COPYRIGT @ 2018-2028 http://fanshiren.cn INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權(quán)所有