大數(shù)據(jù)分析(全面)系統(tǒng)課程
大數(shù)據(jù)分析(全面)系統(tǒng)課程詳細(xì)內(nèi)容
大數(shù)據(jù)分析(全面)系統(tǒng)課程
(1)培訓(xùn)背景
隨著互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等科技的快速發(fā)展,經(jīng)濟(jì)發(fā)展已經(jīng)進(jìn)入全球化時(shí)代,企業(yè)的命運(yùn)與國際經(jīng)濟(jì)環(huán)境緊密聯(lián)系,如美國的經(jīng)濟(jì)危機(jī)會(huì)波及到全球各個(gè)國家與地區(qū)和企業(yè),國家和企業(yè)已經(jīng)不是孤立的存在。在經(jīng)濟(jì)全球化時(shí)代商業(yè)環(huán)境極其復(fù)雜,不僅要考慮國內(nèi)、國外經(jīng)濟(jì)環(huán)境,同時(shí)還要考慮不同國家的國家政策,不同民族的民族文化,不同宗教的宗教信仰等,更加加深入了商業(yè)環(huán)境的復(fù)雜程度。在極其復(fù)雜的國際商業(yè)環(huán)境中,作為大型企業(yè)領(lǐng)導(dǎo)者僅憑經(jīng)驗(yàn)與智慧無法全面了解與掌控企業(yè)、了解國際化的商業(yè)環(huán)境,因此很難做出正確的企業(yè)戰(zhàn)略決策,甚至更無法做到企業(yè)精細(xì)化管理,更不可能做到高效運(yùn)營,那么,如何突破因商業(yè)環(huán)境復(fù)雜度而導(dǎo)致的企業(yè)失控呢?并在復(fù)雜的商業(yè)競(jìng)爭(zhēng)環(huán)境中脫穎而出并獲得最大利潤(rùn)呢?答案是掌握企業(yè)數(shù)據(jù)和掌握國際化數(shù)據(jù),并建立高效的數(shù)據(jù)分析體系,探索數(shù)據(jù)、挖掘數(shù)據(jù)高效準(zhǔn)確的獲取國際化的經(jīng)濟(jì)環(huán)境狀況,洞察市場(chǎng)趨勢(shì)提前做出有利于企業(yè)的戰(zhàn)略決策,提高企業(yè)競(jìng)爭(zhēng)力,規(guī)避市場(chǎng)風(fēng)險(xiǎn),數(shù)據(jù)分析則是提升企業(yè)管理水平,實(shí)現(xiàn)上述目標(biāo)的一種行之有效的方法。國際化的競(jìng)爭(zhēng)就是信息的國際化競(jìng)爭(zhēng)。
隨著大數(shù)據(jù)、人工智能的快速發(fā)展,數(shù)據(jù)的價(jià)值越發(fā)突顯,并為海量的高并發(fā)的數(shù)據(jù)分析提供了新的工具與可行性,較以往的傳統(tǒng)數(shù)據(jù)分析工具更為有效,甚至傳統(tǒng)數(shù)據(jù)分析工具做不到的,大數(shù)據(jù)、人工智能都能做到。因此不僅僅企業(yè),社會(huì)各個(gè)方面也因大數(shù)據(jù)的價(jià)值而提高了對(duì)數(shù)據(jù)的關(guān)注程度,也加大了數(shù)據(jù)分析的投入力度。無論是企業(yè)管理、戰(zhàn)略決策、精準(zhǔn)營銷、精細(xì)化管理等都無處不體現(xiàn)著數(shù)據(jù)分析的重要性。
數(shù)據(jù)如此重要,如何建設(shè)一個(gè)高效的數(shù)據(jù)分析體系呢?至少要具備以下兩個(gè)條件:一是在宏觀層面上正確理解數(shù)據(jù)分析;二是豐富的IT系統(tǒng)建設(shè)經(jīng)驗(yàn)、分布式技術(shù)和較強(qiáng)的數(shù)據(jù)技術(shù)能力。第一點(diǎn)尤為重要,因?yàn)橐坏┰谒枷牒驼J(rèn)識(shí)層面對(duì)數(shù)據(jù)分析體系理解有誤,那么即使精通于各種技術(shù)方案,所建立起來的也只是一堆技術(shù)架構(gòu)的粗糙堆砌,雖然也能達(dá)到部分數(shù)據(jù)分析的效果,但必定會(huì)事倍功半。構(gòu)建數(shù)據(jù)分析體系包括四個(gè)層面:一是數(shù)據(jù)基礎(chǔ)平臺(tái);二是數(shù)據(jù)報(bào)表與可視化;三是精細(xì)化業(yè)務(wù)分析;四是戰(zhàn)略分析與決策。如下圖為數(shù)據(jù)分析體系結(jié)構(gòu)圖。
大數(shù)據(jù)體系構(gòu)建">那么在數(shù)據(jù)基礎(chǔ)平臺(tái)建設(shè)層面,均采用大數(shù)據(jù)平臺(tái),如Hadoop、Spark等大數(shù)據(jù)平臺(tái),其好處是開源、可控,無需從零開始搭建平臺(tái)節(jié)約成本;也避免了因大數(shù)據(jù)的多樣性、隱私性等特點(diǎn)導(dǎo)致供應(yīng)無法深入挖掘數(shù)據(jù)的問題。為什么要自建數(shù)據(jù)分析平臺(tái)呢?不能采購嗎?答案是不能采購,只能自建!因?yàn)閿?shù)據(jù)挖掘一個(gè)持續(xù)的過程,日常企業(yè)經(jīng)常過程產(chǎn)生的數(shù)據(jù)、市場(chǎng)數(shù)據(jù)都是需要分析的,是一個(gè)持續(xù)不斷的工作,不是編寫幾個(gè)算法了事的,所以如果從供應(yīng)商采購必然會(huì)導(dǎo)致分析工作不夠深入與不夠?qū)I(yè),數(shù)據(jù)的價(jià)值是隱藏在數(shù)據(jù)中的,需要不斷的持續(xù)的挖掘才能找的,不是算法和分析工具能做到的。因此企業(yè)需要自建數(shù)據(jù)分析平臺(tái),而不采購分析工具。
Hadoop、Spark生態(tài)系統(tǒng)是大數(shù)據(jù)技術(shù)事實(shí)標(biāo)準(zhǔn),是大數(shù)據(jù)思想、理念、機(jī)制的具體實(shí)現(xiàn),是整個(gè)大數(shù)據(jù)技術(shù)中公認(rèn)的核心框架和具有極強(qiáng)的使用價(jià)值與研究?jī)r(jià)值。Hadoop?系統(tǒng)是一款開源軟件,能夠處理海量的各種結(jié)構(gòu)(包括結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化)的數(shù)據(jù)。
Hadoop是分布式集群框架,可以管理成百上千臺(tái)x86服務(wù)器集群。基于 Hadoop?的解決方案能夠幫助企業(yè)應(yīng)對(duì)多種大數(shù)據(jù)挑戰(zhàn),包括:
- 分析海量(PB?級(jí)或者更多)的數(shù)據(jù)
Hadoop?能夠分析所有數(shù)據(jù),使得分析更準(zhǔn)確,預(yù)測(cè)更精確;
- 從多個(gè)數(shù)據(jù)類型的組合中獲得新的洞察力
將來自多個(gè)數(shù)據(jù)源的不同類型的數(shù)據(jù)進(jìn)行結(jié)合分析,發(fā)現(xiàn)新的數(shù)據(jù)關(guān)系和洞察力;
- 存儲(chǔ)大量的數(shù)據(jù)
由于它不依賴于高端硬件,且是可擴(kuò)展的,所以使存儲(chǔ)大量數(shù)據(jù)變得經(jīng)濟(jì)有效;
- 數(shù)據(jù)發(fā)現(xiàn)(data discovery)和研究的沙箱
Hadoop?提供了一個(gè)地方,數(shù)據(jù)科學(xué)家可在此發(fā)現(xiàn)新的數(shù)據(jù)關(guān)系和相互依賴性。
?
工業(yè)和信息化部電信研究院于2014年5月發(fā)布的“大數(shù)據(jù)白皮書”中指出:
“2012?年美國聯(lián)邦政府就在全球率先推出“大數(shù)據(jù)行動(dòng)計(jì)劃(Big data initiative)”,重點(diǎn)在基礎(chǔ)技術(shù)研究和公共部門應(yīng)用上加大投入。在該計(jì)劃支持下,加州大學(xué)伯克利分校開發(fā)了完整的大數(shù)據(jù)開源軟件平臺(tái)“伯克利數(shù)據(jù)分析軟件棧(Berkeley Data Analytics Stack),其中的內(nèi)存計(jì)算軟件Spark的性能比Hadoop?提高近百倍,對(duì)產(chǎn)業(yè)界大數(shù)據(jù)技術(shù)走向產(chǎn)生巨大影響”
????????????????????????????????????????? ----來源:工業(yè)和信息化部電信研究院
?

?
Spark是成為替代MapReduce架構(gòu)的大數(shù)據(jù)分析技術(shù),Spark的大數(shù)據(jù)生態(tài)體系包括流處理、圖技術(shù)、機(jī)器學(xué)習(xí)等各個(gè)方面,并且已經(jīng)成為Apache頂級(jí)項(xiàng)目,可以預(yù)計(jì)的是2014年下半年到2015年在社區(qū)和商業(yè)應(yīng)用上會(huì)有爆發(fā)式的增長(zhǎng)。

?
國內(nèi)外一些大型互聯(lián)網(wǎng)公司已經(jīng)部署了Spark,并且它的高性能已經(jīng)得到實(shí)踐的證明。國外Yahoo已在多個(gè)項(xiàng)目中部署Spark,尤其在信息推薦的項(xiàng)目中得到深入的應(yīng)用;國內(nèi)的淘寶、愛奇異、優(yōu)酷土豆、網(wǎng)易、baidu、騰訊等大型互聯(lián)網(wǎng)企業(yè)已經(jīng)將Spark應(yīng)用于自己的生產(chǎn)系統(tǒng)中。國內(nèi)外的應(yīng)用開始越來越廣泛。Spark正在逐漸走向成熟,并在這個(gè)領(lǐng)域扮演更加重要的角色。
?
(2)培訓(xùn)目標(biāo)
本次數(shù)據(jù)分析技術(shù)培訓(xùn)課程,整個(gè)課程體系設(shè)計(jì)完備,思路清晰,學(xué)員通過本次課程的系統(tǒng)性學(xué)習(xí)可以掌握如下技能:
- 了解數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈,數(shù)據(jù)分析與大數(shù)據(jù)等內(nèi)容;
- 學(xué)會(huì)數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理。掌握大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容;
- 掌握數(shù)據(jù)分析與挖掘基礎(chǔ)。學(xué)習(xí)常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。
- 學(xué)習(xí)數(shù)據(jù)分析工具R語言的數(shù)據(jù)分析實(shí)戰(zhàn)。學(xué)習(xí)R語言入門基礎(chǔ),描述性統(tǒng)計(jì)分析, 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容。
- 介紹大數(shù)據(jù)工具之Hadoop。深入理解Hadoop原理及組件介紹,Hadoop數(shù)據(jù)分析入門等內(nèi)容。
- 介紹大數(shù)據(jù)工具之Spark。深入剖析Spark基本概念,Spark開發(fā)與數(shù)據(jù)分析等內(nèi)容。
- 編寫Pyspark集群調(diào)度與數(shù)據(jù)處理程序。使用Python調(diào)度spark集群并進(jìn)行數(shù)據(jù)處理等內(nèi)容。
- 學(xué)習(xí)大數(shù)據(jù)可視化技術(shù)。包括數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述,數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
- 學(xué)習(xí)Python與數(shù)據(jù)分析實(shí)戰(zhàn)。包括Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機(jī)器學(xué)習(xí),Python數(shù)據(jù)分析案例分享,基于spark集群的python數(shù)據(jù)分析實(shí)戰(zhàn)等內(nèi)容。
?
通過以上的系統(tǒng)學(xué)習(xí),學(xué)員會(huì)建立完整的數(shù)據(jù)知識(shí)體系,使學(xué)員正確認(rèn)識(shí)大數(shù)據(jù),掌握大數(shù)據(jù)思維方法,為工作、生活和學(xué)習(xí)打下堅(jiān)實(shí)的基礎(chǔ),為持續(xù)成長(zhǎng)提供原動(dòng)力。下圖為本次課程結(jié)束后學(xué)員獲取的完整數(shù)據(jù)知識(shí)體系如下圖。

完整數(shù)據(jù)知識(shí)體系
(3)教學(xué)計(jì)劃
本系列課程總共由9門課程組成:
教學(xué)設(shè)計(jì) | NO. | 課程名稱 | 課程天數(shù) |
| 基礎(chǔ)與概述 | 1 | 數(shù)據(jù)分析概述 | 1天 |
2 | 數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理 | 5天 | |
| 數(shù)據(jù)分析與數(shù)據(jù)挖掘核心技術(shù)講解及案例實(shí)操 | 3 | 數(shù)據(jù)分析與挖掘基礎(chǔ) | 6天 |
4 | R語言數(shù)據(jù)分析實(shí)戰(zhàn) | 6天 | |
| 大數(shù)據(jù)技術(shù)講解與編程實(shí)操 | 5 | 大數(shù)據(jù)工具介紹之Hadoop | 2天 |
6 | 大數(shù)據(jù)工具介紹之Spark | 3天 | |
7 | Pyspark集群調(diào)度與數(shù)據(jù)處理 | 2天 | |
| 大數(shù)據(jù)可視化 | 8 | 大數(shù)據(jù)可視化 | 2天 |
| Python與數(shù)據(jù)分析實(shí)戰(zhàn) | 9 | Python與數(shù)據(jù)分析實(shí)戰(zhàn) | 13天 |
?
???????? 第1-2門課屬于基礎(chǔ)與概述,包括數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈,數(shù)據(jù)分析與大數(shù)據(jù)等內(nèi)容。大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容。
???????? 第3-4門課程數(shù)據(jù)分析與數(shù)據(jù)挖掘核心技術(shù)講解及案例實(shí)操,包括常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。R語言入門基礎(chǔ),描述性統(tǒng)計(jì)分析, 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容。。
???????? 第5-7門課程主要大數(shù)據(jù)技術(shù)講解與編程實(shí)操,包括Hadoop原理及組件介紹,Hadoop數(shù)據(jù)分析入門等內(nèi)容。Spark基本概念,Spark開發(fā)與數(shù)據(jù)分析等內(nèi)容。使用Python調(diào)度spark集群并進(jìn)行數(shù)據(jù)處理等內(nèi)容。
???????? 第8門是大數(shù)據(jù)可視化。包括數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述,數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
???????? 第9門是Python與數(shù)據(jù)分析實(shí)戰(zhàn)。包括Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機(jī)器學(xué)習(xí),Python數(shù)據(jù)分析案例分享,基于spark集群的python數(shù)據(jù)分析實(shí)戰(zhàn)等內(nèi)容。
?
(4)具體課程方案(含課程大綱)
課程1:數(shù)據(jù)分析概述-1天
【匹配關(guān)鍵知識(shí)點(diǎn)】
數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈,數(shù)據(jù)分析與大數(shù)據(jù)等內(nèi)容。
【課程時(shí)間】
1天(6小時(shí)/天)
【課程簡(jiǎn)介】
本課程介紹大數(shù)據(jù)體系構(gòu)建數(shù)據(jù)平臺(tái),重點(diǎn)內(nèi)容包括數(shù)據(jù)平臺(tái)基礎(chǔ)理論、數(shù)據(jù)集成、數(shù)據(jù)維度等知識(shí)點(diǎn);本課程讓學(xué)員掌握基于大數(shù)據(jù)生態(tài)的數(shù)據(jù)分析知識(shí)、大數(shù)據(jù)生態(tài)體系技術(shù)選型,能夠應(yīng)用建模技術(shù)、大數(shù)據(jù)技術(shù)構(gòu)建數(shù)據(jù)平臺(tái)。
隨著大數(shù)據(jù)時(shí)代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,數(shù)據(jù)分析、數(shù)據(jù)建模、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等重要性越發(fā)突出,本課程是針對(duì)大數(shù)據(jù)時(shí)代的特點(diǎn),尹老師總結(jié)多年數(shù)據(jù)分析經(jīng)驗(yàn),而精心設(shè)計(jì)的課程,課程內(nèi)容涵蓋了數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等內(nèi)容的應(yīng)用范圍、發(fā)展前景剖析。
【課程收益】
1、數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈等內(nèi)容;
2、數(shù)據(jù)分析與大數(shù)據(jù)等內(nèi)容;
【課程特點(diǎn)】
數(shù)據(jù)分析基本概念及產(chǎn)業(yè)鏈,數(shù)據(jù)分析與大數(shù)據(jù)等內(nèi)容
【課程對(duì)象】
????? 數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
????? 將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
????? 希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員
????? 系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
????? 具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(1天*6小時(shí))
時(shí)間 | 內(nèi)容 | 案例實(shí)踐與練習(xí) |
Day1 |
| 案例練習(xí):通過大數(shù)據(jù)企業(yè)應(yīng)用障礙分析案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:大數(shù)據(jù)企業(yè)應(yīng)用障礙分析 |
?
課程2:數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理-5天
【匹配關(guān)鍵知識(shí)點(diǎn)】
大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容。
【課程時(shí)間】
5天(6小時(shí)/天)
?
【課程簡(jiǎn)介】
隨著大數(shù)據(jù)時(shí)代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,大數(shù)據(jù)領(lǐng)域如雨后春筍般的出現(xiàn)大量的新技術(shù),如Hadoop、Spark等技術(shù),其中Python語言已經(jīng)成為大數(shù)據(jù)技術(shù)中最為重要的一部分,被越來越多的企業(yè)所使用。Python語言的功能涵蓋了大數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能、大數(shù)據(jù)應(yīng)用開發(fā)等各種不同類型的計(jì)算操作,應(yīng)用范圍廣泛、前景非常廣闊。本課程是尹老師多年工作經(jīng)驗(yàn)的總結(jié)和歸納,從實(shí)際業(yè)務(wù)案例為入口,使學(xué)員從理論層到實(shí)操層面系統(tǒng)的學(xué)習(xí)數(shù)據(jù)處理技術(shù),使學(xué)員深入理解Python語言等數(shù)據(jù)分析工具。通過本課程的學(xué)習(xí),學(xué)員即可以正確的分析企業(yè)的數(shù)據(jù),為管理者、決策層提供數(shù)據(jù)支撐。
【課程收益】
1、大數(shù)據(jù)生成與導(dǎo)入;
2、數(shù)據(jù)分析流程與建模思想;
3、數(shù)據(jù)清洗與數(shù)據(jù)加工。
【課程特點(diǎn)】
大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容。
【課程對(duì)象】
????? 數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
????? 將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
????? 希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員
????? 系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
????? 具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(5天*6小時(shí))
時(shí)間 | 內(nèi)容 | 案例實(shí)踐與練習(xí) |
Day1 數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理 |
| 案例練習(xí):通過數(shù)據(jù)整理的編程和應(yīng)用案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:數(shù)據(jù)整理的編程和應(yīng)用 |
Day2 數(shù)據(jù)清洗與數(shù)據(jù)加工 |
? | 案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:數(shù)據(jù)模型案例分析 |
Day3 大數(shù)據(jù)生成與導(dǎo)入 |
| 案例練習(xí):通過淘寶雙十一案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:淘寶雙十一 |
Day4 |
| 案例研討:通過數(shù)據(jù)挖掘案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:數(shù)據(jù)挖掘 |
Day5 數(shù)據(jù)分析流程與建模思想 |
| 案例練習(xí):通過企業(yè)實(shí)踐案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:企業(yè)實(shí)踐案例分享 |
Day5 數(shù)據(jù)的統(tǒng)計(jì)學(xué)知識(shí)和模型 | 案例練習(xí):通過數(shù)據(jù)模型的應(yīng)用案例剖析案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:數(shù)據(jù)模型的應(yīng)用案例剖析 |
?
課程3:數(shù)據(jù)分析與挖掘基礎(chǔ)-6天
【匹配關(guān)鍵知識(shí)點(diǎn)】
常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。
【課程時(shí)間】
6天(6小時(shí)/天)
【課程簡(jiǎn)介】
隨著大數(shù)據(jù)時(shí)代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,數(shù)據(jù)分析、數(shù)據(jù)建模、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、人工智能等重要性越發(fā)突出,本課程是針對(duì)大數(shù)據(jù)時(shí)代的特點(diǎn),尹老師總結(jié)多年數(shù)據(jù)分析經(jīng)驗(yàn),而精心設(shè)計(jì)的課程,課程內(nèi)容涵蓋了數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、人工智能等內(nèi)容,以及人工智能的應(yīng)用范圍、發(fā)展前景剖析。
【課程收益】
1、常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述;
2、描述型數(shù)據(jù)分析;
3、常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等。
【課程特點(diǎn)】
常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。
【課程對(duì)象】
????? 數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
????? 將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
????? 希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員
????? 系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
????? 具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(6天*6小時(shí))
時(shí)間 | 內(nèi)容 | 案例實(shí)踐與練習(xí) |
Day1 常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述 |
? | 案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:數(shù)據(jù)分析的過程 |
Day2 |
? | 案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:描述性數(shù)據(jù)分析 |
Day3 常見數(shù)據(jù)分析與挖掘算法 |
| 案例研討:通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:常用數(shù)據(jù)分析方法與算法 |
Day4 樸素貝葉斯與回歸分析 |
?
? ?
? ?
?
? ?
?
| 案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:主成分分析模型實(shí)現(xiàn) |
Day5 聚類分析與關(guān)聯(lián)規(guī)則挖掘 | ?
?
?
| 案例練習(xí):通過編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例剖析 |
Day6 決策樹與隨機(jī)森林 | ?
? ?
| 案例練習(xí):通過實(shí)現(xiàn)航空業(yè)客戶細(xì)分模型案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:實(shí)現(xiàn)航空業(yè)客戶細(xì)分模型 |
?
課程4:R語言數(shù)據(jù)分析實(shí)戰(zhàn)-6天
【匹配關(guān)鍵知識(shí)點(diǎn)】
R語言入門基礎(chǔ),描述性統(tǒng)計(jì)分析, 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容。
【課程時(shí)間】
6天(6小時(shí)/天)
?
【課程簡(jiǎn)介】
R語言由新西蘭奧克蘭大學(xué)ross ihaka和robert gentleman?開發(fā)。R語言是自由軟件,具有非常強(qiáng)大的統(tǒng)計(jì)分析和作圖功能,而且具有非常豐富的網(wǎng)上資源,目前R軟件有3000多種貢獻(xiàn)包,幾乎可以實(shí)現(xiàn)所有的統(tǒng)計(jì)方法,目前大部分的頂級(jí)統(tǒng)計(jì)學(xué)家和計(jì)量經(jīng)濟(jì)學(xué)家都使用R語言,而且越來越多的數(shù)據(jù)分析實(shí)務(wù)人員也開始使用R語言。學(xué)習(xí)R軟件正成為一種趨勢(shì)。
R語言具有簡(jiǎn)單易學(xué),功能強(qiáng)大,體積小(僅30M),完全免費(fèi),可自由開發(fā)等特點(diǎn),且R語言和S語言語法基本相同,絕大部分程序是互相兼容的。
R軟件最優(yōu)美的地方是它能夠修改很多前人編寫的包的代碼做各種你所需的事情,實(shí)際你是站在巨人的肩膀上。
【課程收益】
1、R語言入門基礎(chǔ);
2、描述性統(tǒng)計(jì)分析;
3、用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容;
【課程特點(diǎn)】
R語言入門基礎(chǔ),描述性統(tǒng)計(jì)分析, 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn)等內(nèi)容。
【課程對(duì)象】
????? 數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
????? 將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
????? 希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員
????? 系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
????? 具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(6天*6小時(shí))
時(shí)間 | 內(nèi)容 | 案例實(shí)踐與練習(xí) |
Day1 R語言入門基礎(chǔ) | ?
?
| 案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:R語言編程 |
Day2 R語言繪圖功能 | ?
| 案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:R語言繪圖 |
Day3 R語言與外部數(shù)據(jù)交互 | ?
? | 案例研討:通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:R語言與RDBMS交互 |
Day4 描述性統(tǒng)計(jì)分析 | ?
?
? | 案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:描述性統(tǒng)計(jì)分析 |
Day5 用R語言做數(shù)據(jù)挖掘?qū)崙?zhàn) | ?
? ?
?
?
?
| 案例練習(xí):通過用戶離網(wǎng)預(yù)測(cè)案例的剖析數(shù)據(jù)分析過程,體會(huì)數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。 ? 研討:用戶離網(wǎng)預(yù)測(cè) |
Day6 用R語言文本數(shù)據(jù)挖掘?qū)崙?zhàn) | ?
?
?
|





