大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘及案例(含CRISP-DM方法論)
培訓(xùn)講師:段方
講師背景:
段方專業(yè)背景:曾在中國銀行工作現(xiàn)任某集團(tuán)總部大數(shù)據(jù)專家、數(shù)據(jù)倉庫項(xiàng)目經(jīng)理多家培訓(xùn)機(jī)構(gòu)及大學(xué)總裁班特邀講師十幾年專注于大數(shù)據(jù)的研究與推廣積累了15年的大數(shù)據(jù)領(lǐng)域的實(shí)際工作經(jīng)驗(yàn)。帶領(lǐng)相關(guān)的團(tuán)隊(duì),從系統(tǒng)創(chuàng)建到系統(tǒng)運(yùn)營,開發(fā)了很多大數(shù)據(jù)領(lǐng)域的各種應(yīng) 詳細(xì)>>
大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘及案例(含CRISP-DM方法論)詳細(xì)內(nèi)容
大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘及案例(含CRISP-DM方法論)
一、“大數(shù)據(jù)、大機(jī)會”:
1.概述
1)大數(shù)據(jù)概念和特點(diǎn)
2)大數(shù)據(jù)需要哪些技術(shù)支撐
3)大數(shù)據(jù)能夠帶來哪些新應(yīng)用?
2.大數(shù)據(jù)時(shí)代帶來對傳統(tǒng)營銷的挑戰(zhàn)
1)大數(shù)據(jù)如何成為資產(chǎn)?——GOOGLE的市值遠(yuǎn)超過制造企業(yè)
2)大數(shù)據(jù)如何體現(xiàn)精細(xì)營銷
3)大數(shù)據(jù)的價(jià)值——靠空調(diào)電表判斷氣候趨勢(“指數(shù)”)
3.大數(shù)據(jù)時(shí)代的“互聯(lián)網(wǎng)思維”營銷模式
1) 互聯(lián)網(wǎng)思維——先圈用戶再掙錢
2)互聯(lián)網(wǎng)的營銷模式——微博營銷、網(wǎng)頁營銷等
3) CRM——“舊貌煥發(fā)新顏”
4)精細(xì)營銷——裝上了GPS,實(shí)現(xiàn)“精確打擊”
4.如何在海量數(shù)據(jù)中整合線上、線下數(shù)據(jù),形成你對客戶的獨(dú)特洞察力
1)知道客戶的各個(gè)屬性——互聯(lián)網(wǎng)時(shí)代不再“是否是狗”
2)客戶的群體特征——“人以群分”
5.如何建立產(chǎn)品分析的數(shù)據(jù)平臺,提供產(chǎn)品的“標(biāo)尺”
1)產(chǎn)品的數(shù)據(jù)有哪些?
2)產(chǎn)品設(shè)計(jì)的互聯(lián)網(wǎng)思維?——小米手機(jī)
3)產(chǎn)品的大數(shù)據(jù)分析——哪些維度?
4)如何“產(chǎn)品為中心”發(fā)展為“客戶為中心”?——有數(shù)據(jù)就有可能
6.大數(shù)據(jù)對企業(yè)的精細(xì)管理提升
1)企業(yè)的精細(xì)管理——不再盲人摸象
2)企業(yè)的KPI儀表板——進(jìn)入駕駛艙
3)預(yù)防企業(yè)的管理風(fēng)險(xiǎn)——早診斷、早發(fā)現(xiàn)
4)員工的量化績效評定——計(jì)件之后計(jì)量
7.大數(shù)據(jù)提升企業(yè)的產(chǎn)品質(zhì)量
1)建立量化的產(chǎn)品管理方法——辣椒的辣度評定
2)產(chǎn)品制造過程的管理控制——監(jiān)控大數(shù)據(jù)分析
3)產(chǎn)品問題的及時(shí)監(jiān)控——溫度、風(fēng)速等異常早發(fā)現(xiàn)
4)產(chǎn)品訂制的范例——好萊塢大片的大數(shù)據(jù)
5)產(chǎn)品質(zhì)量的量化管控——擋板安裝的故事
二、大數(shù)據(jù)的“數(shù)據(jù)挖掘技術(shù)”
1. 數(shù)據(jù)挖掘概述
1)基本概念——“啤酒和尿布的故事”
2)與講師系統(tǒng)、統(tǒng)計(jì)分析、人工智能的關(guān)系——演進(jìn)歷史分析
3)數(shù)據(jù)挖掘在制造行業(yè)的應(yīng)用內(nèi)容——如何體現(xiàn)“智能制造”?
2. CRISP-DM過程描述
1)商業(yè)理解——要實(shí)現(xiàn)什么“目的”?
2)數(shù)據(jù)的理解以及收集——手里有哪些數(shù)據(jù)?
3)數(shù)據(jù)的準(zhǔn)備——數(shù)據(jù)的清洗及轉(zhuǎn)換
4)應(yīng)用數(shù)據(jù)挖掘工具建立模型——使用哪種數(shù)據(jù)挖掘算法和工具?
5)模型評估——算法評估
6)部署(并形成數(shù)據(jù)挖掘報(bào)告)——實(shí)際使用及形成報(bào)告
3. 數(shù)據(jù)挖掘常用算法介紹
預(yù)測型
1)分類算法
2)回歸分析
3)時(shí)間序列
描述型
4)關(guān)聯(lián)分析
5)序列關(guān)聯(lián)分析
6)聚類分析
4.數(shù)據(jù)挖掘具體算法舉例
1)神經(jīng)網(wǎng)絡(luò)算法
2)決策樹算法
5.根據(jù)實(shí)際問題選擇數(shù)據(jù)挖掘算法
1)客戶離網(wǎng)分析
2)客戶分群模型
3)產(chǎn)品關(guān)聯(lián)分析
4)問題的描述
需要解決的關(guān)鍵問題
如何轉(zhuǎn)換成為數(shù)據(jù)挖掘的描述
數(shù)據(jù)挖掘算法的選擇依據(jù)
預(yù)測類還是描述類
與各種算法的使用特點(diǎn)結(jié)合
6.分析結(jié)果的檢驗(yàn)
對照組數(shù)據(jù)的選擇方法
對照組數(shù)據(jù)的時(shí)間窗口選擇
對照組數(shù)據(jù)的抽樣
數(shù)據(jù)挖掘模型的修訂
1)如何剔除無效的結(jié)果數(shù)據(jù)
2) 根據(jù)反饋結(jié)果進(jìn)行模型修訂
7.數(shù)據(jù)挖掘項(xiàng)目的投入產(chǎn)出
數(shù)據(jù)挖掘項(xiàng)目的投入成本計(jì)算
數(shù)據(jù)挖掘項(xiàng)目的產(chǎn)出計(jì)算依據(jù)
8. 如何形成分析報(bào)告
1)分析報(bào)告的組成部分
2)部分優(yōu)秀的分析報(bào)告演示
9.常用數(shù)據(jù)挖掘工具介紹
1)SAS
2 ) SPSS
三、數(shù)據(jù)挖掘具體案例分析
某電信公司具體數(shù)據(jù)挖掘案例(某產(chǎn)品營銷)詳細(xì)舉例
1. 商業(yè)理解:提升哪個(gè)KPI指標(biāo)?(ARPU/MOU等)
2. 數(shù)據(jù)理解及收集:哪些具體的數(shù)據(jù)(客戶詳單、客戶資料等)
3. 數(shù)據(jù)準(zhǔn)備:
1)客戶數(shù)據(jù)質(zhì)量分析
如何保障數(shù)據(jù)質(zhì)量——哪些衡量指標(biāo)
如何發(fā)現(xiàn)異常數(shù)據(jù)——剔除干擾數(shù)據(jù)
2)客戶數(shù)據(jù)抽樣過程
抽樣比例分析
抽樣的具體方法
3)挖掘應(yīng)用需求描述
如何篩選有用數(shù)據(jù)——選擇相關(guān)變量和匯總數(shù)據(jù)
如何描述需求
4.數(shù)據(jù)挖掘工具建立模型
挖掘算法選擇
如何選擇合適的分析方法
如何剔除無效的干擾數(shù)據(jù)
選擇關(guān)鍵變量
挖掘具體過程
結(jié)果數(shù)據(jù)分析
5.模型(算法)評估
LIFT值等分析
6.實(shí)際部署及分析報(bào)告
實(shí)際分析報(bào)告編寫示例
如何計(jì)算該項(xiàng)目的投入、產(chǎn)出
項(xiàng)目的投入計(jì)算依據(jù)
項(xiàng)目的產(chǎn)出計(jì)算方法
項(xiàng)目的投入/產(chǎn)出結(jié)果
四、基礎(chǔ)數(shù)據(jù)的收集和整理
1、數(shù)據(jù)的種類
1)客戶數(shù)據(jù)內(nèi)容(保險(xiǎn)客戶的基本資料)
2)產(chǎn)品數(shù)據(jù)內(nèi)容(產(chǎn)品的編碼)
3)營銷數(shù)據(jù)內(nèi)容(交易記錄的保存)
4)服務(wù)數(shù)據(jù)內(nèi)容(客戶服務(wù)數(shù)據(jù)的保存)
5)制造行業(yè)數(shù)據(jù)的特點(diǎn):(數(shù)據(jù)類型雜、數(shù)據(jù)量大等)
2、數(shù)據(jù)的存放方法
1)數(shù)據(jù)的清洗、轉(zhuǎn)換和加載
2)存放在數(shù)據(jù)庫/數(shù)據(jù)倉庫
3)數(shù)據(jù)的基本分析工具EXCEL等
3、數(shù)據(jù)的基本整理
1)數(shù)據(jù)的歸類存放(建模型)
2)數(shù)據(jù)的基本加工
4、數(shù)據(jù)的基礎(chǔ)分析
1)數(shù)據(jù)的基本匯總
2)數(shù)據(jù)中的“金子”:從石頭中淘金子
5、數(shù)據(jù)質(zhì)量的基本保障
1)指標(biāo)的口徑描述和統(tǒng)一
2)后期補(bǔ)數(shù)據(jù)成本是前提收集數(shù)據(jù)成本的15倍
3)“差之毫厘謬以千里”
6、制造業(yè)企業(yè)數(shù)據(jù)的收集和整理
1)制造環(huán)境的數(shù)據(jù)收集/整理
2)采購數(shù)據(jù)的收集/整理
3)營銷數(shù)據(jù)的收集/整理:
4)人力資源數(shù)據(jù)的收集/整理
示例:某企業(yè)的數(shù)據(jù)收集/整理方案
五、云計(jì)算技術(shù)
1.Hadoop項(xiàng)目簡介
2.HDFS體系結(jié)構(gòu)
3.HDFS關(guān)鍵運(yùn)行機(jī)制
4.MapReduce產(chǎn)生背景
5.MapReduce編程模型
6.MapReduce實(shí)現(xiàn)機(jī)制
7.MapReduce案例分析
8.HIVE介紹
9.HBASE介紹
六、總結(jié)和展望
段方老師的其它課程
中國廣電5G運(yùn)營策略 04.24
=============================================================《中國廣電5G運(yùn)營策略》——段方中國移動資深專家教授北京大學(xué)博士后=============================================================15G發(fā)展概述1.15G概述1.25G技術(shù)特征1.
講師:段方詳情
=============================================================《人工智能基礎(chǔ)及應(yīng)用培訓(xùn)》-段方某世界100強(qiáng)大數(shù)據(jù)/AI總設(shè)計(jì)師教授北京大學(xué)博士后=============================================================202916811801概述--
講師:段方詳情
數(shù)據(jù)安全技術(shù) 04.24
《數(shù)據(jù)安全技術(shù)》-段方某世界100強(qiáng)企業(yè)大數(shù)據(jù)總設(shè)計(jì)師教授北京大學(xué)博士后1概述1.1信息安全的概念及范圍1.1.1概述1.1.2信息系統(tǒng)潛在威脅被動攻擊主動攻擊黑客攻擊手法1.1.3信息安全技術(shù)概覽1.1.4信息安全注重體系安全防護(hù)檢測響應(yīng)恢復(fù)1.2信息安全等級分類1.2.1分級的概念1.2.2分級保護(hù)涉及的標(biāo)準(zhǔn)1.2.3職責(zé)和角色1.2.4企業(yè)信息等級選擇
講師:段方詳情
數(shù)據(jù)管理及數(shù)倉建模 04.24
=============================================================《數(shù)據(jù)管理及數(shù)倉建模》-段方某世界100強(qiáng)企業(yè)大數(shù)據(jù)/AI總設(shè)計(jì)師教授北京大學(xué)博士后=============================================================13465791461概述---
講師:段方詳情
=============================================================《數(shù)智化發(fā)展及運(yùn)用案例分析》-段方某世界100強(qiáng)企業(yè)大數(shù)據(jù)/AI總設(shè)計(jì)師教授北京大學(xué)博士后=============================================================23704858471概念
講師:段方詳情
=============================================================《數(shù)字經(jīng)濟(jì)時(shí)代內(nèi)部審計(jì)實(shí)戰(zhàn)技能提升》——段方某世界100強(qiáng)企業(yè)大數(shù)據(jù)/AI總設(shè)計(jì)師教授北京大學(xué)博士后=============================================================13465791
講師:段方詳情
=============================================================《鐵路行業(yè)的數(shù)字化轉(zhuǎn)型》——段方某世界100強(qiáng)企業(yè)大數(shù)據(jù)/AI總設(shè)計(jì)師教授北京大學(xué)博士后=============================================================13465762131為什么
講師:段方詳情
《信息技術(shù)的國產(chǎn)化發(fā)展與展望》-段方總設(shè)計(jì)師教授北京大學(xué)博士后1概述1.1信息技術(shù)的發(fā)展概況1.2盜版軟件的雙刃劍1.3美國為何在信息技術(shù)領(lǐng)域?qū)χ袊M(jìn)行限制1.4中國如何選擇應(yīng)對的方法?2信息技術(shù)國產(chǎn)化現(xiàn)狀2.1操作系統(tǒng)方面2.2芯片方面2.3數(shù)據(jù)系統(tǒng)方面2.4工業(yè)軟件方面2.5應(yīng)用軟件方面2.6互聯(lián)網(wǎng)軟件方面2.7計(jì)算機(jī)板卡方面2.8服務(wù)器方面2.9云計(jì)算
講師:段方詳情
《銀行業(yè)與中國科技強(qiáng)國戰(zhàn)略的融合與創(chuàng)新》——段方某世界100強(qiáng)企業(yè)AI/大數(shù)據(jù)總設(shè)計(jì)師教授、北京大學(xué)博士后【課程目的】:本課程旨在深化學(xué)員對中國科技強(qiáng)國戰(zhàn)略的理解,并探討銀行業(yè)如何利用新興科技助力戰(zhàn)略實(shí)施,促進(jìn)業(yè)務(wù)創(chuàng)新和轉(zhuǎn)型升級。通過系統(tǒng)學(xué)習(xí),學(xué)員將能夠識別并應(yīng)對金融科技發(fā)展的趨勢和挑戰(zhàn),為銀行業(yè)的可持續(xù)發(fā)展提供戰(zhàn)略支持?!菊n程提綱】:I.引言A.銀行業(yè)與科
講師:段方詳情
元宇宙概念及應(yīng)用 04.24
=============================================================《元宇宙概念及應(yīng)用》-段方某世界100強(qiáng)企業(yè)資深專家教授北京大學(xué)博士后=============================================================14135907071基本概念--------
講師:段方詳情
- [潘文富] 經(jīng)銷商終端建設(shè)的基本推進(jìn)
- [潘文富] 中小企業(yè)招聘廣告的內(nèi)容完
- [潘文富] 優(yōu)化考核方式,減少員工抵
- [潘文富] 廠家心目中的理想化經(jīng)銷商
- [潘文富] 經(jīng)銷商的產(chǎn)品驅(qū)動與管理驅(qū)
- [王曉楠] 輔警轉(zhuǎn)正方式,定向招錄成為
- [王曉楠] 西安老師招聘要求,西安各區(qū)
- [王曉楠] 西安中小學(xué)教師薪資福利待遇
- [王曉楠] 什么是備案制教師?備案制教
- [王曉楠] 2024年陜西省及西安市最
- 1社會保障基礎(chǔ)知識(ppt) 21163
- 2安全生產(chǎn)事故案例分析(ppt) 20245
- 3行政專員崗位職責(zé) 19057
- 4品管部崗位職責(zé)與任職要求 16226
- 5員工守則 15465
- 6軟件驗(yàn)收報(bào)告 15403
- 7問卷調(diào)查表(范例) 15115
- 8工資發(fā)放明細(xì)表 14558
- 9文件簽收單 14204