大數(shù)據(jù)分析挖掘與可視化最佳實踐培訓班
大數(shù)據(jù)分析挖掘與可視化最佳實踐培訓班詳細內(nèi)容
大數(shù)據(jù)分析挖掘與可視化最佳實踐培訓班
【培訓日期】成都,2022年10月28-30日;北京,2022年12月20-22日
【培訓地點】成都、北京、直播
【培訓重點】
1.數(shù)據(jù)分析實戰(zhàn)
2.數(shù)據(jù)挖掘理論及核心技術
3.大數(shù)據(jù)算法原理及案例實現(xiàn)
4.Python應用實戰(zhàn)
【培訓特色】
1.理論與實踐相結(jié)合、案例分析與行業(yè)應用穿插進行;
2.專家精彩內(nèi)容解析、學員專題討論、分組研究;
3.通過全面知識理解、專題技能和實踐結(jié)合的授課方式。
【課程大綱】
第一天
上午 數(shù)據(jù)分析實戰(zhàn)
第一講 零基礎學Python
講解Python背景、國內(nèi)發(fā)展狀況、基礎語法、數(shù)據(jù)結(jié)構(gòu)及繪圖操作等內(nèi)容。特別針對向量計算這塊,著重介紹Python在這方面的優(yōu)勢及用法。
第二講 數(shù)據(jù)分析方法論
講解統(tǒng)計分析基礎,包括統(tǒng)計學基本概念,假設檢驗,置信區(qū)間等基礎,并結(jié)合數(shù)據(jù)案例說明其使用場景和運用方法。介紹數(shù)據(jù)分析流程和常見分析思路,并結(jié)合案例進行講解。
第三講 數(shù)據(jù)處理技法
從數(shù)據(jù)接入、數(shù)據(jù)統(tǒng)計、數(shù)據(jù)轉(zhuǎn)換等幾個方面進行講解。數(shù)據(jù)接入包含接入MySQL、Oracle、Hadoop等常見數(shù)據(jù)庫操作;數(shù)據(jù)統(tǒng)計包含Pandas包的具體用法和講解;數(shù)據(jù)轉(zhuǎn)換包含對數(shù)據(jù)集的關聯(lián)、合并、重塑等操作。此外,針對海量數(shù)據(jù)的情況下,介紹在Spark平臺上的數(shù)據(jù)處理技術,并結(jié)合真實環(huán)境進行操作講解。
第一天
下午 數(shù)據(jù)挖掘理論及核心技術
第四講 認識數(shù)據(jù)挖掘
講解數(shù)據(jù)挖掘基本概念,細致講解業(yè)務理解、數(shù)據(jù)理解、數(shù)據(jù)準備、建立模型、模型評估、模型部署各環(huán)節(jié)的工作內(nèi)容及相關技術;結(jié)合業(yè)界經(jīng)典場景,講解數(shù)據(jù)挖掘的實施流程和方法體系。
第五講 數(shù)據(jù)挖掘核心技術
細致講解抽樣、分區(qū)、樣本平衡、特征選擇、訓練模型、評估模型等數(shù)據(jù)挖掘核心技術原理,并結(jié)合案例講解其具體實現(xiàn)和用法。尤其針對樣本平衡,重點講解人工合成、代價敏感等算法;針對特征選擇,重點講解特征選擇的核心思路,并結(jié)合Python進行案例演示。
第二天
上午 大數(shù)據(jù)算法原理及案例實現(xiàn)(1)
第六講 特征降維算法及Python實現(xiàn)
降維是大數(shù)據(jù)分析非常重要的算法,它可以在降低極少信息量的情況下,極大地縮小數(shù)據(jù)規(guī)模。主要講解主成分、LDA以及t-SNE原理,并結(jié)合案例進行Python實現(xiàn)。特別地,針對海量數(shù)據(jù)情況下的應用場景,講解實現(xiàn)思路和Python案例。
第七講 決策樹算法及Python實現(xiàn)
決策樹是非常經(jīng)典的算法,一般常見于小數(shù)據(jù)的挖掘。由于決策樹具有極強的可解釋性,針對海量數(shù)據(jù)仍然是非常重要的實用價值。主要講解ID3、C4.5、C5.0以及CART決策樹算法的實現(xiàn)原理,并結(jié)合案例進行Python實現(xiàn)。
第八講 好萊塢百萬級影評數(shù)據(jù)分析與電影推薦實現(xiàn)
實戰(zhàn)部分:基于好萊塢百萬級的影評數(shù)據(jù),對數(shù)據(jù)進行建模、清洗、透視表操作。然后根據(jù)用戶畫像分析不同的用戶喜好通過機器學習算法對不同性別、年齡階段的用戶進行定制化的電影推薦,最后把推薦的電影進行可視化的展示操作
第二天
下午 大數(shù)據(jù)算法原理及案例實現(xiàn)(2)
第九講 因果推理算法及Python實現(xiàn)
大數(shù)據(jù)分析技術可以幫助我們?nèi)グl(fā)現(xiàn)、解決一些業(yè)務問題,然而如何去判斷我們的改進是否生效,是否在業(yè)務指標上呈現(xiàn)過一定的因果邏輯,則是一個重要問題和分析方向。本節(jié)主要介紹因果推理算法,包括貝葉斯推理、狀態(tài)空間模型以及CausalImpact工具等內(nèi)容,并結(jié)合案例進行Python實現(xiàn)。
第十講 深度學習算法及Python實現(xiàn)
對于大數(shù)據(jù)的建模任務,我們可以基于深度學習來實現(xiàn),不僅能夠針對海量數(shù)據(jù)進行建模,其效果也非常不錯。本節(jié)主要講解深度學習的發(fā)展歷程,DBN、DNN等經(jīng)典深度學習算法,深度學習優(yōu)化算法以及一些技巧。同時,介紹Keras、OpenCV庫的使用方法,并結(jié)合案例進行Python實現(xiàn)。
第十一講 采用OpenCV實現(xiàn)計算機視覺技術
實戰(zhàn)部分:基于OpenCV面部模型,完成對圖片和視頻的人臉識別,實戰(zhàn)中會講解OpenCV的重要類和函數(shù)。主要內(nèi)容包括OpenCV庫的安裝和部署、圖像增強、像素操作、圖形分析等各種技術,并且詳細介紹了如何處理來自文件或攝像機的視頻,以及如何檢測和跟蹤移動對象。
第三天
上午 Python應用實戰(zhàn)(一)
第十二講 Python自然語言處理原理及案例
目前文檔數(shù)據(jù)已經(jīng)成為很多企業(yè)重要的資產(chǎn),通過對文檔數(shù)據(jù)進行解析、建模、分析、挖掘、可視化,我們能夠發(fā)現(xiàn)不一樣的洞察。本節(jié)主要講解自然語言處理基本概念和技法,包含分詞、關鍵字提取、文摘提取、文本分類、主題模型、word2vec等內(nèi)容。介紹在深度學習的加持下,與傳統(tǒng)做法的區(qū)別,并使用Python進行案例講解。
第十三講 數(shù)據(jù)分析圖表及Python案例
數(shù)據(jù)可視化是大數(shù)據(jù)分析的重要手段,通過合理地使用圖表,不僅可以簡潔地表達數(shù)據(jù)的含義,高效地發(fā)現(xiàn)問題,還可以為報告的編寫以及數(shù)據(jù)分析web應用增色不少。本節(jié)主要講解常用的數(shù)據(jù)分析圖表及其使用場景,介紹數(shù)據(jù)可視化的方法論,避免生搬硬套的使用圖表,針對不同的業(yè)務場景和需求,合理選擇可視化方法。介紹的工具不限于matplotlib、pycha、pyecharts、ggplot、Bokeh、HoloViews、mpld3、plotly、pygal等常用可視化庫。
第三天
下午 Python應用實戰(zhàn)(二)
第十四講 使用Notebook編寫數(shù)據(jù)分析報告
數(shù)據(jù)分析報告在大數(shù)據(jù)分析過程中具有重要價值,它體現(xiàn)了大數(shù)據(jù)分析的目的、過程和結(jié)果,以及對發(fā)現(xiàn)問題的解讀、改進方案等等,本節(jié)主要講解使用Notebook編寫數(shù)據(jù)分析報告的具體方法,以及編寫數(shù)據(jù)分析報告的方法論,并結(jié)合案例講解其用法。
第十五講 Seaborn可視化開發(fā)實戰(zhàn)
Seaborn是一款不錯的可視化框架,它和 Pandas一樣是建立在 Matplotlib 之上的。可以基于Seaborn快速開發(fā)一個輕量級的數(shù)據(jù)分析web應用。在網(wǎng)頁中嵌入圖表、數(shù)據(jù)以及分析的算法,非常適合打造企業(yè)內(nèi)部的敏捷數(shù)據(jù)分析工具集。本節(jié)主要介紹Pie、Scatter、Radar等等各種可視化解決方案,同時講解一個用Seaborn實現(xiàn)數(shù)據(jù)分析功能(兼圖表)的實際案例,搭建服務器,在企業(yè)內(nèi)部實現(xiàn)輕量級數(shù)據(jù)分析應用。
【講師介紹】
劉老師
10多年的IT領域相關技術研究和項目開發(fā)工作,在長期軟件領域工作過程中,對軟件企業(yè)運作模式有深入研究,熟悉軟件質(zhì)量保障標準ISO9003和軟件過程改進模型CMM/CMMI,在具體項目實施過程中總結(jié)經(jīng)驗,有深刻認識。通曉多種軟件設計和開發(fā)工具。對軟件開發(fā)整個流程非常熟悉,能根據(jù)項目特點定制具體軟件過程,并進行項目管理和監(jiān)控,有很強的軟件項目組織管理能力。對C/C++ 、HTML 5、python、Hadoop、java、java EE、android、IOS、大數(shù)據(jù)、云計算有比較深入的理解和應用,具有較強的移動互聯(lián)網(wǎng)應用需求分析和系統(tǒng)設計能力,熟悉Android框架、IOS框架等技術,了解各種設計模式,能在具體項目中靈活運用。
推薦課程
管理創(chuàng)新與實踐落地 2025-08-29
《管理創(chuàng)新與實踐落地》——管理能力躍遷的必修課主講:鄢茹郡老師培 訓 費:5200元/人/2天(包括聽課費、講義費、午餐費、水果茶點、結(jié)業(yè)證書等);食宿自理。作為管理者,您是否有以下困惑1、個人:自己如何更創(chuàng)新?以及讓員工更創(chuàng)新?2、業(yè)務:如何進行業(yè)務創(chuàng)新,適應快速變化的行業(yè)和市場要求?例如,在推動數(shù)字化轉(zhuǎn)型時,雖然擁有創(chuàng)新意識卻不知道如何去做?在提升服務體...
講師:鄢茹郡詳情
現(xiàn)場數(shù)據(jù)化管控提升生產(chǎn)績效 2025-08-29
現(xiàn)場數(shù)據(jù)化管控提升生產(chǎn)績效培訓費用:4580元(含資料費、午餐費、專家演講費);住宿統(tǒng)一安排,費用自理;授課對象:生產(chǎn)總監(jiān)、生產(chǎn)經(jīng)理、車間主任、生產(chǎn)科長、生產(chǎn)系長、生產(chǎn)線長、質(zhì)量主管、工程主管、倉庫主管、設備主管等管理干部儲備人,以及感興趣的班組長、工段長、領班、生產(chǎn)助理、品管員等。課程背景:沒有表格就沒有管理,沒有數(shù)據(jù)就沒有控制。如何結(jié)合表格驅(qū)動管理?如何...
講師:柳草詳情
遠見卓識——非職權領導力沙盤 2025-08-29
遠見卓識——非職權領導力沙盤培訓費用:5280元授課對象:儲備管理者、一線管理者、中層管理者。課程背景:沙盤模擬訓練作為一門高端體驗式培訓課程,于2000年引入中國,一經(jīng)引進就得到了國內(nèi)企業(yè)和商學院的迅速推廣,并得到廣大參與者的高度評價。從沙盤模擬誕生至今更多的在企業(yè)管理領域服務于企業(yè)在戰(zhàn)略決策、財務分析、信息化管理、團隊建設、領導力、人力資源管理等知識系統(tǒng)...
講師:周一凡詳情
實戰(zhàn)商務禮儀與品質(zhì)商務場景溝通 2025-08-29
《實戰(zhàn)商務禮儀與品質(zhì)商務場景溝通》課程費用:2980元/人 (含培訓費、教材費、場地費、午餐、茶歇費及稅金)參訓對象:適合企業(yè)外勤或窗口員工、企業(yè)中層、管理層、商務人士、高凈值自由職業(yè)者。課程地點:上海課程時間:2天第一期第二期第二期5月15-16日9月25-26日11月28-29日2025年課程費用:2980元/人 (含培訓費、教材費、場地費、午餐、茶歇費...
講師:林郁青詳情
內(nèi)訓師必備:AI助力高效課程開發(fā) 2025-08-29
內(nèi)訓師必備:AI助力高效課程開發(fā)培訓時間/地點:2025年4月11日(星期五)/蘇 州2025年8月29日(星期五)/上 海2025年11月25日(星期二)/上 海收費標準:¥2000/人?含授課費、證書費、資料費、午餐費、茶點費、會務費、稅費?不包含學員往返培訓場地的交通費用、住宿費用、早餐及晚餐證書:頒發(fā)上海市人工智能技術協(xié)會培訓證書。課程目標:掌握與A...
講師:葛老師詳情
基于結(jié)構(gòu)思考的思路整理和高效工作匯報方法 2025-08-29
基于結(jié)構(gòu)思考的思路整理和高效工作匯報方法時間:8月29-30日地點:佛山培訓費用:4380元授課對象:中基層管理者、高潛員工、主管、企業(yè)全員、職場白領。課程背景:工作總結(jié)、述職匯報、方案介紹……,這么重要的場合,說了半天也不知道想說什么,既沒有重點、也沒有亮點,既說不清楚,也講不精彩!如何避免思路混亂,構(gòu)建邏輯清晰的匯報結(jié)構(gòu)?如何快速組織語言,讓匯報/演講做...
講師:占力沖詳情
管理創(chuàng)新與實踐落地 2025-08-29
2024年01月24-25上海 2024年03月25-26上海2024年06月26-27上海 2024年08月29-30上海2024年10月16-17上海 2024年12月25-26上海學員對象:管理層作為管理者,您是否有以下困惑1、個人:自己如何更創(chuàng)新?以及讓員工更創(chuàng)新?2、業(yè)務:如何進行業(yè)務創(chuàng)新,適應快速變化的行業(yè)和市場要求?例如,在推動數(shù)字化轉(zhuǎn)型時,雖...
講師:鄢茹郡詳情
SQM供應商質(zhì)量管理高級研修班 2025-08-29
SQM供應商質(zhì)量管理高級研修班培訓費用:4380元(含資料費、午餐費、專家演講費);住宿統(tǒng)一安排,費用自理;授課對象:SQE,品質(zhì)工程師/經(jīng)理、IQC來料檢驗主管、體系工程師/主管、采購工程師/經(jīng)理、研發(fā)部門代表、工藝部門代表等。課程背景:本課程綜合了供應商質(zhì)量管理近年來在汽車供應鏈領域的最新趨勢和最新技術,是專門用于零部件質(zhì)量的,而不是質(zhì)量體系的翻版,包含...
講師:丁遠詳情
TLS(Toc+Lean+Sigma)實訓(完美工廠模擬運行) 2025-08-29
TLS(Toc+Lean+Sigma)實訓(完美工廠模擬運行)培訓時間:2025年04月25-26日 08月29-30日培訓地點:深圳培訓費用:4680元/人(含資料費、午餐費、專家演講費、會務費)培訓對象:工廠總經(jīng)理、廠長、計劃經(jīng)理、主管及生產(chǎn)相關部門經(jīng)理、主管、工程師備注:1、住宿可統(tǒng)一安排,費用自理2、本課程為案例實操課程,學員需自備筆記本電腦課程背景...
講師:饒中詳情
面向交付的供應鏈管理 2025-08-29
面向交付的供應鏈管理培訓時間:2025年03月28-29日 08月29-30日 12月26-27日培訓地點:深圳培訓費用:5880元/人(含資料費、午餐費、專家演講費、會務費)培訓對象:采購、生產(chǎn)、倉儲、物流、供應商管理人員等備注:住宿可統(tǒng)一安排,費用自理課程背景:目前制造業(yè)面臨客戶需求多變、產(chǎn)品壽命周期短、技術更新快,BOM更改頻繁、銷售預測不準導致生產(chǎn)計...
講師:宋志軍詳情
- [潘文富]引進非酒類商品之前的鋪墊
- [潘文富]大客戶的非酒型維護
- [潘文富]煙酒店,從服務大客戶到服
- [潘文富]煙酒店別指望大客戶了,扎
- [潘文富]酒商當前的應急措施十一條
- [王曉楠]輔警轉(zhuǎn)正方式,定向招錄成為
- [王曉楠]西安老師招聘要求,西安各區(qū)
- [王曉楠]西安中小學教師薪資福利待遇
- [王曉楠]什么是備案制教師?備案制教
- [王曉楠]2024年陜西省及西安市最







