使用python做數(shù)據(jù)分析5天

  培訓(xùn)講師:孫增輝

講師背景:
孫增輝老師講師資質(zhì)?Oracle數(shù)據(jù)庫(kù)DBA認(rèn)證?SAS數(shù)據(jù)分析高級(jí)程序員認(rèn)證?Hadoop大數(shù)據(jù)及數(shù)據(jù)分析講師講師簡(jiǎn)介?數(shù)據(jù)庫(kù)專家。孫增輝老師多年從事數(shù)據(jù)庫(kù)的管理和教學(xué)工作。對(duì)oracle、sqlserver、mysql等關(guān)系型數(shù)據(jù)庫(kù)有豐 詳細(xì)>>

    課程咨詢電話:

使用python做數(shù)據(jù)分析5天 詳細(xì)內(nèi)容

使用python做數(shù)據(jù)分析5天

使用python做數(shù)據(jù)分析
課程介紹
本課程是使用python做數(shù)據(jù)分析的課程
課程目標(biāo)
理解python的特征
知曉python的結(jié)構(gòu)
會(huì)使用相應(yīng)方法,完成部分?jǐn)?shù)據(jù)分析工作
培訓(xùn)對(duì)象
有數(shù)據(jù)庫(kù)基礎(chǔ)知識(shí)
有編程基礎(chǔ)知識(shí)
有統(tǒng)計(jì)學(xué)基本知識(shí)
有數(shù)據(jù)分析、數(shù)據(jù)挖掘、統(tǒng)計(jì)分析的基本概念對(duì)數(shù)據(jù)分析感興趣
課程長(zhǎng)度
5天
課程內(nèi)容
第1天
主題
Python的優(yōu)點(diǎn)和不足
大綱
優(yōu)點(diǎn)
1、python語言更接近自然語言
2、python是開放源碼的自由軟件
3、python可移植在各種平臺(tái)上
4、python支持面向過程的函數(shù)編程,也支持面向?qū)ο蟮某橄缶幊?br /> 5、可擴(kuò)展和可嵌入
6、各種功能豐富的庫(kù)
7、編碼規(guī)范。各種強(qiáng)制縮進(jìn)方式提供了可讀性。
不足
8、運(yùn)行速度可能不理想。
9、python是開源軟件,通過封裝加密進(jìn)行商業(yè)化,就是一個(gè)問題。
10,、繁多的標(biāo)準(zhǔn)庫(kù)和第三方庫(kù)
主題
重要的python庫(kù)
大綱
1、NumPy (numerical python)
2、Pandas 處理結(jié)構(gòu)化數(shù)據(jù)的大量數(shù)據(jù)結(jié)構(gòu)和函數(shù)
3、Matplotlib 繪制數(shù)據(jù)圖表
4、IPython 交互式窗口,科學(xué)計(jì)算工具集的一部分
5、SciPy 專門解決科學(xué)計(jì)算中,標(biāo)準(zhǔn)問題域的包的集合。
6、Scikit-learn 機(jī)器學(xué)習(xí)庫(kù)
主題
Python的安裝和配置
大綱
1、anaconda
2、Windows系統(tǒng)下的安裝
3、Linux系統(tǒng)下的安裝
主題
Ipython基礎(chǔ)
大綱
1、IPython交互式計(jì)算和開發(fā)環(huán)境
2、Ipython啟動(dòng)、簡(jiǎn)單命令
3、內(nèi)省
4、使用歷史命令
5、與操作系統(tǒng)交互
6、軟件開發(fā)工具
7、ipython html notebook
8、用ipython提高代碼開發(fā)效率
9、ipython高級(jí)功能
主題
Ipython編碼效率與高級(jí)功能
大綱
1、利用python提高代碼效率的幾點(diǎn)提示
2、高級(jí)Ipython功能
第2天
主題
numpy數(shù)組和矢量計(jì)算
大綱
1、NumPy的ndarray:多維數(shù)組
2、通用函數(shù) 數(shù)組函數(shù)
3、利用數(shù)組進(jìn)行數(shù)據(jù)處理
4、用于數(shù)組文件的輸入輸出
5、線性代數(shù)
6、隨機(jī)數(shù)生產(chǎn)
7、隨機(jī)漫步
主題
pandas 數(shù)據(jù)處理分析工具
大綱
1、pandas的數(shù)據(jù)結(jié)構(gòu)介紹
2、基本功能
3、匯總和計(jì)算描述統(tǒng)計(jì)
4、處理缺失數(shù)據(jù)
5、層次化索引
6、其他有關(guān)pandas的話題
主題
數(shù)據(jù)加載 轉(zhuǎn)儲(chǔ)
大綱
1、讀寫文本格式的數(shù)據(jù)
2、二進(jìn)制數(shù)據(jù)格式
3、使用HTML和Web API
4、使用數(shù)據(jù)庫(kù)
5、使用excel文件
6、使用hadoop大數(shù)據(jù)
主題
簡(jiǎn)單數(shù)據(jù)清洗
大綱
1、合并數(shù)據(jù)集
2、重塑和軸向旋轉(zhuǎn)
3、數(shù)據(jù)轉(zhuǎn)換
4、字符串操作
主題
python的繪圖和可視化
大綱
1、python的圖形化工具生態(tài)系統(tǒng)
2、matplotlib API入門
3、pandas中的繪圖函數(shù)
4、繪制地圖
第3天
主題
數(shù)據(jù)的分組計(jì)算--分層樣本
大綱
1、GroupBy技術(shù)
2、數(shù)據(jù)聚合
3、分組運(yùn)算和轉(zhuǎn)換
4、透視表和交叉表
主題
時(shí)間序列
大綱
1、日期和時(shí)間數(shù)據(jù)類型及工具
2、時(shí)間序列基礎(chǔ)
3、日期的范圍、頻率以及移動(dòng)
4、時(shí)區(qū)處理
5、時(shí)期及其算數(shù)運(yùn)算
6、重采樣及頻率轉(zhuǎn)換
7、時(shí)間序列繪圖
8、移動(dòng)窗口函數(shù)
9、性能和內(nèi)存使用方面的注意事項(xiàng)
主題
numpy高級(jí)應(yīng)用
大綱
1、ndarray對(duì)象的內(nèi)部機(jī)制
2、高級(jí)數(shù)組操作
3、廣播
4、ufunc高級(jí)應(yīng)用
5、結(jié)構(gòu)化和記錄式數(shù)組
6、關(guān)于排序
7、numpy的matrix類
8、高級(jí)數(shù)組輸入輸出
9、性能建議
主題
蒙特卡洛模擬
大綱
1、純python
2、用numpy向量化
3、用對(duì)數(shù)歐拉方法實(shí)現(xiàn)全向量化
4、圖形化分析
5、技術(shù)分析
主題
統(tǒng)計(jì)學(xué) 正態(tài)檢驗(yàn)
大綱
1、正態(tài)性檢驗(yàn)
2、基準(zhǔn)案例
3、現(xiàn)實(shí)世界的數(shù)據(jù)
第4天
主題
金融應(yīng)用 投資優(yōu)化組合
大綱
1、基本理論
2、數(shù)據(jù)
3、投資組合優(yōu)化
4、有效邊界
5、資本市場(chǎng)線
主題
k 近鄰算法
大綱
1、k近鄰算法概述
2、準(zhǔn)備數(shù)據(jù):從文本文件中解析數(shù)據(jù)
3、分析數(shù)據(jù):使用matplotlib創(chuàng)建散點(diǎn)圖
4、準(zhǔn)備數(shù)據(jù):歸一化數(shù)值
5、測(cè)試算法:作為完整程序驗(yàn)證分類器
6、使用算法:構(gòu)建完整可用的系統(tǒng)
主題
決策樹
大綱
1、決策樹的構(gòu)造
信息增益
劃分?jǐn)?shù)據(jù)集
遞歸構(gòu)建決策樹
2、使用matplotlib注解繪制樹形圖
matplotlib注解
構(gòu)造注解樹
3、測(cè)試和存儲(chǔ)分類器
測(cè)試算法:使用決策樹執(zhí)行分類
使用算法:決策樹的存儲(chǔ)
主題
概率論 樸素貝葉斯
大綱
1、基于貝葉斯決策理論的分類方法
2、條件概率
3、使用條件概率來分類
4、使用樸素貝葉斯進(jìn)行文檔分類
5、使用python進(jìn)行文本分類
主題
Logistic 回歸分析
大綱
1、基于Logistic回歸和sigmoid函數(shù)的分類
2、基于最優(yōu)化方法的 最佳回歸系數(shù)確定
梯度上升法
訓(xùn)練算法:使用梯度上升找到最佳參數(shù)
分析數(shù)據(jù):畫出決策邊界
訓(xùn)練算法:隨機(jī)梯度上升
第5天
主題
支持向量機(jī)
大綱
1、SVM應(yīng)用的一般框架
2、基于最大間隔分隔數(shù)據(jù)
3、尋找最大間隔
4、SMO高效優(yōu)化算法
5、利用完整plattSMO算法加速優(yōu)化
6、在復(fù)雜數(shù)據(jù)上應(yīng)用核函數(shù)
主題
回歸 ----- 預(yù)測(cè)數(shù)值型數(shù)據(jù)
大綱
1、用線性回歸找到最佳擬合直線
2、局部加權(quán)線性回歸
3、縮減系數(shù)來“理解”數(shù)據(jù)
嶺回歸
lasso
向前逐步回歸
4、權(quán)衡偏差與方差
主題
樹回歸
大綱
1、復(fù)雜數(shù)據(jù)的局部性建模
2、連續(xù)和離散型特征的樹的構(gòu)建
3、將CART算法用于回歸
構(gòu)建樹 運(yùn)行代碼
4、樹剪枝
預(yù)剪枝 后剪枝
5、模型樹
6、樹回歸與標(biāo)準(zhǔn)回歸的比較
主題
大數(shù)據(jù)與mapreduce
大綱
1、mapreduce:分布式計(jì)算框架
2、hadoop流
3、mapreduce上的機(jī)器學(xué)習(xí)
4、在python中使用mrjob來自動(dòng)化MapReduce
5、真的需要MapReduce嗎?

 

孫增輝老師的其它課程

大數(shù)據(jù)處理技術(shù)培訓(xùn)課程介紹Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡(jiǎn)稱HDFS。HDFS有高容錯(cuò)性的特點(diǎn),并且設(shè)計(jì)用來部署在低廉的(low-cost)硬件上;而且它提供高傳輸率(highthroughput)來訪問應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(largedataset)的應(yīng)用程序。課程目標(biāo)掌握

 講師:孫增輝詳情


信息安全5天    12.08

信息安全課程介紹本課程涵蓋了信息安全從概念到細(xì)節(jié)的多個(gè)方面。本課程同樣適用于初學(xué)者和專業(yè)人員,相對(duì)全面地提供了一站式的參考內(nèi)容。課程目標(biāo)安全基礎(chǔ)數(shù)據(jù)安全如何保護(hù)網(wǎng)絡(luò)上的資產(chǎn)網(wǎng)絡(luò)安全計(jì)算機(jī)安全應(yīng)用程序安全安全操作培訓(xùn)對(duì)象相關(guān)的技術(shù)人員、管理人員、運(yùn)維人員課程長(zhǎng)度5天課程內(nèi)容第1天主題信息安全概述大綱信息保護(hù)的重要性信息安全的演變合理的安全投資安全方法論建立一個(gè)

 講師:孫增輝詳情


應(yīng)用容器引擎Docker課程介紹Docker是基于GO語言實(shí)現(xiàn)的云開源項(xiàng)目,誕生于2013年初。Docker希望達(dá)到應(yīng)用組件級(jí)別的“一次封裝,到處運(yùn)行”。學(xué)員可以簡(jiǎn)單將docker容器理解為沙盒。每個(gè)容器運(yùn)行一個(gè)應(yīng)用,不同的容器互相隔離,容器之間也可以建立通信機(jī)制。容器的創(chuàng)建和停止十分快速,容器自身對(duì)資源的需求也十分有限,遠(yuǎn)遠(yuǎn)低于虛擬機(jī)。很多時(shí)候直接把容器黨

 講師:孫增輝詳情


云計(jì)算openstack課程介紹云計(jì)算從提出到成熟,中間經(jīng)歷了較長(zhǎng)的時(shí)間。云計(jì)算的各種概念也在不斷發(fā)展更新。本課程能夠給想要學(xué)習(xí)云計(jì)算知識(shí)的人們,提供一個(gè)可供學(xué)習(xí)的云計(jì)算系統(tǒng),幫助大家學(xué)習(xí)、實(shí)驗(yàn)和使用。課程目標(biāo)了解云計(jì)算,知道云計(jì)算產(chǎn)生的原因以及應(yīng)用場(chǎng)景。了解云存儲(chǔ),知道云計(jì)算系統(tǒng)中大數(shù)據(jù)的存儲(chǔ)方式。私有云和公有云。云計(jì)算的兩種不同應(yīng)用場(chǎng)景,它們的聯(lián)系與區(qū)別

 講師:孫增輝詳情


mysql 4天    12.08

MYSQL數(shù)據(jù)庫(kù)課程介紹本課程介紹MySQL的啟動(dòng)、連接等基礎(chǔ)應(yīng)用開始,SQL語句的使用、MySQL內(nèi)置函數(shù)、備份與恢復(fù)、數(shù)據(jù)庫(kù)優(yōu)化、數(shù)據(jù)庫(kù)安全等主題,介紹相關(guān)開發(fā)實(shí)例課程目標(biāo)了解mysql數(shù)據(jù)庫(kù)的體系結(jié)構(gòu)創(chuàng)建和管理mysql數(shù)據(jù)庫(kù)備份和恢復(fù)數(shù)據(jù)庫(kù)培訓(xùn)對(duì)象軟件開發(fā)人員、數(shù)據(jù)庫(kù)管理員課程長(zhǎng)度5天(30學(xué)時(shí))培訓(xùn)方式案例分析、情景演練課程內(nèi)容第1天主題體系結(jié)構(gòu)大

 講師:孫增輝詳情


Oracle數(shù)據(jù)庫(kù)管理(DBA)課程介紹本課程是你作為Oracle專業(yè)人員走向成功的第一步。課程設(shè)計(jì)為你打下基本的數(shù)據(jù)庫(kù)管理的堅(jiān)實(shí)基礎(chǔ)并幫助你準(zhǔn)備通過OracleCertifiedAssociate考試。課程目標(biāo)課程中,你將學(xué)習(xí)如何安裝和維護(hù)Oracle數(shù)據(jù)庫(kù)。學(xué)員將獲得Oracle數(shù)據(jù)庫(kù)結(jié)構(gòu)的概念性理解,以及它的組件是如何彼此協(xié)調(diào)工作的。學(xué)員將學(xué)習(xí)如何創(chuàng)建

 講師:孫增輝詳情


Oracle調(diào)優(yōu)培訓(xùn)課程介紹該培訓(xùn)課程面向大中型企業(yè)中的數(shù)據(jù)庫(kù)相關(guān)的開發(fā)人員和管理人員。課程的主要內(nèi)容是Oracle11g數(shù)據(jù)庫(kù)性能調(diào)優(yōu)的各種實(shí)例、方法、技巧以及與之對(duì)應(yīng)的原理的講解通過本課程地學(xué)習(xí)。學(xué)員可以大大的提升數(shù)據(jù)庫(kù)性能調(diào)優(yōu)的能力。課程結(jié)合大量案例,使學(xué)員能夠理論結(jié)合實(shí)際,學(xué)以致用。課程目標(biāo)←掌握Oracle11g數(shù)據(jù)庫(kù)性能調(diào)優(yōu)的各種實(shí)例、方法、技巧

 講師:孫增輝詳情


Oracle數(shù)據(jù)庫(kù)調(diào)優(yōu)課程課時(shí):4天1.課程適合對(duì)象Oracle數(shù)據(jù)庫(kù)運(yùn)維人員(DBA)2.培訓(xùn)所需實(shí)驗(yàn)設(shè)備及軟件清單編號(hào)設(shè)備及軟件名稱對(duì)應(yīng)課程1Oracle11g數(shù)據(jù)庫(kù)課程安排上午(9:00-12:00)下午(14:00-17:00)第一天(1).Oracle數(shù)據(jù)庫(kù)性能診斷工具?最根本的性能信息工具——數(shù)據(jù)庫(kù)數(shù)據(jù)字典和動(dòng)態(tài)性能視圖?診斷性能定位問題工具:S

 講師:孫增輝詳情


SAS數(shù)據(jù)分析從入門到精通課程介紹SAS數(shù)據(jù)分析軟件是應(yīng)用最廣泛的商業(yè)統(tǒng)計(jì)分析軟件之一。本課程是從基礎(chǔ)開始到專業(yè)應(yīng)用的整體內(nèi)容,幫助您理解數(shù)據(jù)分析的操作。課程目標(biāo)SAS編程基礎(chǔ)SAS常用函數(shù)及應(yīng)用SAS數(shù)據(jù)集處理操作SAS宏編程SASPROCSQL描述統(tǒng)計(jì)T檢驗(yàn)方差分析回歸分析。培訓(xùn)對(duì)象數(shù)據(jù)庫(kù)管理員、開發(fā)人員課程長(zhǎng)度5天(30學(xué)時(shí))培訓(xùn)方式案例分析、情景演練

 講師:孫增輝詳情


Spark數(shù)據(jù)分析課程介紹本課程將關(guān)注spark的數(shù)據(jù)分析技術(shù)實(shí)際應(yīng)用。課程目標(biāo)數(shù)據(jù)分析培訓(xùn)對(duì)象開發(fā)人員課程長(zhǎng)度5天(30學(xué)時(shí))培訓(xùn)方式案例分析、情景演練課程內(nèi)容第1天主題Spark的環(huán)境搭建與運(yùn)行大綱Spark的本地安裝與配置Spark集群Spark編程模型主題數(shù)據(jù)分析系統(tǒng)商業(yè)案例大綱個(gè)性化目標(biāo)營(yíng)銷和客戶細(xì)分預(yù)測(cè)建模與分析機(jī)器學(xué)習(xí)的系統(tǒng)架構(gòu)第2天主題Spa

 講師:孫增輝詳情


 發(fā)布內(nèi)容,請(qǐng)點(diǎn)我!  講師申請(qǐng)/講師自薦
清華大學(xué)卓越生產(chǎn)運(yùn)營(yíng)總監(jiān)高級(jí)研修班
清華大學(xué)卓越生產(chǎn)運(yùn)營(yíng)總監(jiān)高級(jí)研修班
COPYRIGT @ 2001-2018 HTTP://fanshiren.cn INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權(quán)所有