大數(shù)據(jù)分析及可視化技術(shù)應(yīng)用實戰(zhàn) 培訓(xùn)班其它上課時間:
培訓(xùn)對象:
對此課程感興趣的學(xué)員
培訓(xùn)內(nèi)容:
課程收益:
一、課程特色
1.本課程盡量避開數(shù)學(xué)公式,按照“講清思想方法原理—結(jié)合具體案例—R語言實現(xiàn)細(xì)節(jié)”思路,讓即使是幾乎沒有什么基礎(chǔ)的學(xué)員,掌握數(shù)據(jù)挖掘和可視化的基本思路和模式,打下未來深入的良好基礎(chǔ),能在工作和學(xué)習(xí)中結(jié)合具體問題立馬上手操作解決;
2.課程注重學(xué)練結(jié)合的方法,會采取課中練習(xí)的方法,充分調(diào)動大家思考的積極性,在做中掌握相關(guān)知識和技能;
3.課程緊緊抓住基于R語言的數(shù)據(jù)挖掘和可視化的重點和難點,詳細(xì)的分析和講解,在理解難、容易出錯的地方反復(fù)提醒,以便學(xué)員在課后容易的進行自己復(fù)習(xí)和相關(guān)拓展。二、培訓(xùn)對象
1.大數(shù)據(jù)分析應(yīng)用開發(fā)工程師
2.大數(shù)據(jù)分析項目的規(guī)劃咨詢管理人員
3.大數(shù)據(jù)分析項目的IT項目高管人員
4.大數(shù)據(jù)分析與挖掘處理算法應(yīng)用工程師
5.大數(shù)據(jù)分析集群運維工程師
6.大數(shù)據(jù)分析項目的售前和售后技術(shù)支持服務(wù)人員
培訓(xùn)頒發(fā)證書:
本課程學(xué)習(xí)考核通過后由中國信息化培訓(xùn)中心頒發(fā)《大數(shù)據(jù)開發(fā)高級架構(gòu)師》證書,證書查詢:www.zpedu.org;證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級和晉升職務(wù)的重要依據(jù)。
課程大綱:
時間知識模塊授課內(nèi)容第一天上午數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(一)第一講大數(shù)據(jù)挖掘及可視化介紹 數(shù)據(jù)挖掘及可視化背景 數(shù)據(jù)挖掘流程 常用挖掘工具介紹 R語言的優(yōu)勢 R數(shù)據(jù)挖掘可視化工具-Rattle快速上手 R語言對復(fù)雜數(shù)據(jù)可視化的優(yōu)勢 R語言快速入門 利用caret包做數(shù)據(jù)抽樣及虛擬化處理第一天下午數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(二)第二講數(shù)據(jù)質(zhì)量分析及高級可視化 缺失值處理的高級方法 異常值甄別的高級方法 數(shù)據(jù)可視化進階:lattice及ggplot2包介紹 數(shù)據(jù)交互可視化:rCharts、recharts、networkD3、plotly等包介紹第二天上午數(shù)據(jù)挖掘模型實戰(zhàn)(一)第三講聚類分析及R語言實現(xiàn)聚類分析是一種原理簡單、應(yīng)用廣泛的數(shù)據(jù)挖掘技術(shù)。顧名思義,聚類分析即是把若干事物按照某種標(biāo)準(zhǔn)歸為幾個類別,其中較為相近的聚為一類,不那么相近的聚于不同類。 案例一:對著名的鳶尾花數(shù)據(jù)進行K均值聚類分析 案例二:對汽車數(shù)據(jù)進行K均值聚類分析 案例三:對洛杉磯街區(qū)數(shù)據(jù)進行層次聚類 案例四:對汽車數(shù)據(jù)進行層次聚類第四講關(guān)聯(lián)規(guī)則及R語言實現(xiàn)關(guān)聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎(chǔ)和核心技術(shù)之一,本講將著重圍繞經(jīng)典的Apriori算法,闡明關(guān)聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語言快速完成關(guān)聯(lián)規(guī)則分析,并通過arulesViz擴展包對關(guān)聯(lián)規(guī)則進行可視化展示。案例:利用超市購物籃Groceries數(shù)據(jù)進行關(guān)聯(lián)規(guī)則分析第二天下午數(shù)據(jù)挖掘模型實戰(zhàn)(二)第五講KNN近鄰算法及R語言實現(xiàn)KNN(k-NearestNeighbor)分類算法是數(shù)據(jù)挖掘分類技術(shù)中較簡單的方法之一。所謂k最近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用它最接近的k個鄰居來代表。 案例一:對鳶尾花數(shù)據(jù)集進行knn分類 案例二:對乳腺癌數(shù)據(jù)進行knn分類 案例三:對文本數(shù)據(jù)進行knn分類第六講決策樹分類及R語言實現(xiàn)決策樹是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種最為普遍的決策樹算法:CART和C5.0算法,使用rpart和C50函數(shù)進行R語言分析。 案例一:對鳶尾花數(shù)據(jù)集運用C50算法分類 案例二:對鳶尾花數(shù)據(jù)集運用CART算法進行分類 案例三:對汽車數(shù)據(jù)運用CART對汽車重量進行預(yù)測第三天上午行業(yè)應(yīng)用案例分享(一)第七講深度挖掘用戶付費行為及社會網(wǎng)絡(luò)分析 對用戶的購買行為進行購物籃分析 智能推薦系統(tǒng)常用算法介紹 對用戶購物行為構(gòu)建智能推薦系統(tǒng) 社會網(wǎng)絡(luò)圖基本知識 利用R語言繪制社會網(wǎng)絡(luò)圖 利用Gephi繪制社會網(wǎng)絡(luò)圖 對用戶購物行為進行聚類分析,發(fā)現(xiàn)社群第三天下午行業(yè)應(yīng)用案例分享(二)第八講航空公司客戶價值分析 背景與挖掘目標(biāo) 分析方法及過程 數(shù)據(jù)探索分析 數(shù)據(jù)預(yù)處理 模型構(gòu)建 模型應(yīng)用第九講漏斗模型及路徑分析 漏斗模型的主要應(yīng)用場景 路徑分析的主要應(yīng)用場景 漏斗模型與路徑分析的不同點 sunburst事件路徑圖的繪制方法 利用基于時序的關(guān)聯(lián)規(guī)則對點擊事件進行分析第四天學(xué)習(xí)考核與業(yè)內(nèi)經(jīng)驗交流培訓(xùn)師介紹:
謝老師計算機碩士,數(shù)據(jù)分析與可視化專家,高級培訓(xùn)講師。中國R語言資深顧問,WOT“互聯(lián)網(wǎng)”大數(shù)據(jù)技術(shù)、百城沙龍大數(shù)據(jù)沙龍廣深兩地特邀顧問。目前就職于某集團上市公司的高級數(shù)據(jù)分析師,主要利用R語言進行大數(shù)據(jù)的挖掘和可視化工作。本人從事數(shù)據(jù)挖掘建模工作已有8年,曾經(jīng)從事過咨詢、電商、電購、電力、游戲等行業(yè),了解不同領(lǐng)域的數(shù)據(jù)特點。有豐富的利用R語言進行數(shù)據(jù)挖掘?qū)崙?zhàn)經(jīng)驗,部分研究成果曾獲得國家專利。培訓(xùn)過的精品課程有:《R語言基礎(chǔ)培訓(xùn)》、《Rattle:可視化數(shù)據(jù)挖掘工具》、《數(shù)據(jù)分析之R語言實戰(zhàn)》、《機器學(xué)習(xí)與R語言實踐》、《R語言與文本挖掘》
鐘老師現(xiàn)任職于中科院某研究所,高級工程師,副高職稱,博士畢業(yè)于中國科學(xué)院計算技術(shù)研究所,獲工學(xué)博士學(xué)位(計算機系統(tǒng)結(jié)構(gòu)方向)。中培教育的大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)系列課程建設(shè)與教學(xué)專家。近七年來帶領(lǐng)團隊主要從事大數(shù)據(jù)與云計算技術(shù)項目的研發(fā)與IT項目管理工作。鐘老師有著多年的企業(yè)內(nèi)訓(xùn)和公開課培訓(xùn)講師經(jīng)歷,主講大數(shù)據(jù)平臺技術(shù)、云計算、移動互聯(lián)網(wǎng)、電子商務(wù)、IT信息軟件項目管理、企業(yè)信息化規(guī)劃與管理、IT戰(zhàn)略規(guī)劃與企業(yè)架構(gòu)、數(shù)據(jù)中心主機規(guī)劃與IDC系統(tǒng)運營等企業(yè)實戰(zhàn)類培訓(xùn)課程。