關于舉辦“大數(shù)據分析- 基于Hadoop/Mahout的大數(shù)據挖掘”培訓的通知其它上課時間:
培訓對象:
系統(tǒng)架構師、系統(tǒng)分析師、高級程序員、資深開發(fā)人員
培訓內容:
時間: 2015年11月12日-11月14日 上海
2015年11月18日-11月20日 北京培訓費:5500元/人(含教材、證書、午餐、學習用具等)。住宿協(xié)助安排,費用自理。培訓對象
1,系統(tǒng)架構師、系統(tǒng)分析師、高級程序員、資深開發(fā)人員。
2,牽涉到大數(shù)據處理的數(shù)據中心運行、規(guī)劃、設計負責人。
3,政府機關,金融保險、移動和互聯(lián)網等大數(shù)據來源單位的負責人。
4,高校、科研院所牽涉到大數(shù)據與分布式數(shù)據處理的項目負責人。學員基礎
1,對IT系統(tǒng)設計有一定的理論與實踐經驗。
2,有一定的數(shù)據倉庫與大數(shù)據處理的基礎知識。
3,有一定的Hadoop技術的基礎知識。證書
培訓結束,頒發(fā)“大數(shù)據分析- 基于Hadoop/Mahout的大數(shù)據挖掘”結業(yè)證書。培訓目標
1, 全面了解大數(shù)據處理技術的相關知識。
2,學習Hadoop的核心技術方法以及應用特征。
3,深入使用Mahout挖掘工具在大數(shù)據中的使用。
4,掌握流數(shù)據挖掘和其它大數(shù)據挖掘關鍵技術。培訓背景
各有關單位:
研究所是國家專門的計算技術研究機構,同時也是中國信息化建設的重要支撐單位,中心是致力于高端IT類人才培養(yǎng)及企業(yè)內訓的專業(yè)培訓機構。中心憑借強大師資力量,在總結多年大型軟件開發(fā)和組織經驗的基礎上,自主研發(fā)出一整套課程體系,其目的是希望能夠切實幫助中國軟件企業(yè)培養(yǎng)高級軟件技術人才,提升整體研發(fā)能力,迄今為止已先后為國家培養(yǎng)了數(shù)萬名計算機專業(yè)人員,并先后為數(shù)千家大型國內外企業(yè)進行過專門的定制培訓服務。
隨著互聯(lián)網、移動互聯(lián)網和物聯(lián)網的發(fā)展,我們已經切實地迎來了一個大數(shù)據的時代。大數(shù)據是指無法在一定時間內用常規(guī)軟件工具對其內容進行抓取、管理和處理的數(shù)據集合,對大數(shù)據的分析已經成為一個非常重要且緊迫的需求。目前對大數(shù)據的分析工具,首選的是Hadoop平臺。Hadoop在可伸縮性、健壯性、計算性能和成本上具有無可替代的優(yōu)勢,事實上已成為當前互聯(lián)網企業(yè)主流的大數(shù)據分析平臺。為解決廣大系統(tǒng)設計人員深入研究與開發(fā)大數(shù)據技術的需要,培訓中心特在“大數(shù)據處理技術-基于Hadoop的實戰(zhàn)”課程的基礎上,針對已有或即將建立Hadoop集群,擁有海量數(shù)據,需要做用戶推薦、產品聚類、信息分類等大數(shù)據分析用戶,舉辦“大數(shù)據分析- 基于Hadoop/Mahout的大數(shù)據挖掘(含Spark和Storm應用介紹)”培訓班,具體事宜通知如下:培訓內容
第一講大數(shù)據挖掘及其背景
1)數(shù)據挖掘定義
2)Hadoop相關技術
3)大數(shù)據挖掘知識點
第二講 MapReduce計算模式
1)分布式文件系統(tǒng)
2)MapReduce
3)使用MR的算法設計
第三講 Hadoop中的云挖掘工具Mahout
1)Mahout介紹
2)推薦系統(tǒng)
3)信息聚類
4)分類技術
5)其它挖掘
第四講 推薦系統(tǒng)及其應用開發(fā)
1)一個推薦系統(tǒng)的模型
2)基于內容的推薦
3)協(xié)同過濾
4)電影推薦案例
第五講 分類技術及其應用
1)分類的定義
2)分類主要算法
3)Mahout分類過程
4)評估指標以及評測
5)貝葉斯算法新聞分類實例
第六講 聚類技術及其應用
1)聚類的定義
2)聚類的主要算法
3)K-Means、Canopy及其應用示例
4)Fuzzy K-Means、Dirichlet及其應用示例
5)路透新聞聚類實例
第七講 關聯(lián)規(guī)則和相似項發(fā)現(xiàn)
1)購物籃模型
2)Apriori算法
3)抄襲文檔發(fā)現(xiàn)
4)近鄰搜索的應用
第八講 流數(shù)據挖掘相關技術
1)流數(shù)據挖掘及分析
2)流數(shù)據模型
3)數(shù)據抽樣
4)流過濾
第九講 大數(shù)據挖掘應用前景
1)與Hadoop集群應用的協(xié)作
2)與RHadoop等其它云挖掘工具配合
3)大數(shù)據挖掘行業(yè)應用展望師資
由業(yè)界知名大數(shù)據專家親自授課:
楊老師 主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統(tǒng)、網絡信息處理、商務智能(BI)以及電信決策支持系統(tǒng)的研究開發(fā)工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發(fā)經驗。
相關 關于舉辦“大數(shù)據分析- 基于Hadoop/Mahout的大數(shù)據挖掘”培訓的通知 , 關于舉, 課程: 點擊查看更多相關課程