亚洲色视视频在线观看_亚洲精品无码你懂的网站369_西欧AV一级综合毛片_亚洲国产成人VA在线观看_一级片在线免费播放

高度決定眼界、專業(yè)創(chuàng)造價(jià)值!中國規(guī)模最大、實(shí)力最強(qiáng)的培訓(xùn)服務(wù)提供商!

24小時(shí)服務(wù)熱線:020-31041068

詳細(xì)內(nèi)容:當(dāng)前的位置:首頁 >> 公開課

Python網(wǎng)絡(luò)爬蟲及數(shù)據(jù)采集技術(shù)培訓(xùn)

  • 開課時(shí)間: 2017年2月23日 周四 2017年2月24日 周五 查看最新上課時(shí)間
  • 開課城市: 北京
  • 培訓(xùn)時(shí)長:2天
  •  
  • 課程類別: IT技能
  • 主講老師:楊老師(查看該老師更多課程)
  • 課程編號: 49236
  • 查找同類課程
Python網(wǎng)絡(luò)爬蟲及數(shù)據(jù)采集技術(shù)培訓(xùn)其它上課時(shí)間:

培訓(xùn)對象:

1,系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級程序員、資深開發(fā)人員。2,牽涉到網(wǎng)絡(luò)采集、處理和規(guī)劃的負(fù)責(zé)人、設(shè)計(jì)人員。3,政府機(jī)關(guān),金融保險(xiǎn)、移動等以互聯(lián)網(wǎng)信息為數(shù)據(jù)來源單位的負(fù)責(zé)人。4,高校、科研院所牽涉到網(wǎng)絡(luò)數(shù)據(jù)采集與數(shù)據(jù)處理的項(xiàng)目負(fù)責(zé)人。

培訓(xùn)內(nèi)容:

課程大綱:

第一講網(wǎng)絡(luò)爬蟲基礎(chǔ)
1.什么是網(wǎng)絡(luò)爬蟲
2.瀏覽網(wǎng)頁的過程
3.URL的含義
4.環(huán)境的配置
第二講Python爬蟲基礎(chǔ)知識
1.Python爬蟲基礎(chǔ)學(xué)習(xí)
2.Pythonurllib和urllib2庫的用法
3.Python正則表達(dá)式
4.BeautifulSoup簡介
5.爬蟲框架Scrapy
第三講Urllib庫的基本使用
1.網(wǎng)頁爬取示例
2.網(wǎng)頁爬取方法
3.構(gòu)造Requset
4.POST和GET數(shù)據(jù)傳送
第四講Urllib庫的高級用法
1.設(shè)置Headers
2.Proxy(代理)的設(shè)置
3.Timeout設(shè)置
4.HTTP的PUT和DELETE方法
5.使用DebugLog
第五講正則表達(dá)式
1.了解正則表達(dá)式
2.正則表達(dá)式的語法規(guī)則
3.正則表達(dá)式相關(guān)注解
4.PythonRe模塊
第六講BeautifulSoup的用法
1.BeautifulSoup的簡介
2.BeautifulSoup安裝
3.創(chuàng)建BeautifulSoup對象
4.BeautifulSoup對象種類
5.遍歷文檔樹
第七講開始采集
1.遍歷單個(gè)域名
2.采集整個(gè)網(wǎng)站
3.通過互聯(lián)網(wǎng)采集
4.用Scrapy采集
5.幾個(gè)示例
第八講存儲數(shù)據(jù)和讀取文檔
1.媒體文件
2.把數(shù)據(jù)存儲到CSV
3.MySQL與Python整合
4.讀取純文本和CSV文檔
5.讀取Word和.docx
第九講自然語言處理基礎(chǔ)
1.概括數(shù)據(jù)
2.馬爾可夫模型
3.自然語言工具包
4.用NLTK做統(tǒng)計(jì)分析
5.用NLTK做詞性分析
第十講用爬蟲測試網(wǎng)站
1.測試簡介
2.Python單元測試
3.Selenium單元測試
4.Python單元測試與Selenium單元測試的選擇

培訓(xùn)師介紹:

楊老師。
主要研究網(wǎng)絡(luò)信息分析以及云計(jì)算相關(guān)技術(shù),長期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡(luò)信息處理、商務(wù)智能(BI)以及電信決策支持系統(tǒng)的研究開發(fā)工作,主持和參與了多個(gè)國家和省部級基金項(xiàng)目,具有豐富的工程實(shí)踐及軟件研發(fā)經(jīng)驗(yàn)。

IT技能公開課推薦

IT技能精品內(nèi)訓(xùn)推薦

最新發(fā)布公開課推薦

博課在線客服關(guān)閉