課程介紹:
網路爬蟲,也叫網路蜘蛛,原意是指一種用來自動瀏覽全球資訊網的網路機器人。隨著大數據時代來臨,網頁資料擷取的需求急遽增長,因網頁資料擷取與網路爬蟲的技術許多重疊,因此經常通稱為爬蟲。藉著爬蟲技術,短時間內取得最新的輿情資訊已是業界掌握市場脈動的必備手段之一。
課程目標:
本課程將帶領學員從零開始,透過資料科學領域最夯同時也是最通用的Python語言開啟網頁資料擷取的大門,雖然短短兩天的時間,但保證讓你能獨立完成爬網的任務。
適合對象:
※無程式經驗者。
※資料科學家、資料工程師。
※公司各部門與各階層決策人員。
※對於此議題有興趣者。
課程時間及優惠:
課程天數:2天;上午9:00至下午5:00(中午休息1小時)
原價10,800元整 (含上課講義、16小時研習證明與午餐)
早鳥(2月23日前)/舊生:6,800元/人
兩人以上團體:6,000元/人
四人以上團體:5,500元/人
講師介紹:
AsiaAnalytics特聘專業講師:湯明軒 Andrew
經歷:
●中華電信 Hadoop Administrator
●迅達國際有限公司 資料科學家
●中強光電股份有限公司 資料分析工程師
●中華R軟體學會 秘書長
專攻領域:
●資料科學、網頁爬蟲、Python、R語言、機器學習
教學經驗:
●iPAS 巨量資料分析師證照輔導班 課程講師
●TQC Python證照輔導班 課程講師
●EEC 企業電子化資料分析師證照輔導班 課程講師
●資策會課程講師
●金融研訓院課程講師
課程大綱:
課程主題 | 詳細內容 | 時數 |
Python語言 從0到1 | ●內建資料型別 ●流程控制與迴圈 ●資料匯出 | 3 |
如何與網頁對話 | ●網頁溝通流程 ●GET傳送請求 ●POST傳送請求 ●網頁監聽工具應用 | 2 |
網頁原始碼解析 | ●網頁架構理解 ●CSS Selector運用 ●原始碼定位技巧 ●正則表達式Regex | 4 |
初階實戰練習 | ●Yahoo電影排行 ●批踢踢留言擷取 ●Google Play評論擷取 | 2 |
進階爬蟲技巧 | ●Headers及Cookie控制 ●Selenium 模擬瀏覽器操作 | 1 |
進階實戰練習 | ●Facebook文章擷取 ●Instagram照片擷取 ●Agoda飯店平均房價 | 2 |
注意事項:
近期熱門活動...
|