課程緣起
在資訊蓬勃發達的現在,各式各樣的資訊都呈現在網路上,諸如商品價格、股價漲跌、利匯率走勢、社群網站議題等等。若可以透過網路取得資料,便可以進行後續相關的活動,不論是透過股價漲跌,進而預測後面的股價趨勢;瞭解競爭者的商品資訊,進而規劃之後的商品價格與活動;知道社群網站近來的熱門議題,進而規劃後續的行銷活動;透過利匯率的走勢,進而知道何時可以進行,例如低價買進美金或日幣等匯率操作。
許多網路上的資料,只要「複製、貼上」就可以直接取得。但是如果是相當大量性的資料,或是需逐日取得的資料,如果只是單純的「複製、貼上」等人為重複性的操作,是相當曠日廢時,且難以長期間的定時執行。
因此,藉由使用「網路爬蟲」,便可以將網路上大量、雜亂的資料抓取下來,進而整理成有用的資訊。然而,大部份的網路爬蟲,皆需先學習相對應的程式語言,並撰寫程式碼,才能進行後續的操作。為了便於初學者能簡單、快速的使用「網路爬蟲」。本課程將使用瀏覽器的擴充功能,在幾近不用撰寫程式碼的情況下,可以抓取網路上的資料。
課程目標
• 本課程使用瀏覽器的擴充功能,在幾乎不用撰寫程式碼的狀況下,能夠快速的爬取許多的網站資料
• 在爬取的過程中,可一邊學習網頁上相關的內容,例如HTML 標籤+CSS選擇器,從實作中了解網頁內容和各種網站的巡覽結構
• 使用Excel內建功能,進行「資料清理」及「資料視覺化」,充份掌握資訊,做出最佳決策
課程特色
• 告別曠日廢時的的「複製、貼上」,並在幾乎不用撰寫程式的情況下,就可以使用「網路爬蟲」蒐集網路上的資料
• 以逐步操作的方式,解說爬取資料的過程,建立起初學者的信心,免除撰寫程式的恐懼
• 以豐富的生活化實作案例,帶領初學者爬取資料,例如股價資訊、匯率、電影資訊、天氣資訊、空氣品質……等,建立初學者的自信及成就感
課程大綱
課程主題
|
課程內容
|
網路爬蟲介紹
|
• 認識網路爬蟲
• 瞭解網頁相關概念-HTML、CSS、JavaScript
|
資料的爬取
|
• 標題、段落與文字資料
• 清單項目和表格資料
• 圖片和超連結資料
• 階層選單資料
• 上、下頁巡覽網站資料
• 金融、新聞、商務和數據爬取
|
資料清理與視覺化
|
• Excel 資料清理
• Excel 資料視覺化
|
適合對象
• 需要擷取網頁資料以進行後續資料處理的開發人員
• 對資料分析有興趣,想成為資料分析工程師的人員
• 行銷人員/數據分析人員/程式設計師/系統分析人員
課程日期
111年8月10日,週三白天09:00~12:30、13:30~17:00,計7小時。
註:請自備筆電
*主辦單位得視報名情況而保留實際開課日期的變更權利 。
上課地點
• 本課程採遠距直播授課,在網路環境暢通與電腦執行順暢之環境皆可上課
• 課程內容受著作權法保護,不得以任何形式傳輸、重製、散布或提供予公眾,以免觸法
課程費用與繳費
1.本課程原價 NT$4,500元,費用含課程及講義。
2.優惠方案:凡於8月2日前完成報名與繳費之學員,可享優惠價NT$3,600元(含稅)。
3.團報優惠:二人團報可打95折、四人團報可打9折優惠。
• 團報優惠與早鳥優惠可一併使用
• 課程報名系統每個帳號僅提供一位學員報名,若為團報學員,每位皆必須完成線上報名,並於其他金額說明欄位註記「與XXX一起團報」,以利事後核對名單
4.請以信用卡、即期支票或匯款支付:繳費資訊將於確定開課後提供。
報名確認與取消
1.已完成報名與繳費之學員,課程主辦單位將於開課三天前以E-mail方式寄發上課通知函;若課程因故取消或延期,亦將以E-mail方式通知,如未收到任何通知,敬請來電確認。
2.已完成繳費之學員如欲取消報名,請於實際上課日前以書面通知業務承辦人,主辦單位將退還90% 課程費用。
3.學員於培訓期間如因個人因素無法繼續參與課程,將依課程退費規定辦理之︰上課未逾總時數三分之一,欲辦理退費,退還所有上課費用之二分之一,上課逾總時數三分之一,則不退費。
4.如遇不可抗拒之因素,課程主辦單位保留修訂課程日期及取消課程的權利。
5.本單位保留是否接受報名之權利。
結業證書
依本院「教育訓練服務程序」規定,本課程為短期班,參訓學員缺課未超過總時數五分之一者,結業時由本院核發結業證書。
相關連結:商研院數位創新學院粉絲團