微博關(guān)鍵詞爬蟲(chóng)抓取方法本文介紹使用八爪魚(yú)爬蟲(chóng)軟件采集抓取微博關(guān)鍵詞的方法。采集網(wǎng)站:本文僅以“楊冪”、鄭爽、“趙麗穎”這三個(gè)關(guān)鍵詞挖掘舉例說(shuō)明,大家如果有挖掘微博其他關(guān)鍵詞的需求,可以更換關(guān)鍵詞進(jìn)行采集。采集的內(nèi)容包括:微博下拉框關(guān)鍵詞使用功能點(diǎn):l文本循環(huán)lAjax點(diǎn)擊登陸方法()注:第一次用八爪魚(yú)采集微博的童鞋,可以先制作一個(gè)簡(jiǎn)單的預(yù)登陸規(guī)則步驟1:創(chuàng)建微博關(guān)鍵詞爬蟲(chóng)抓取任務(wù)1)進(jìn)入主界面,選擇“自定義模式”微博關(guān)鍵詞爬蟲(chóng)使用步驟12)將要采集的網(wǎng)址復(fù)制粘貼到網(wǎng)站輸入框中,點(diǎn)擊“保存網(wǎng)址”微博關(guān)鍵詞爬蟲(chóng)使用步驟2步驟2:登錄微博1)系統(tǒng)自動(dòng)打開(kāi)網(wǎng)頁(yè),進(jìn)入微博首頁(yè)。在頁(yè)面右上角,打開(kāi)“流程”,以展現(xiàn)出“流程設(shè)計(jì)器”和“定制當(dāng)前操作”兩個(gè)板塊。點(diǎn)擊“登錄”按鈕,選擇“點(diǎn)擊該鏈接”,進(jìn)入微博登錄頁(yè)面微博關(guān)鍵詞爬蟲(chóng)使用步驟32)點(diǎn)擊賬號(hào)輸入框,選擇“輸入文字”,輸入賬號(hào),點(diǎn)擊“確定”微博關(guān)鍵詞爬蟲(chóng)使用步驟43)點(diǎn)擊密碼輸入框輸入關(guān)鍵字的爬蟲(chóng)軟件,選擇“輸入文字”輸入密碼,點(diǎn)擊“確定”微博關(guān)鍵詞爬蟲(chóng)使用步驟54)點(diǎn)擊“登錄”按鈕,選擇“點(diǎn)擊該鏈接”微博關(guān)鍵詞爬蟲(chóng)使用步驟65)系統(tǒng)會(huì)自動(dòng)登錄微博6)微博關(guān)鍵詞爬蟲(chóng)使用步驟77)步驟3:設(shè)置登錄1)再次選中“打開(kāi)網(wǎng)頁(yè)”步驟,打開(kāi)“高級(jí)選項(xiàng)”,打開(kāi)“緩存設(shè)置”,勾選“打開(kāi)網(wǎng)頁(yè)時(shí)使用指定”微博關(guān)鍵詞爬蟲(chóng)使用步驟82)八爪魚(yú)會(huì)記住這個(gè)狀態(tài)。下圖中新建了一個(gè)任務(wù),打開(kāi)微博首頁(yè)。可以看見(jiàn)輸入關(guān)鍵字的爬蟲(chóng)軟件,八爪魚(yú)中以登陸之后的狀態(tài)打開(kāi)之后就可以正式進(jìn)入采集了。微博關(guān)鍵詞爬蟲(chóng)使用步驟9步驟4:創(chuàng)建文本循環(huán)1)同上操作選擇自定義采集復(fù)制網(wǎng)址打開(kāi)網(wǎng)頁(yè)之后,打開(kāi)右上角的流程按鈕,從左邊的流程展示界面拖入一個(gè)循環(huán)的步驟,如下圖