利用Py采集K網(wǎng)最新資源coll.exe是一款利用python爬取針對(duì)網(wǎng)站資源數(shù)據(jù)鏈接的工具,真正的自動(dòng)采集無(wú)需手動(dòng)更新,一個(gè)一個(gè)手動(dòng)提取很麻煩,所以寫了一個(gè)腳本,可以用爬蟲來(lái)抓取網(wǎng)頁(yè)內(nèi)容
它的原理就是模擬用戶訪問(wèn)web網(wǎng)頁(yè),獲取網(wǎng)頁(yè)內(nèi)容,然后分析網(wǎng)頁(yè)內(nèi)容,找出我們感興趣的部分
自己抓取網(wǎng)頁(yè)內(nèi)容,然后自己實(shí)現(xiàn)分析過(guò)程
用別人寫好的爬蟲框架,比如Scrapy