做數(shù)據(jù)分析,沒有數(shù)據(jù),是分析師的硬傷。但不完全是硬傷,沒有數(shù)據(jù)其實(shí)也可以利用邏輯思維能力來分析推斷,這個以后有機(jī)會跟大家分享。今天,我要講怎么用代碼獲取數(shù)據(jù)。
沒辦法很詳細(xì)地講,只能大致上講解一下,然后給個實(shí)例。
工具:Excel2013(用哪個版本都是可以的)
語言:Visual Basic for Applications(簡稱VBA,集成在Office套件里面的開發(fā)程式,有些精簡版或者用戶在安裝的時候取消了VBA套件,就會無法啟動)
我原本學(xué)的是硬件開發(fā),只會匯編,寫這類程序不是我擅長的,而且是自學(xué)的只有半桶水的狀態(tài)。我寫的程序都有很大的優(yōu)化空間,如果有更高效的方法,請不吝指教。
實(shí)例一:獲取淘寶搜索結(jié)果頁寶貝信息
如下圖,搜索了關(guān)鍵詞“T恤”后,會看到類似這樣的結(jié)果,我想把寶貝標(biāo)題和價格,排名位置等信息給抓取到本地?cái)?shù)據(jù)庫或者表格里面。
我們右擊一下頁面,點(diǎn)查看源文件
看到的結(jié)果如下
這個是網(wǎng)頁源碼,我要介紹的方法,就是通過網(wǎng)頁請求,獲取這里的源碼,然后再對源碼進(jìn)行解析。
觀察源碼這個步驟很重要,在這里會決定數(shù)據(jù)要怎么拿。
比如要取出標(biāo)題
標(biāo)題是在 title= 后面的一串字符,又以 > 符號結(jié)束。把這兩個看成是分隔符的話,那么標(biāo)題就藏在兩個分隔符的中間。
那么,思路上,只要知道這兩個分割符的位置,那么,就可以取出標(biāo)題了。
樂發(fā)網(wǎng)超市批發(fā)網(wǎng)提供超市貨源信息,超市采購進(jìn)貨渠道。超市進(jìn)貨網(wǎng)提供成都食品批發(fā),日用百貨批發(fā)信息、微信淘寶網(wǎng)店超市采購信息和超市加盟信息.打造國內(nèi)超市采購商與批發(fā)市場供應(yīng)廠商搭建網(wǎng)上批發(fā)市場平臺,是全國批發(fā)市場行業(yè)中電子商務(wù)權(quán)威性網(wǎng)站。
本文內(nèi)容整合網(wǎng)站:百度百科、知乎、淘寶平臺規(guī)則