對(duì)某一淘寶商品購買信息進(jìn)行數(shù)據(jù)分析,在進(jìn)行數(shù)據(jù)清洗后,進(jìn)入分析階段,回答以下問題。
1.明確問題:
用戶和購買量——篩選出店鋪的忠實(shí)顧客?
本來是想通過多表關(guān)聯(lián)查詢,了解忠實(shí)顧客達(dá)到嬰兒具體信息,可以針對(duì)性的推出產(chǎn)品,但是表2 嬰兒信息的用戶數(shù)量遠(yuǎn)少于表1 ,大多用戶在表2中查詢不到,實(shí)際操作中這個(gè)思路可以嘗試。
購買時(shí)間和購買量有何關(guān)聯(lián)——了解客戶的購買習(xí)慣?
商家在14年的銷售量最佳,2012年和2015年都不是完整的月份。
在數(shù)據(jù)段中,2013年和2014年具有完整的銷售月份數(shù)據(jù),商品銷售量整體是上升的趨勢(shì),出現(xiàn)了兩個(gè)峰值,分別在5月份和11月份,可能是顧客的需求增大或者商家的促銷活動(dòng)力度較大和產(chǎn)品推廣明顯,較其他月份,2月屬于淡季。
嬰兒出生日期和購買量之間的關(guān)系——了解產(chǎn)品面對(duì)的客戶群體特征?
可以看出,2011年后出生的嬰兒銷售量占主要部分,前面交代了2015年的數(shù)據(jù)只有前面幾個(gè)月,所以在此條分析中可以不考慮2015年的數(shù)據(jù),在2011-2014年的銷售量中,男嬰的銷售量均大于女嬰的銷售量。
嬰兒性別和購買量之間的關(guān)系——了解產(chǎn)品面對(duì)的客戶群體特征?
在現(xiàn)有數(shù)據(jù)中發(fā)現(xiàn),男嬰的銷售量大于女嬰的銷售量
2. 理解數(shù)據(jù):列名含義
表一購買商品包含的列名有:
User_id表示用戶的賬號(hào),具有唯一性
Auction_id表示物品編號(hào)
Cat_id表示商品種類
Cat1表示商品屬于哪個(gè)類別
Property表示商品屬性
Buy_mount表示用戶購買這件物品的數(shù)量
Day表示用戶購買該物品的時(shí)間
表二嬰兒信息包含的列名有:
User_id表示用戶的賬號(hào),具有唯一性
Birthday表示嬰兒的出生日期
Gender表示嬰兒的性別:“1”代表女生,“0”代表男生
3.數(shù)據(jù)清洗:
選擇子集:可隱藏不需要用到的列信息
列名重命名
刪除重復(fù)值:數(shù)據(jù)選項(xiàng)下刪除重復(fù)項(xiàng)
缺失值處理:統(tǒng)計(jì)缺失值:定位到空值,輸入內(nèi)容時(shí)可按Ctrl+Enter,其他空白單元格也會(huì)填充相同內(nèi)容
一致化處理
數(shù)據(jù)排序
異常值處理
日期數(shù)字處理
4. 數(shù)據(jù)分析:
分組匯總 【數(shù)據(jù)透視表】
統(tǒng)計(jì)描述分析 【分析工具庫】
多表關(guān)聯(lián)查詢
樂發(fā)網(wǎng)超市批發(fā)網(wǎng)提供超市貨源信息,超市采購進(jìn)貨渠道。超市進(jìn)貨網(wǎng)提供成都食品批發(fā),日用百貨批發(fā)信息、微信淘寶網(wǎng)店超市采購信息和超市加盟信息.打造國內(nèi)超市采購商與批發(fā)市場(chǎng)供應(yīng)廠商搭建網(wǎng)上批發(fā)市場(chǎng)平臺(tái),是全國批發(fā)市場(chǎng)行業(yè)中電子商務(wù)權(quán)威性網(wǎng)站。
本文內(nèi)容整合網(wǎng)站:百度百科、知乎、淘寶平臺(tái)規(guī)則
本文來源: 淘寶電商數(shù)據(jù)分析