數(shù)據(jù)分析案例之淘寶用戶(hù)行為分析完整報(bào)告
一、項(xiàng)目背景
UserBehavior為淘寶用戶(hù)行為的數(shù)據(jù)集,數(shù)據(jù)集包括了有大約82萬(wàn)隨機(jī)用戶(hù)的用戶(hù)行為(行為包括點(diǎn)擊pv,購(gòu)買(mǎi)buy,加購(gòu)物車(chē)chart,收藏fav)數(shù)據(jù)。
二、項(xiàng)目目標(biāo)
通過(guò)對(duì)用戶(hù)行為的分析,主要實(shí)現(xiàn)下面兩個(gè)目的:
1、為客戶(hù)提供更精準(zhǔn)的隱式反饋,幫助用戶(hù)更快速找到商品;
2、為提高公司的交叉銷(xiāo)售能力,提高轉(zhuǎn)化率,銷(xiāo)售額,提升公司業(yè)績(jī)。
三、分析思路
主要從以下四個(gè)維度對(duì)用戶(hù)行為進(jìn)行分析和建議:
1、用戶(hù)行為間的轉(zhuǎn)化情況分析: 利用 漏斗模型
分析用戶(hù)從商品瀏覽到購(gòu)買(mǎi)整個(gè)過(guò)程中,常見(jiàn)的電商分析指標(biāo),確定各個(gè)環(huán)節(jié)流失率,提出改善轉(zhuǎn)化率的建議。
2、用戶(hù)的行為習(xí)慣分析: 利用pv、uv等指標(biāo),找出用戶(hù)活躍的日期以及每天的活躍時(shí)間段。
3、用戶(hù)類(lèi)目偏好分析:
根據(jù)商品的點(diǎn)擊、收藏、加購(gòu)、購(gòu)買(mǎi)頻率,探索用戶(hù)對(duì)商品的購(gòu)買(mǎi)偏好,找到針對(duì)不同商品的營(yíng)銷(xiāo)策略(購(gòu)買(mǎi)率較高的類(lèi)目和產(chǎn)品,優(yōu)化產(chǎn)品推薦)。
4、用戶(hù)價(jià)值分析: 找出最具有價(jià)值的核心用戶(hù)群,針對(duì)這個(gè)群體推送個(gè)性化推送,優(yōu)惠券或者活動(dòng)。
邏輯如下:

四、數(shù)據(jù)處理
主要使用工具:Navicat for MySQL,MySQL, power BI。
(一)準(zhǔn)備數(shù)據(jù)
1 、數(shù)據(jù)來(lái)源
阿里云天池:
https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
2 、將數(shù)據(jù)導(dǎo)入MySQL
使用Navicat導(dǎo)入功能,導(dǎo)入后結(jié)果如下圖,這里會(huì)出錯(cuò)卡在導(dǎo)入步驟的5/8位置。

使用代碼直接導(dǎo)入,結(jié)果如下圖,未出現(xiàn)上述卡住現(xiàn)象。


3 、數(shù)據(jù)理解
本數(shù)據(jù)主要包含了大概82萬(wàn)條數(shù)據(jù),每一行分別表示一個(gè)用的行為,由用戶(hù)ID(User_ID)、產(chǎn)品ID(Item_ID)、類(lèi)目ID(Category_ID)、行為類(lèi)型(Behavior_type)、時(shí)間戳(Timestamp),行為類(lèi)型又分為點(diǎn)擊(pv)、收藏(fav)、加購(gòu)物車(chē)(chart)、購(gòu)買(mǎi)(buy)。
(二)數(shù)據(jù)清洗
1 、Timestamp一致化處理
Timestamp列,無(wú)法直接分析,需要將其劃分為三列,分別為時(shí)間,日期,小時(shí)。
–添加新列,根據(jù)Date_time返回日期時(shí)間

–添加新列,根據(jù)Date返回日期時(shí)間

–添加新列,根據(jù)Time返回小時(shí)
2 、挑出目標(biāo)數(shù)據(jù)集
由于項(xiàng)目背景是需要對(duì)2017年11月25日至2017年12月3日之間用戶(hù)行為數(shù)據(jù)集進(jìn)行隱式反饋推薦問(wèn)題的研究,所以需要對(duì)不在這個(gè)時(shí)間內(nèi)的數(shù)據(jù)進(jìn)行刪除。
–先檢查是否有在2017-11-01和2017-11-20之間的時(shí)間值。

–刪除掉這段時(shí)間以外的行

3 、刪除重復(fù)值

使用SQL語(yǔ)句發(fā)現(xiàn),有出現(xiàn)重復(fù)字段。

全字段重復(fù)有兩行,下面去重方法并不對(duì)全字段的奏效,我采用的是直接刪除,刪除數(shù)據(jù)僅4行針對(duì)現(xiàn)有的380萬(wàn)行數(shù)據(jù)影響較小。
4 、缺失值處理

對(duì)所有列進(jìn)行了計(jì)數(shù)查詢(xún)后,發(fā)現(xiàn)‘Timestamp’字段有null值,然后我們刪除空值所在的列。
數(shù)據(jù)清洗完畢。
導(dǎo)入數(shù)據(jù)集大小預(yù)覽:

(三)數(shù)據(jù)分析
結(jié)果均為先使用sql分析數(shù)據(jù),獲得分析結(jié)果,然后將分析結(jié)果導(dǎo)出到excel或者power BI中進(jìn)行可視化。
1 、數(shù)據(jù)整體情況概述
a、總體uv、pv、人均瀏覽次數(shù)、成交量

b、日均uv、pv、人均瀏覽次數(shù)、成交量

使用power BI處理數(shù)據(jù)后將其導(dǎo)出后分析對(duì)應(yīng)的每個(gè)指標(biāo)與時(shí)間之間的關(guān)系。




c.用戶(hù)整體行為數(shù)據(jù)

d、用戶(hù)的復(fù)購(gòu)率和跳失率


2017年11月25日至2017年12月3日之間,用戶(hù)的復(fù)購(gòu)率為66.4%且流失率為0.說(shuō)明淘寶對(duì)用戶(hù)有較大的吸引力使用戶(hù)停留且用戶(hù)的忠誠(chéng)度非常高??梢赃M(jìn)一步提高復(fù)購(gòu)率,鼓勵(lì)用戶(hù)更高頻次的購(gòu)物。
2 、用戶(hù)轉(zhuǎn)化情況分析
a、用戶(hù)轉(zhuǎn)化率及流失分析

上圖統(tǒng)計(jì)了各個(gè)行為的總數(shù)量,點(diǎn)擊后,到加購(gòu)物車(chē)或者收藏概率在3%-6%之間,而最后真正購(gòu)買(mǎi)的概率降到了2.4%,說(shuō)明用戶(hù)的行為在瀏覽了商品詳情頁(yè)后出現(xiàn)了大量的流失。但是用戶(hù)是否也是在點(diǎn)擊后產(chǎn)生了大量的流失呢?
對(duì)此,對(duì)各個(gè)用戶(hù)行為類(lèi)型的用戶(hù)數(shù)進(jìn)行了統(tǒng)計(jì),并使用漏斗轉(zhuǎn)化模型進(jìn)行了處理,建立了用戶(hù)轉(zhuǎn)化漏斗圖。


上圖可以看出,用戶(hù)并未點(diǎn)擊后就大量流失,并且最后付費(fèi)用戶(hù)比例達(dá)到了69%,購(gòu)買(mǎi)率達(dá)到了7成,說(shuō)明用戶(hù)的購(gòu)買(mǎi)意愿較為理想。結(jié)合用戶(hù)行為數(shù)統(tǒng)計(jì)推斷用戶(hù)的點(diǎn)擊行為遠(yuǎn)遠(yuǎn)超過(guò)了收藏和加購(gòu)物車(chē)的行為,說(shuō)明用戶(hù)有較大的可能在購(gòu)物時(shí)有“貨比三家”的習(xí)慣。
所以針對(duì)大部分點(diǎn)擊后轉(zhuǎn)化到加購(gòu)物車(chē)和收藏的概率較低有較大的提升空間,APP可以通過(guò)優(yōu)化推薦商品的功能和篩選商品的功能,讓用戶(hù)不用瀏覽較多的網(wǎng)頁(yè)獲得心儀的商品。
那么再回到用戶(hù)轉(zhuǎn)化漏斗圖,從瀏覽到購(gòu)買(mǎi)每個(gè)環(huán)節(jié)的轉(zhuǎn)化率又是多少?為什么收藏比加入購(gòu)物車(chē)少?
由于用戶(hù)點(diǎn)擊后到最后購(gòu)買(mǎi)有四條不同的路徑,分別為:
點(diǎn)擊——購(gòu)買(mǎi)(用戶(hù)留存)


點(diǎn)擊——收藏——購(gòu)買(mǎi)(用戶(hù)留存)


點(diǎn)擊——加購(gòu)物車(chē)——購(gòu)買(mǎi)(用戶(hù)留存)


點(diǎn)擊——收藏和加購(gòu)物車(chē)——購(gòu)買(mǎi)(用戶(hù)留存)


從四種購(gòu)買(mǎi)行為的留存,可以看出用戶(hù)點(diǎn)擊后,若存在后續(xù)行為則主要是加入購(gòu)物車(chē),其次是收藏和加購(gòu)物車(chē),再接下來(lái)是收藏,除此之外還與一部分用戶(hù)是點(diǎn)擊后直接購(gòu)買(mǎi)的??梢灾匮芯恳幌赂黝?lèi)路徑用戶(hù)購(gòu)買(mǎi)的什么產(chǎn)品以及用戶(hù)的標(biāo)簽,通過(guò)優(yōu)化商品推薦和精準(zhǔn)運(yùn)營(yíng)加強(qiáng)這部分的轉(zhuǎn)化。
推斷在收藏的用戶(hù)轉(zhuǎn)換率較低的原因在于用戶(hù)在點(diǎn)擊時(shí)較為喜歡此商品或者說(shuō)活動(dòng)時(shí)間還未開(kāi)始,通過(guò)提醒用戶(hù)等方式精準(zhǔn)運(yùn)營(yíng)提高這部分用戶(hù)的購(gòu)買(mǎi)率。
最后,對(duì)用戶(hù)從收藏到購(gòu)買(mǎi),加購(gòu)物車(chē)到購(gòu)買(mǎi)和收藏和加購(gòu)物車(chē)到購(gòu)買(mǎi)的轉(zhuǎn)化分析來(lái)看,加購(gòu)物車(chē)到購(gòu)買(mǎi)的轉(zhuǎn)化率最高達(dá)到了34.79%,說(shuō)明直接加入到購(gòu)物車(chē)最后購(gòu)買(mǎi)的概率較高,故引導(dǎo)客戶(hù)加入購(gòu)物車(chē)及時(shí)購(gòu)買(mǎi)可以提高購(gòu)買(mǎi)轉(zhuǎn)化率。
3 、用戶(hù)行為習(xí)慣分析
這里主要是對(duì)用戶(hù)購(gòu)買(mǎi)時(shí)間點(diǎn)進(jìn)行分析,找出用戶(hù)活躍的時(shí)間段規(guī)律。
a、行為習(xí)慣分布(日均)


上圖可以看出,在研究日期范圍內(nèi),用戶(hù)活躍度均比較平穩(wěn),但是在12月2日和12月3日出現(xiàn)小幅度的增長(zhǎng),其中點(diǎn)擊量和收藏,尤其是加購(gòu)物車(chē)增幅增大,但是購(gòu)買(mǎi)沒(méi)有較大增幅,分析其原因是由于周末空余時(shí)間較多,用戶(hù)流量增大;再加上雙12很多活動(dòng)預(yù)熱導(dǎo)師用戶(hù)提前添加收藏和加購(gòu)物車(chē),是雙12批量購(gòu)買(mǎi)的前置動(dòng)作,符合常規(guī)預(yù)期。
b、一天內(nèi)用戶(hù)行為習(xí)慣的分布


對(duì)一天內(nèi)的用戶(hù)行為分析可以看出在每天的1點(diǎn)至5點(diǎn)用戶(hù)活躍度驟減,6點(diǎn)至10點(diǎn)迅速攀升,10點(diǎn)到18點(diǎn)趨勢(shì)平穩(wěn),然后快速上升,在21點(diǎn)時(shí)達(dá)到高峰,到23點(diǎn)開(kāi)始下降,這與大部分人的作息規(guī)律相一致,據(jù)此可以考慮在20點(diǎn)至23點(diǎn)間舉行促銷(xiāo)活動(dòng)或者上架新商品來(lái)提高轉(zhuǎn)化率和曝光率。
4 、用戶(hù)類(lèi)目偏好分析
統(tǒng)計(jì)所有商品的購(gòu)買(mǎi)次數(shù),同時(shí)找到購(gòu)買(mǎi)次數(shù)、瀏覽次數(shù)、收藏次數(shù)和加入購(gòu)物車(chē)次數(shù)最多的商品。
a、商品銷(xiāo)售情況分析


上圖看出,用戶(hù)購(gòu)買(mǎi)的商品總共有4001種,購(gòu)買(mǎi)次數(shù)在1次的商品占絕大部分,其次是購(gòu)買(mǎi)次數(shù)為2商品,未出現(xiàn)購(gòu)買(mǎi)次數(shù)集中的商品,說(shuō)明商品的售賣(mài)主要是依靠商品的長(zhǎng)尾效應(yīng),而非爆款商品。
b、商品品類(lèi)瀏覽的top20


上圖可以看出,4756105這類(lèi)商品的瀏覽次數(shù)是最高的。
c、商品品類(lèi)收藏top20


上圖發(fā)現(xiàn)收藏的次數(shù)最多的商品品類(lèi)與瀏覽次數(shù)最多的商品品類(lèi)相同都是4756105.說(shuō)明點(diǎn)擊和收藏同步幾率很大。
d、商品品類(lèi)加購(gòu)物車(chē)top20


商品加購(gòu)物車(chē)的品類(lèi)中有15種在點(diǎn)擊top20中,有14種在收藏top20中,這些商品都具有較高的吸引力。
e、商品品類(lèi)購(gòu)買(mǎi)top20


通過(guò)以上四個(gè)樹(shù)狀圖對(duì)比發(fā)現(xiàn),點(diǎn)擊、收藏、加購(gòu)的top5中均均有一個(gè)商品品類(lèi)即4145813.在商品購(gòu)買(mǎi)同屏以?xún)?nèi),說(shuō)明點(diǎn)擊、收藏、加購(gòu)所吸引的用戶(hù)注意力和流量并不能很好的轉(zhuǎn)化為實(shí)際的商品銷(xiāo)量,這是銷(xiāo)量增長(zhǎng)的突破點(diǎn)。
此外, 我們發(fā)現(xiàn)商品銷(xiāo)量的主要集中在幾個(gè)品類(lèi),所以可以根據(jù)商品的銷(xiāo)量來(lái)優(yōu)化商品的展示,提高商品銷(xiāo)售額。
5 、用戶(hù)價(jià)值分析(RFM模型)
在本次分析中由于沒(méi)有提供金額,所以這次分析主要以R、F兩個(gè)維度對(duì)用戶(hù)群進(jìn)行分析。
首先,定義一下本次分析用戶(hù)群的分類(lèi)標(biāo)準(zhǔn):
F(3-4)
|
重要保持客戶(hù)
|
重要價(jià)值用戶(hù)
—|---|—
F(1-2)
|
重要挽留客戶(hù)
|
重要發(fā)展用戶(hù)
|
R(1-2)
|
R(3-4)
由于數(shù)據(jù)集的時(shí)間僅有9天,設(shè)定一下規(guī)則,對(duì)每個(gè)用戶(hù)最近一次購(gòu)買(mǎi)時(shí)間和12月03日之間的間隔設(shè)立等級(jí):
間隔>7天為1;
間隔在5-7天為2;
間隔在3-4天為3;
間隔在0-2天為4;

同樣對(duì)購(gòu)買(mǎi)頻次設(shè)定以下規(guī)則,對(duì)每個(gè)用戶(hù)購(gòu)買(mǎi)次數(shù)設(shè)立等級(jí):
購(gòu)買(mǎi)次數(shù)在1-10之間為1;
購(gòu)買(mǎi)次數(shù)在10-20之間為2;
購(gòu)買(mǎi)次數(shù)在20-300之間為3;
購(gòu)買(mǎi)次數(shù)在>30之間為4.

根據(jù)上面最后一次購(gòu)買(mǎi)時(shí)間和購(gòu)買(mǎi)次數(shù)的等級(jí)規(guī)則,用四象限法劃分出來(lái)的用戶(hù)群如下:

根據(jù)用戶(hù)群體劃分,可以群體數(shù)最多的是最重要發(fā)展客戶(hù),針對(duì)這部分用戶(hù)可采取針對(duì)性營(yíng)銷(xiāo)策略提高其復(fù)購(gòu)率,增加購(gòu)買(mǎi)頻次。
五、結(jié)論
(一)通過(guò)用戶(hù)轉(zhuǎn)化情況分析
總體來(lái)看用戶(hù)從點(diǎn)擊到購(gòu)買(mǎi)的的轉(zhuǎn)化率達(dá)到了69%,達(dá)到了比較高的水平;細(xì)分來(lái)看,對(duì)用戶(hù)從收藏到購(gòu)買(mǎi),加購(gòu)物車(chē)到購(gòu)買(mǎi)和收藏和加購(gòu)物車(chē)到購(gòu)買(mǎi)的不同路徑轉(zhuǎn)化分析來(lái)看,加購(gòu)物車(chē)到購(gòu)買(mǎi)的轉(zhuǎn)化率最高達(dá)到了34.79%,說(shuō)明直接加入到購(gòu)物車(chē)最后購(gòu)買(mǎi)的概率較高,故引導(dǎo)客戶(hù)加入購(gòu)物車(chē)及時(shí)購(gòu)買(mǎi)可以提高購(gòu)買(mǎi)轉(zhuǎn)化率。而從點(diǎn)擊直接到購(gòu)買(mǎi)的轉(zhuǎn)化率較低,僅為7.2%,故這部分轉(zhuǎn)化率是一個(gè)提高的重點(diǎn)。針對(duì)這一環(huán)節(jié)的建議有:
1、優(yōu)化平臺(tái)的搜索匹配度和推薦策略,提高篩選精度,對(duì)搜索和篩選的結(jié)果排序的優(yōu)先級(jí)進(jìn)行優(yōu)化。
2、可以給用戶(hù)提供同類(lèi)產(chǎn)品比較的功能,讓用戶(hù)不需要多次的返回搜索結(jié)果點(diǎn)擊查看,方便用戶(hù)確定心儀的產(chǎn)品,增加點(diǎn)擊
后續(xù)行為的轉(zhuǎn)化率。
3、優(yōu)化收藏到購(gòu)買(mǎi)的擦操作過(guò)程,增加用戶(hù)收藏并加購(gòu)的頻率,提高轉(zhuǎn)化率。
(二)通過(guò)用戶(hù)行為分析
1、用戶(hù)活躍度最高的時(shí)間段是每天的21點(diǎn)-23點(diǎn),因此可以將促銷(xiāo)活動(dòng)安排在每周的晚上這個(gè)時(shí)間段,此時(shí)流量最高,通過(guò)引流并轉(zhuǎn)化。
2、在研究9天內(nèi)共有2個(gè)周末,第一個(gè)周末用戶(hù)活躍度未有明顯變化,推測(cè)雙11活動(dòng)剛過(guò)去,用戶(hù)的消費(fèi)需求和意愿不高;第二個(gè)周末用戶(hù)活躍度有明顯變化,尤其是加購(gòu)物車(chē)變化最為明顯,推測(cè)與雙12活動(dòng)預(yù)熱有關(guān),故建議擴(kuò)大時(shí)間范圍對(duì)周末對(duì)用戶(hù)活躍度的影響,來(lái)進(jìn)一步確定周末推出營(yíng)銷(xiāo)活動(dòng)是否奏效。
(三)通過(guò)用戶(hù)的商品偏好分析
可以看出目前商品主要靠長(zhǎng)尾效應(yīng)來(lái)增加銷(xiāo)量,而不是爆款帶動(dòng)銷(xiāo)量。但是通過(guò)對(duì)商品品類(lèi)的分析可以看出吸引用戶(hù)注意力的商品用戶(hù)購(gòu)買(mǎi)轉(zhuǎn)化率并不高,這是一個(gè)提高銷(xiāo)量的突破口,建議可從以下幾方面著手:
1、商品在詳情頁(yè)突出展示用戶(hù)感興趣的信息,優(yōu)化信息呈現(xiàn)的方式,減少用戶(hù)的時(shí)間成本。
2、從商品本身考慮,根據(jù)客戶(hù)反饋對(duì)商品進(jìn)行改進(jìn)優(yōu)化,增加點(diǎn)擊后的購(gòu)買(mǎi)率。
3、對(duì)客戶(hù)購(gòu)買(mǎi)率較高的商品優(yōu)先顯示,滿(mǎn)足用戶(hù)的購(gòu)買(mǎi)需求。
4、對(duì)某些點(diǎn)擊量較高但是購(gòu)買(mǎi)率不高的的商品可采取直播帶貨的方式進(jìn)行講解促銷(xiāo),增加客戶(hù)購(gòu)買(mǎi)欲望。
(四)通過(guò)RFM模型對(duì)用戶(hù)群分析
對(duì)不同類(lèi)型的用戶(hù)群可采取不同的營(yíng)銷(xiāo)策略,達(dá)到高效率精準(zhǔn)營(yíng)銷(xiāo)的效果。
1、對(duì)重要價(jià)值客戶(hù),需要重點(diǎn)關(guān)注,提高用戶(hù)的滿(mǎn)意度,增加留存;
2、對(duì)重要發(fā)展客戶(hù)和重要保持用戶(hù),可以采取適當(dāng)?shù)恼劭刍蛘呃変N(xiāo)售來(lái)增加用戶(hù)的購(gòu)買(mǎi)頻率;
3、對(duì)重要挽留客戶(hù),需要關(guān)注他們的購(gòu)物習(xí)慣做精準(zhǔn)營(yíng)銷(xiāo),換醒其購(gòu)物欲望。
六、結(jié)語(yǔ)
在整個(gè)分析過(guò)程中,不管選取多少維度數(shù)據(jù),畫(huà)多么精美的圖形,得出多么精妙的結(jié)論,歸根結(jié)底還是要有最后真正落地解決問(wèn)題的措施,而這也是本次數(shù)據(jù)分析報(bào)告最大的不足,但是需要經(jīng)驗(yàn)需要一個(gè)累積的過(guò)程,希望下一個(gè)數(shù)據(jù)分析報(bào)告能夠取長(zhǎng)補(bǔ)短,查缺補(bǔ)漏,內(nèi)容更加充實(shí),繼續(xù)加油!!!
樂(lè)發(fā)網(wǎng)超市批發(fā)網(wǎng)提供超市貨源信息,超市采購(gòu)進(jìn)貨渠道。超市進(jìn)貨網(wǎng)提供成都食品批發(fā),日用百貨批發(fā)信息、微信淘寶網(wǎng)店超市采購(gòu)信息和超市加盟信息.打造國(guó)內(nèi)超市采購(gòu)商與批發(fā)市場(chǎng)供應(yīng)廠(chǎng)商搭建網(wǎng)上批發(fā)市場(chǎng)平臺(tái),是全國(guó)批發(fā)市場(chǎng)行業(yè)中電子商務(wù)權(quán)威性網(wǎng)站。
本文內(nèi)容整合網(wǎng)站:百度百科、知乎、淘寶平臺(tái)規(guī)則
本文來(lái)源: 數(shù)據(jù)分析案例之淘寶用戶(hù)行為分析完整報(bào)告