一、提出問題
1、客戶轉(zhuǎn)化率(購(gòu)買轉(zhuǎn)化率、加購(gòu)轉(zhuǎn)化率、喜歡轉(zhuǎn)化率)是多少,提出降低客戶流失的建議?
2、客戶最喜歡的商品類別前10名分別是哪些,從該類商品中得出什么信息?
3、客戶每天的活躍時(shí)間段分布情況,并根據(jù)數(shù)據(jù)表現(xiàn)給業(yè)務(wù)部門提出有效信息。
二、理解數(shù)據(jù)
1、數(shù)據(jù)集介紹:
本數(shù)據(jù)集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之間,有行為的約一百萬(wàn)隨機(jī)用戶的所有行為(行為包括點(diǎn)擊、購(gòu)買、加購(gòu)、喜歡)。數(shù)據(jù)集的組織形式和MovieLens-20M類似,即數(shù)據(jù)集的每一行表示一條用戶行為,由用戶ID、商品ID、商品類目ID、行為類型和時(shí)間戳組成,并以逗號(hào)分隔。
2、數(shù)據(jù)集字段:
注意:用戶行為類型共四種,它們分別是
關(guān)于數(shù)據(jù)集規(guī)模的一些說明如下
3、數(shù)據(jù)來源
阿里巴巴天池
User Behavior Data from Taobao for Recommendation-數(shù)據(jù)集-阿里云天池?tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
4、提取數(shù)據(jù)
使用Navicat在MySQL數(shù)據(jù)框中創(chuàng)建表userbehavior,然后將100萬(wàn)條數(shù)據(jù)導(dǎo)入表中
5、分析維度:客戶(數(shù)量及行為)、商品、時(shí)間。
三、數(shù)據(jù)清洗
1、列名重命名
原數(shù)據(jù)集沒有表頭,在導(dǎo)入數(shù)據(jù)前先用SQL創(chuàng)建表格,建立表名。
2、數(shù)據(jù)類型轉(zhuǎn)換
將字段時(shí)間戳數(shù)據(jù)轉(zhuǎn)換成日期數(shù)據(jù),在SQL中使用函數(shù):
select from_unixtime(時(shí)間戳) from userbehavior;
3、更新數(shù)據(jù)
在原表中更新時(shí)間戳數(shù)據(jù)為日期數(shù)據(jù)
4、提取日期數(shù)據(jù)中的小時(shí)
四、數(shù)據(jù)可視化
(1)
(2)
(3)
五、數(shù)據(jù)可視化得出的結(jié)論
1、客戶轉(zhuǎn)化率(購(gòu)買轉(zhuǎn)化率、加購(gòu)轉(zhuǎn)化率、喜歡轉(zhuǎn)化率)是多少,提出降低客戶流失的建議?
市場(chǎng)上電商行業(yè)的平均成交轉(zhuǎn)化率為3%,而該店家的轉(zhuǎn)化率為2.27%,低于行業(yè)平均水平。
根據(jù)圓環(huán)圖可知,客戶的點(diǎn)擊商品行為占據(jù)90%,說明大部分客戶仍停留在激活階段,并沒有產(chǎn)生實(shí)際購(gòu)買行為,應(yīng)該從網(wǎng)站品牌、商品吸引力、客戶服務(wù)、用戶行為、訪問者質(zhì)量、用戶體驗(yàn)六方面進(jìn)行改進(jìn)。
2、客戶最喜歡的商品類別前10名分別是哪些,從該類商品中得出什么信息?
由圖可知,前十種類型的商品銷售量很好,因此:
(1)在進(jìn)貨時(shí),要根據(jù)歷史每日售量數(shù)據(jù)表現(xiàn),針對(duì)性該類型商品多進(jìn)貨物,預(yù)防出現(xiàn)供不應(yīng)求;
(2)多維度研究前十名類型商品的宣傳手法、營(yíng)銷技巧、商品屬性等因素,給其他售量低的類型商品提供學(xué)習(xí)與借鑒。
3、客戶每天的活躍時(shí)間段分布情況,并根據(jù)數(shù)據(jù)表現(xiàn)給業(yè)務(wù)部門提出有效信息。
由曲線圖可知,
(1)時(shí)間段:0-6(點(diǎn)),客戶活躍數(shù)量保持平穩(wěn)的最低值,因?yàn)閷儆谌藗冊(cè)谒X休息時(shí)間;
(2)時(shí)間段:6-10(點(diǎn)),客戶活躍數(shù)量持續(xù)上升,因?yàn)槿藗兯押螅懤m(xù)開始一天的生活;
(3)時(shí)間段:10-18(點(diǎn)),客戶活躍數(shù)量基本保持平穩(wěn);
(4)時(shí)間段:19-22(點(diǎn)),客戶活躍數(shù)量開始快速上升,在21-22點(diǎn)到達(dá)一天最高值,因?yàn)閷儆谙掳嘧杂蓵r(shí)間段,刷手機(jī)的高峰期;
(5)時(shí)間段:22-24(點(diǎn)):客戶活躍數(shù)量在22點(diǎn)之后迅速下降,這個(gè)時(shí)間段人們都開始進(jìn)入休息。
從中可得出結(jié)論,在休息時(shí)間段:0-6(點(diǎn))和22-24(點(diǎn)),不適合進(jìn)行促銷、新品的廣告推送;在21-22(點(diǎn)),客戶活躍數(shù)量最高值期間,適合各種宣傳和商品推送,激活客戶;
樂發(fā)網(wǎng)超市批發(fā)網(wǎng)提供超市貨源信息,超市采購(gòu)進(jìn)貨渠道。超市進(jìn)貨網(wǎng)提供成都食品批發(fā),日用百貨批發(fā)信息、微信淘寶網(wǎng)店超市采購(gòu)信息和超市加盟信息.打造國(guó)內(nèi)超市采購(gòu)商與批發(fā)市場(chǎng)供應(yīng)廠商搭建網(wǎng)上批發(fā)市場(chǎng)平臺(tái),是全國(guó)批發(fā)市場(chǎng)行業(yè)中電子商務(wù)權(quán)威性網(wǎng)站。
本文內(nèi)容整合網(wǎng)站:百度百科、知乎、淘寶平臺(tái)規(guī)則
本文來源: 淘寶店鋪的數(shù)據(jù)分析