第一部分、梳理數(shù)據(jù)分析步驟及實操工具學(xué)習(xí)
數(shù)據(jù)分析的5個關(guān)鍵步驟:
明確問題→理解數(shù)據(jù)→數(shù)據(jù)清洗→數(shù)據(jù)分析或者構(gòu)建模型→數(shù)據(jù)可視化
1、明確問題
2、理解數(shù)據(jù)
3、數(shù)據(jù)清洗
數(shù)據(jù)重復(fù)-刪除重復(fù)項
數(shù)據(jù)抽取-left/right/mid
數(shù)據(jù)計算-average/sum/max/min/date/if/or/countif
清洗步驟
選擇子集→列名重命名→刪除重復(fù)值→缺失值處理→一致化處理→數(shù)據(jù)排序→異常值處理
函數(shù)3個功能:功能、輸入、輸出
比如:平均值average
截取字符串函數(shù):
①left-字符串所在單元格位置,從左開始到XX位置進行截取
②right-字符串所在單元格位置,從右開始到XX位置進行截圖
③mid-字符串所在單元格位置,開始位置,截取長度
④find(要查找的字符串,字符串所在的單元格位置)
薪水 (7k-9k)
位置 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
字符串 | 7 | k | - | 9 | k |
最低薪水=left(A2.2)
最高薪水=mid(A2.起始位置,截取長度)
起始位置=find(“-”,A2)+1
截取長度
①find(“-”,A2)
②len(A2)-find(“-”,A2)
③len(A2)-find(“-”,A2)-1
最高薪水=mid(A2.find("-",A2)+1.len(A2)-find("-",A2)-1)
異常值處理常用工具excel透視表
數(shù)據(jù)透視表的原理:數(shù)據(jù)分組(split)→應(yīng)用函數(shù)(apply)→組合結(jié)果
對數(shù)據(jù)進行分類,如大學(xué)專業(yè)的分組
每組函數(shù)進行計算
對幾組數(shù)據(jù)進行組合
異常值處理
①find({“數(shù)據(jù)運營”,”數(shù)據(jù)分析“,“分析師”},L2)
②count(find({“數(shù)據(jù)運營”,”數(shù)據(jù)分析“,“分析師”},L2))
③IF(COUNT(FIND({"數(shù)據(jù)運營","數(shù)據(jù)分析","分析師"},L3)),"是","否")
4、數(shù)據(jù)分析或者構(gòu)建模型(解決某一類問題的辦法都可以叫模型)
分組匯總-數(shù)據(jù)透視表
描述統(tǒng)計分析-分析工具庫
多表關(guān)聯(lián)查詢-vlookup
vlookup(找什么,在哪找,第幾列,是準(zhǔn)確找還是近似找)
三種引用方式及快捷操作
絕對引用、$A$1-按一次F4
混合引用、A$1-按二次F4、$A1-按三次F4
相對引用、A1+A2.按四次F4
第二部分、淘寶天貓數(shù)據(jù)數(shù)據(jù)分析
1、明確問題
本次數(shù)據(jù)分析主要關(guān)注以下幾個問題:
①用戶群的分布情況?
②用戶對于商品的使用習(xí)慣是什么樣?
③用戶對于商品購買習(xí)慣是什么樣?
2、理解數(shù)據(jù)
從購買商品的數(shù)據(jù)表里可知主要包含以下信息:誰買的-用戶ID、什么樣的商品-商品編號/商品二級分類/商品一級分類/商品屬性、購買的數(shù)量與時間。
從嬰兒信息的數(shù)據(jù)表里可知主要包含以下信息:用戶ID、出生日期、性別
3、數(shù)據(jù)清洗
選擇子集→列名重命名→刪除重復(fù)值→缺失值處理→一致化處理→數(shù)據(jù)排序→異常值處理
第一步:對表1和表2數(shù)據(jù)進行初步關(guān)聯(lián),表1共2萬于條數(shù)據(jù),表2共952條數(shù)據(jù);
第二步:將表2中數(shù)據(jù)通過vlookup關(guān)聯(lián)至表1中;
第三步:根據(jù)用戶ID將重復(fù)項進行刪除;
第四步:針對缺失值、異常值進行補充,做一致化與排序處理;
4、數(shù)據(jù)分析或者構(gòu)建模型
第一步:借助數(shù)據(jù)透視表進行多維度分析
根據(jù)以上分析可知:2萬余名用戶中使用該商品的群體主要以2013年出生的女生居多。
第二步:2萬余名的用戶中使用商品最多的是“12310741985”號商品,一類商品中“50008168”用戶使用最多,二類商品中“50013636”用戶使用最多
第三步:用戶在14年第四季度的購買力是最大的,其中主要是雙十一期間的購買量很多
以上是對本次數(shù)據(jù)的初步,煩請指正!灰常感謝!
樂發(fā)網(wǎng)超市批發(fā)網(wǎng)提供超市貨源信息,超市采購進貨渠道。超市進貨網(wǎng)提供成都食品批發(fā),日用百貨批發(fā)信息、微信淘寶網(wǎng)店超市采購信息和超市加盟信息.打造國內(nèi)超市采購商與批發(fā)市場供應(yīng)廠商搭建網(wǎng)上批發(fā)市場平臺,是全國批發(fā)市場行業(yè)中電子商務(wù)權(quán)威性網(wǎng)站。
本文內(nèi)容整合網(wǎng)站:百度百科、知乎、淘寶平臺規(guī)則