午夜视频在线网站,日韩视频精品在线,中文字幕精品一区二区三区在线,在线播放精品,1024你懂我懂的旧版人,欧美日韩一级黄色片,一区二区三区在线观看视频

分享

數(shù)據(jù)分析常用6種分析思路

 天下小糧倉(cāng) 2019-04-07
數(shù)據(jù)分析常用6種分析思路
數(shù)據(jù)分析常用6種分析思路
數(shù)據(jù)分析常用6種分析思路

文章發(fā)布于公號(hào)【數(shù)智物語(yǔ)】 (ID:decision_engine),關(guān)注公號(hào)不錯(cuò)過(guò)每一篇干貨。

轉(zhuǎn)自 | CrossHands

作者 | Ahong

作為數(shù)據(jù)分析師,你是否常因?yàn)槿狈Ψ治鏊悸?,而被以下?wèn)題影響到幸福感(甚至懷疑人生)?

1. 新上線某個(gè)產(chǎn)品,需要監(jiān)控轉(zhuǎn)化率效果,既要看總體情況,也要看細(xì)分渠道;

2. 策劃營(yíng)銷(xiāo)活動(dòng),預(yù)算有限,要看看選擇哪些目標(biāo)用戶(hù)群、采用哪種方案帶來(lái)的銷(xiāo)量更高(更能拉動(dòng)KPI);

3. KPI又出現(xiàn)較大波動(dòng),待會(huì)領(lǐng)導(dǎo)估計(jì)要問(wèn)起來(lái),趕緊分析數(shù)據(jù)找原因;

一個(gè)問(wèn)題就是從天上隨機(jī)掉落的食材,分析思維就是將這些奇形怪狀的食材加工成“看得懂”的美味佳肴。既然要做菜,有哪些值得借鑒的“萬(wàn)金油”菜譜呢? 本篇會(huì)為你慢慢道來(lái)。

01

流程

完成一項(xiàng)任務(wù),通常需要一系列操作,比如做菜,得先想好吃啥,然后買(mǎi)菜、洗菜、切菜、炒菜。

1.1

行動(dòng)步驟

行動(dòng)步驟就是先確定起點(diǎn)、終點(diǎn)(目標(biāo)),然后將起點(diǎn)和終點(diǎn)的距離拆分成一個(gè)個(gè)小步驟,知道先做什么,后做什么。

數(shù)據(jù)分析常用6種分析思路

注:圖中小黑點(diǎn)表示該步驟下可以選擇的行動(dòng)方案

e.g. 常見(jiàn)的數(shù)據(jù)分析路徑之一是SAS公司提出的SEMMA范式

1. Sample,數(shù)據(jù)抽樣,保證數(shù)據(jù)的效度和信度;

效度是指數(shù)據(jù)的準(zhǔn)確性,也指選擇的數(shù)據(jù)和分析目標(biāo)及業(yè)務(wù)目標(biāo)是吻合的;

信度是指數(shù)據(jù)的穩(wěn)定性,要保證樣本數(shù)據(jù)有代表性,且在一定周期內(nèi)不能有過(guò)大的波動(dòng)(否則模型不穩(wěn)定);

2. Explore,數(shù)據(jù)特征探索及預(yù)處理,e.g. 看數(shù)據(jù)的分布情況、對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化等;

3. Modefy,明確問(wèn)題、模型選擇、方案調(diào)整;

4. Model,執(zhí)行建模方案;

5. Assess,結(jié)果評(píng)估(準(zhǔn)確性、穩(wěn)定性、是否符合業(yè)務(wù)預(yù)期、效益如何);

另一個(gè)常用的數(shù)據(jù)分析范式是CRISP-DM,分為6個(gè)步驟:

數(shù)據(jù)分析常用6種分析思路

1. 商業(yè)理解:確定業(yè)務(wù)目標(biāo),評(píng)估現(xiàn)有資源,確定分析目標(biāo),制定解決方案;

2. 數(shù)據(jù)理解:數(shù)據(jù)采集,探索分析,數(shù)據(jù)質(zhì)量驗(yàn)證;

3. 數(shù)據(jù)準(zhǔn)備:篩選數(shù)據(jù),數(shù)據(jù)清洗,整合數(shù)據(jù),變量衍生;

4. 建立模型:模型選擇,檢驗(yàn)設(shè)計(jì),模型建立,結(jié)果評(píng)估;

5. 模型評(píng)估:分析結(jié)果和業(yè)務(wù)目標(biāo)匹配度確認(rèn),檢查1-4步的執(zhí)行過(guò)程,確定下一步行動(dòng);

6. 結(jié)果部署:規(guī)劃部署方案、監(jiān)控和維護(hù)方案,輸出項(xiàng)目報(bào)告,項(xiàng)目復(fù)盤(pán);

e.g. 一個(gè)報(bào)表上線的基本步驟如下:

需求登記 --> 方案規(guī)劃 --> 需求排期 --> 數(shù)據(jù)ETL--> 代碼編寫(xiě) --> 數(shù)據(jù)驗(yàn)證 --> 報(bào)表上線

1.2

分步轉(zhuǎn)化

要連續(xù)完成多個(gè)步驟,有的人“淺嘗輒止”,有的人“半途而廢”,有的人則是“善始善終”。

產(chǎn)品轉(zhuǎn)化的每個(gè)步驟都會(huì)有用戶(hù)流失,好比100個(gè)人參加有9個(gè)關(guān)卡的淘汰游戲,每個(gè)關(guān)卡會(huì)淘汰10個(gè)人,整個(gè)游戲最終會(huì)剩下10個(gè)獲勝者,把這個(gè)游戲看作產(chǎn)品,那么該產(chǎn)品的全流程轉(zhuǎn)化率就是10%(游戲獲勝率)。

數(shù)據(jù)分析常用6種分析思路

注:電商APP一般的轉(zhuǎn)化漏斗

e.g. 常見(jiàn)的電商流程如下:

注冊(cè)-->登錄-->瀏覽商品-->加購(gòu)物車(chē)-->支付-->售后

將上述步驟整理成魚(yú)骨圖,每個(gè)大步驟下還可以拆分更細(xì)的小步驟;

比如“支付環(huán)節(jié)”可以拆分為:

收貨地址確認(rèn)--> 選擇優(yōu)惠 --> 選擇支付方式 --> 輸入短信驗(yàn)證碼-->返回支付結(jié)果(成功或失敗)

e.g. 在用戶(hù)運(yùn)營(yíng)理念中有這樣一個(gè)轉(zhuǎn)化公式:路人-->用戶(hù)-->粉絲-->員工,先把圍觀的感興趣的路人轉(zhuǎn)化為用戶(hù),輕度用戶(hù)是產(chǎn)品的使用者,中度用戶(hù)是產(chǎn)品的“追隨者”,重度用戶(hù)則會(huì)主動(dòng)參與產(chǎn)品的功能反饋和改進(jìn)建議,在這個(gè)轉(zhuǎn)化過(guò)程中用戶(hù)的參與度逐步提高。

1.3

閉環(huán)迭代

一般的閉環(huán)流程包括3部分:事前方案規(guī)劃,事中執(zhí)行監(jiān)控,事后復(fù)盤(pán)總結(jié)。

e.g. 營(yíng)銷(xiāo)活動(dòng)

事前:確定目標(biāo),選定用戶(hù),制定方案,確定檢驗(yàn)標(biāo)準(zhǔn)等;

事中:實(shí)時(shí)數(shù)據(jù)監(jiān)控(是否達(dá)到預(yù)期),不同方案賽馬,備用方案啟用等;

事后:對(duì)整個(gè)流程復(fù)盤(pán),總結(jié)經(jīng)驗(yàn),CSS歸類(lèi)(Continue做先前已驗(yàn)證的正確的事,Stop做錯(cuò)誤的事,Start做新的正確的事)

常用的閉環(huán)迭代框架是PDCA,通過(guò)計(jì)劃(P)、實(shí)施(D)、檢查(C)、總結(jié)(A)4個(gè)步驟,循環(huán)迭代,螺旋上升。

數(shù)據(jù)分析常用6種分析思路

另外還要注意,在使用流程化思維時(shí),除了常見(jiàn)的正向思考,也要逆向思考。

02

分類(lèi)

互聯(lián)網(wǎng)時(shí)代最核心的經(jīng)營(yíng)理念是深耕客群,通過(guò)差異化運(yùn)營(yíng)提升ARPU值(Average Revenue Per User,每用戶(hù)平均收入),而分類(lèi)無(wú)疑是開(kāi)展這項(xiàng)工作的重要前提。

主要有4種分類(lèi)方法:

二分法,非此即彼,e.g. 網(wǎng)站新客、老客,貸款審批結(jié)果分為通過(guò)申請(qǐng)、拒絕申請(qǐng)等;

并列分類(lèi),多個(gè)分類(lèi)(子集)構(gòu)成一個(gè)全集,e.g. 用戶(hù)地域可以按省份劃分,按年齡可以將用戶(hù)分為70后、80后、90后、00后等,女性用戶(hù)群體可以分為時(shí)尚麗人、都市白領(lǐng)、家庭主婦等;

等級(jí)分類(lèi),e.g. 會(huì)員等級(jí)——鐵牌、銅牌、銀牌、金牌、鉆石、皇冠,城市等級(jí)——一線、二線、三線、四線;

矩陣象限,e.g. 波士頓矩陣,RFM象限

數(shù)據(jù)分析常用6種分析思路

注:圖片來(lái)自網(wǎng)絡(luò)

分類(lèi)的規(guī)則大致有兩類(lèi):

按主體分類(lèi),

e.g. 按社會(huì)關(guān)系模型,用戶(hù)角色可以是父母、配偶、子女、朋友等;

e.g. 按照群體劃分,可以分為一般情況和特殊情況、二八原則等;

按屬性分類(lèi),依據(jù)主體(比如用戶(hù))的屬性進(jìn)行類(lèi)別劃分。

e.g. 用戶(hù)畫(huà)像時(shí)可以考慮以下屬性:

1. 社會(huì)屬性:收入水平、學(xué)歷、職業(yè)、婚姻情況等

2. 位置屬性:居住地、工作地、從手機(jī)端還是PC端登錄等

3. 生物屬性:年齡、性別、種族等

4. 心理屬性:品牌偏好、購(gòu)買(mǎi)行為、優(yōu)惠偏好等

03

對(duì)比

“痛苦來(lái)自比較之中”(沒(méi)有比較就沒(méi)有傷害),其實(shí)幸福也來(lái)自比較之中,痛苦還是幸福,取決于選擇的參照點(diǎn)是高于還是低于你。

對(duì)比就是找一個(gè)參照點(diǎn),來(lái)發(fā)現(xiàn)兩個(gè)數(shù)據(jù)間的差異量Δ大小如何。

對(duì)比可以分為兩類(lèi):橫向?qū)Ρ?、縱向?qū)Ρ取?/p>

3.1

橫向?qū)Ρ?/p>

數(shù)據(jù)分析常用6種分析思路

和同類(lèi)(競(jìng)品)比較,e.g. 對(duì)比不同品牌的女裝的銷(xiāo)售情況,不同銷(xiāo)售渠道(地區(qū))的交易情況;

實(shí)驗(yàn)對(duì)比,設(shè)置實(shí)驗(yàn)組和對(duì)比組,對(duì)比兩組或多組之間的差異,以確定人為干預(yù)(實(shí)驗(yàn)、方案)的效應(yīng)。

e.g. 比較不同的產(chǎn)品或運(yùn)營(yíng)方案的效果差異時(shí),常采用AB Test,需要確保對(duì)比的兩組或者多組在數(shù)量和結(jié)構(gòu)上要具有可比性(e.g. 用戶(hù)的來(lái)源、等級(jí)等需要匹配);

和整體比較,e.g. 華東地區(qū)的銷(xiāo)售情況和全國(guó)總體銷(xiāo)售比較;

做組間比較時(shí),一定要確保樣本的可比性(無(wú)論是在數(shù)量級(jí)還是在群體結(jié)構(gòu)上),e.g. 對(duì)比兩個(gè)時(shí)間段的交易情況,建議剔除掉大促和節(jié)假日(這些交易日的數(shù)據(jù)波動(dòng)很大)。

有兩類(lèi)不易察覺(jué)的樣本錯(cuò)誤尤其要提防:

“辛普森悖論”,即兩個(gè)樣本單獨(dú)得到的結(jié)論和樣本合并后得到的結(jié)論相反。

e.g. 如下表所示,單獨(dú)看APP端和PC端,新客的轉(zhuǎn)化率都是低于老客的,但是,整體新客的轉(zhuǎn)化率卻高于老客。

數(shù)據(jù)分析常用6種分析思路

注:以上數(shù)據(jù)僅作為說(shuō)明概念使用,不代表真實(shí)場(chǎng)景

“幸存者偏差”,即樣本已經(jīng)被容易忽略的因素篩選過(guò)。

e.g. 問(wèn)卷調(diào)查中,那些愿意填寫(xiě)問(wèn)卷的用戶(hù)本身就是對(duì)產(chǎn)品有高認(rèn)可度;

e.g. 產(chǎn)品漏斗轉(zhuǎn)化流程中,處在不同環(huán)節(jié)的用戶(hù)一般不能進(jìn)行對(duì)比

3.2

縱向?qū)Ρ?/p>

橫向是和其他對(duì)象比較,縱向則是和自己的歷史數(shù)據(jù)對(duì)比。

常見(jiàn)的縱向?qū)Ρ扔型群铜h(huán)比,對(duì)比的周期根據(jù)實(shí)際情況可以按日、周、月、季、年等。

數(shù)據(jù)分析常用6種分析思路

注:一個(gè)常用的多組對(duì)比柱狀圖

對(duì)比的時(shí)候,除了比較相對(duì)量,也要看絕對(duì)量,以合理地評(píng)估數(shù)據(jù)差異的大小。

e.g. 0.5%的波動(dòng)是大還是小,需要找參考點(diǎn),如果歷史波動(dòng)最高也就0.1%,那么這個(gè)波動(dòng)就很大。

e.g. 公眾號(hào)關(guān)注人數(shù)昨日環(huán)比增長(zhǎng)20%(看著還不錯(cuò)),實(shí)際上才增加4個(gè)人,截止前天也就20個(gè)人。

04

關(guān)聯(lián)

看數(shù)據(jù)指標(biāo)不要只看一個(gè)“點(diǎn)”,還要看一條“線”上的前后連接的環(huán)節(jié),進(jìn)而從“面”或“體”的角度去看整個(gè)大環(huán)境中都有哪些因素相互作用。

對(duì)現(xiàn)象的分析可以參考簡(jiǎn)單的調(diào)節(jié)模型:

數(shù)據(jù)分析常用6種分析思路

其中:X是自變量,Y是因變量,M是調(diào)節(jié)變量。

尋找關(guān)聯(lián)關(guān)系時(shí),不僅僅要找出對(duì)Y有直接影響的X(一個(gè)或者多個(gè)),還要找出影響X對(duì)Y作用的調(diào)節(jié)因素M。

關(guān)聯(lián)也可以分為同時(shí)關(guān)聯(lián)延時(shí)關(guān)聯(lián)兩類(lèi)。

4.1

同時(shí)關(guān)聯(lián)

即多個(gè)因素(X)同時(shí)發(fā)生作用一起促成了現(xiàn)象(Y)的發(fā)生。

e.g. 電商網(wǎng)站銷(xiāo)售的變化可能考慮的因素:

用戶(hù):用戶(hù)結(jié)構(gòu)是否發(fā)生變化,是否有新的注冊(cè)渠道,新渠道導(dǎo)流進(jìn)來(lái)的用戶(hù)質(zhì)量如何;

商品:品類(lèi)結(jié)構(gòu)是否有變化,e.g. 隨著四季變化,服裝類(lèi)的種類(lèi)也會(huì)發(fā)生變化;

產(chǎn)品:多少用戶(hù)使用舊版本或者新版本,產(chǎn)品某個(gè)環(huán)節(jié)有沒(méi)有改版,產(chǎn)品的策略(商品推薦策略等)是否有變化;

運(yùn)營(yíng):前期的線上或者線下預(yù)熱,商城的優(yōu)惠力度,優(yōu)惠涉及的人群等;

4.2

延時(shí)關(guān)聯(lián)

現(xiàn)象的產(chǎn)生可能存在延遲效應(yīng),要考慮當(dāng)前現(xiàn)象(環(huán)節(jié))的前置的“因”和后置的“果”。

e.g. 今天上線的營(yíng)銷(xiāo)方案可能在幾天甚至幾十天后才會(huì)有顯著的效應(yīng),今天交易量上出現(xiàn)的波動(dòng)也可能是因?yàn)橐欢螘r(shí)間前產(chǎn)品或者運(yùn)營(yíng)策略上有改動(dòng)。

05

層級(jí)

要有結(jié)構(gòu)化、系統(tǒng)化的思維,對(duì)影響因素自上而下的拆解和自下而上的組合。

數(shù)據(jù)分析常用6種分析思路

5.1

自上而下的拆解

可以理解為“分級(jí)鉆取”,如同金字塔結(jié)構(gòu)一樣,先從總體看到二級(jí)分支,然后再看更細(xì)的分支。

e.g. 支付成功率的影響,可以對(duì)新老客、訂單來(lái)源、支付方式、銀行通道一層一層拆解,細(xì)化各個(gè)分支對(duì)整體變化的貢獻(xiàn)率;

數(shù)據(jù)分析常用6種分析思路

e.g. 銷(xiāo)售額 = 下單人數(shù)*客單價(jià) (a)

從登錄到下單是層層轉(zhuǎn)化后的,所以

下單人數(shù) = 訪客人數(shù)*瀏覽轉(zhuǎn)化率*購(gòu)物車(chē)轉(zhuǎn)化率*支付轉(zhuǎn)化率 (b)

公式(b)代入公式(a),得到:

銷(xiāo)售額 = 訪客人數(shù)*瀏覽轉(zhuǎn)化率*購(gòu)物車(chē)轉(zhuǎn)化率*支付轉(zhuǎn)化率*客單價(jià)

5.2

自下而上的組合

就是將個(gè)體組成群體,將小的指標(biāo)組合成一個(gè)綜合指標(biāo)。

e.g. 用戶(hù)的標(biāo)簽分為基礎(chǔ)標(biāo)簽和復(fù)合標(biāo)簽,基礎(chǔ)標(biāo)簽就是單個(gè)用戶(hù)屬性來(lái)定義的(例如性別、婚否等),復(fù)合標(biāo)簽則是考慮多個(gè)基礎(chǔ)標(biāo)簽的組合(例如,某個(gè)典型的用戶(hù)群體畫(huà)像是:女性+單身+白領(lǐng)+一線城市);

e.g. 規(guī)劃用戶(hù)標(biāo)簽時(shí),先用頭腦風(fēng)暴想出一批指標(biāo),然后進(jìn)行歸類(lèi)、篩選、組合;

e.g. 風(fēng)控業(yè)務(wù)中累計(jì)壞賬計(jì)提的計(jì)算,是將不同的逾期資金規(guī)定不同的風(fēng)險(xiǎn)計(jì)提比例,最后再把所有類(lèi)別的風(fēng)險(xiǎn)計(jì)提資金匯總起來(lái),作為公司所有貸出款項(xiàng)的風(fēng)險(xiǎn)計(jì)提資金,從而對(duì)公司貸款業(yè)務(wù)風(fēng)險(xiǎn)進(jìn)行評(píng)估;

舉個(gè)形象的例子,自上而下好比國(guó)家財(cái)政撥款,從中央到省會(huì)再到各市縣區(qū);自下而上則像是國(guó)家征稅,就是從各市縣區(qū)、各企業(yè)層層匯總,直到報(bào)送國(guó)庫(kù)。

06

優(yōu)化

分析的最終目標(biāo)無(wú)非兩種:尋找解決方案,尋找更好的解決方案。第一步是保證數(shù)據(jù)的準(zhǔn)確性和穩(wěn)定性,第二步就是優(yōu)化,提高準(zhǔn)確性、提高效率和效益。

優(yōu)化包含兩部分的內(nèi)容:縮小當(dāng)前和目標(biāo)的差距,直到達(dá)成并超越目標(biāo);在成本或者預(yù)算固定的前提下,使收益最大化。

6.1

縮小當(dāng)前和目標(biāo)的差距

e.g. 全公司各部門(mén)各業(yè)務(wù)線的同事們都在追逐和超越KPI的路上;

e.g. 機(jī)器學(xué)習(xí)建模時(shí),嘗試多種方案,調(diào)試各種參數(shù),使模型的精確度逐漸提高

數(shù)據(jù)分析常用6種分析思路

6.2

成本固定,最大化收益

數(shù)據(jù)分析常用6種分析思路

e.g. 對(duì)于信用貸款產(chǎn)品而言,如果把“最安全”放在首位,那么極端的方式就是不給任何人發(fā)放貸款,這樣就不會(huì)出現(xiàn)壞賬了。正確的信貸模型思維是將壞賬控制在業(yè)務(wù)上可以接受的范圍內(nèi),并使利息覆蓋壞賬,進(jìn)而最大化收益。

任何商業(yè)模式都是追逐利益的,首要目標(biāo)是收益最大化,參考如下公式:

利潤(rùn) = 收入 - 投入成本 - 風(fēng)險(xiǎn)損失

優(yōu)化的過(guò)程就是尋找利潤(rùn)最大化的過(guò)程。

小結(jié):

以上總結(jié)了常見(jiàn)的6種數(shù)據(jù)分析思路,涉及具體的業(yè)務(wù)場(chǎng)景還要結(jié)合業(yè)務(wù)特點(diǎn)適當(dāng)變通。精通方法,深入業(yè)務(wù),勤于實(shí)踐,多加總結(jié),最終就能踏上描述-->解釋-->預(yù)測(cè)-->控制,步步高升的數(shù)據(jù)分析師精進(jìn)之路。

數(shù)據(jù)分析常用6種分析思路
數(shù)據(jù)分析常用6種分析思路

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多