01 界定問題,,明確目標 不管是在學(xué)術(shù)研究,還是商業(yè)研究中,,數(shù)據(jù)分析的起點始終是問題意識,。只有基于問題,分析才有方向、目標,,結(jié)果才是明確的,、有價值的。而明確的研究問題和目標,,是后續(xù)拆解研究內(nèi)容,、選擇研究方法、結(jié)果呈現(xiàn)邏輯的基礎(chǔ),。沒有問題意識和目標的數(shù)據(jù)分析,,就像迷航的船只,失去了航行的意義,,最終只能是白忙活一場,。 比如老板說今年上半年的利潤沒有達到目標?我們不能單單只憑這句話就開始行動,,而是要將問題中所涉及的所有內(nèi)容界定清楚,,如利潤具體構(gòu)成有哪些要素,與誰比較,,達到什么標準算是實現(xiàn)目標,。 因此,要想做好數(shù)據(jù)分析,,首先要界定清楚你想要解決的問題是什么,,要通過分析實現(xiàn)什么樣的目標。 那具體應(yīng)該如何來界定問題,、明確目標呢,?我們可以從以下幾個方面進行思考: (一)問題背景 針對提出的分析需求,你要了解清楚問題,、需求產(chǎn)生的背后動因,,了解為什么會有這樣的問題、需求,?比如,,是基于公司戰(zhàn)略、業(yè)務(wù)規(guī)劃要求,,還是基于市場,、客戶的實際反饋,或者數(shù)據(jù)的異常引出的,?只有問題背景清楚了,,你才能明確你要達到什么樣的目標,從哪里切入,,要做怎樣的投入,。 (二)問題內(nèi)容 了解需求方想要做數(shù)據(jù)分析的真正意圖,,具體想要解決什么問題,擺脫什么困境,,實現(xiàn)什么目標,。但有時候,需求方也不能確定他們存在的問題,,或者想要達到什么樣的目標,,這就需要數(shù)據(jù)分析師通過調(diào)研分析,來幫需求方定位問題,、明確目標,。 (三)問題的范圍 1. 時間 問題是有時限的,需要明確觀察哪個時間范圍的數(shù)據(jù)發(fā)現(xiàn)的問題,?一般需要將不同時間段的數(shù)據(jù)進行對比,,以呈現(xiàn)差距、發(fā)現(xiàn)問題,。 2. 區(qū)域 問題也需要在不同地區(qū)之間的對比中出現(xiàn),,所以要清楚問題針對是針對哪些地區(qū)。 3. 數(shù)據(jù)來源 由于數(shù)據(jù)的分散性特征,,不同來源的數(shù)據(jù)可能是零散的,、不全面的,,或者是不準確的,,所以要了解數(shù)據(jù)來自哪里,核對數(shù)據(jù)是否全面,、真實,。要對所有信息/數(shù)據(jù)來源時刻保持懷疑的態(tài)度,即使是需求方提出的,,也要進一步尋找數(shù)據(jù)加以不斷驗證 (四)業(yè)務(wù)指標的理解 需要理清楚問題所涉及的業(yè)務(wù)指標是如何定義的,、以及與誰進行比較。 1. 指標含義 比如“利潤”這個指標,,不能只看利潤一個詞,,還要與業(yè)務(wù)部門溝通,明確“利潤”是怎么計算的,,比如利潤=銷售收入-銷售成本-營業(yè)外支出,。 2. 比較對象 當問題中提到“高、低”等比較詞時,,要弄清楚是與什么進行比較,,有比較才能知道問題要解決到什么樣的程度。比如老板希望你能通過數(shù)據(jù)分析幫公司找到提高產(chǎn)品銷售的方法,,這時候你就要跟老板了解清楚,,銷量要提到到多少,與哪個目標值進行比較? 02 拆解問題,,確定分析框架 很多時候,,你面對的問題/目標是難以直接回答的大問題、復(fù)雜問題,,這種時候,,你就可以對問題/目標進行拆解,將大問題分解為更具體的,、可操作性強的子問題,,將研究目標拆解為具體的分析內(nèi)容,通過回答子問題來回答大問題,,通過解決各模塊內(nèi)容來達成最終的研究目標,。而這個拆解問題/目標的過程,即是分析思路的結(jié)構(gòu)化過程,。那具體怎么做拆解呢,? (一)思維工具——邏輯樹 思維工具可以幫助我們將復(fù)雜問題條理化、結(jié)構(gòu)化,,快速形成分析框架,。邏輯樹是數(shù)據(jù)分析工作中最常用的思維工具。 邏輯樹即從研究目標出發(fā),,以大問題為樹干,,以拆解出的子問題為樹枝,形成一個樹狀結(jié)構(gòu)的思維框架,,目的是要全面厘清整體與部分的框架,。使用邏輯樹時,要遵循以下原則: (1)橫向的不同層級之間存在邏輯關(guān)系,,或包含,、或相關(guān); (2)縱向同一層級的不同維度之間,,要符合MECE原則,,即各部分之間相互獨立(Mutually Exclusive),所有部分完全窮盡(Collectively Exhaustive),。 邏輯樹的具體使用方法: 1. 【設(shè)定起始問題】:將已發(fā)生的問題或事實作為邏輯樹的起始問題 2. 【列出主要影響因素】:針對起始問題提出“why”,,思考可能導(dǎo)致該問題/現(xiàn)象的主要因素 3. 【細分原因】:將步驟B的原因作為二級問題,繼續(xù)提出“why”,,深入探究背后的影響因素 4. 【整理樹狀圖】:將問題全部分解后,,要確定每個層級之間的關(guān)聯(lián)是否有邏輯,層級包含關(guān)系是否恰當,。 對于樹枝應(yīng)該分拆到幾個層級,,需要根據(jù)分析主題的具體情況來界定,,但一般分解到三個層級就差不多了。 邏輯樹的應(yīng)用難點在于從樹頂端的起始問題往下拆解時,,雖然我們都知道要窮盡每個層級中的影響因素,,但具體應(yīng)該從哪些維度進行拆解,這就非??简灧治鰩煂υ撝黝}的理解程度,。針對這一難點,需要做好兩方面的積累: 一是【熟練應(yīng)用拆解思維】 二是【熟悉經(jīng)典分析模型】 (二)拆解思維 1. 橫向拆解 從橫向結(jié)構(gòu)出發(fā),,將研究主題由上而下,、由粗到細進行分解,找出該主題由哪些要素構(gòu)成,,每個要素有哪些具體特征,。比如組織架構(gòu)圖,即是橫向拆解最常見的應(yīng)用場景,。 【案例】 企業(yè)A上半年的營業(yè)利潤未達到目標值,,若按照目前的營收進度,到年底將無法完成年度總利潤目標?,F(xiàn)在老板要求你通過數(shù)據(jù)分析,,尋找如何完成年度總利潤目標的方案。 這里,,要完成年度利潤目標,,關(guān)鍵是要找出上半年沒有完成目標值的原因,后續(xù)才能對癥下藥,。因此,,我們可以采用結(jié)構(gòu)思維,,橫向拆解“利潤”指標,,看看是哪個方面出了問題。 2. 縱向拆解 基于時間維度,,將研究主題分解為有先后順序的多個流程階段,,每個階段又有哪些具體表現(xiàn)。 【案例】 近期互聯(lián)網(wǎng)產(chǎn)品A的用戶流失率出現(xiàn)了顯著的上升趨勢,,現(xiàn)在領(lǐng)導(dǎo)要求你通過數(shù)據(jù)分析,,來找出用戶流失的原因,并針對問題點提出解決方案,。 針對該需求,,可以采用時間思維,基于用戶使用產(chǎn)品的流程,,將研究問題縱向拆解為多個流程階段,,然后尋找具體是哪個行為階段的流失率比較高,,用戶遇到的主要問題是什么? 3. 綜合思維 在實際研究中,經(jīng)常會將結(jié)構(gòu)思維和時間思維結(jié)合使用,。 (三)經(jīng)典分析模型 問題經(jīng)過拆解,,就形成了所研究主題的分析思路、分析框架,,而經(jīng)典分析模型則是經(jīng)過時間檢驗,、實際應(yīng)用驗證的成熟的分析思路。很多領(lǐng)域都積累了一些經(jīng)典的分析模型,,熟悉這些經(jīng)典分析模型,,可以有助于我們在面臨類似的研究主題時,能夠進行快速,、有效地思考,,快速找到問題拆解的切入點。以下為一些常見的分析模型,,后續(xù)在工作中,,可多多留心收集、積累,。 03 數(shù)據(jù)處理 通過不同渠道、不同方式收集上來的數(shù)據(jù),,會普遍存在格式不一,、夾雜臟數(shù)據(jù)、無序混亂,、復(fù)雜等問題,,因此,在進行數(shù)據(jù)分析之前,,需要對數(shù)據(jù)進行清洗,、加工,以滿足分析目標的需要,。 (一)清洗數(shù)據(jù) 原始數(shù)據(jù)普遍存在的問題是,,夾雜很多臟數(shù)據(jù),比如在問卷調(diào)查中,,可能會有誤答,、亂答的情況,從而使原始數(shù)據(jù)出現(xiàn)重復(fù)值,、缺失值,、無效問卷等。因此,,拿到數(shù)據(jù),,首先要做的就是對數(shù)據(jù)進行清洗,,以確保所要分析的數(shù)據(jù)的信度和效度,提高數(shù)據(jù)分析的準確性,。數(shù)據(jù)清洗主要包括三方面的內(nèi)容: 1. 查找重復(fù)值 2. 處理缺失值 3. 篩查無效數(shù)據(jù) (二)加工數(shù)據(jù) 做好數(shù)據(jù)清洗好,,數(shù)據(jù)還可能會存在數(shù)據(jù)格式不統(tǒng)一、量綱差異大,、無序等的問題,,也會夾雜著很多與此次分析主題無關(guān)的內(nèi)容,因此還需要對數(shù)據(jù)做進一步的加工處理,,包括數(shù)據(jù)格式的統(tǒng)一化,、數(shù)據(jù)量綱的歸一化/標準化、數(shù)據(jù)的分類匯總/排序/抽取等,,以降低原始數(shù)據(jù)的復(fù)雜程度,,也讓數(shù)據(jù)更符合分析需求。 04 選擇數(shù)據(jù)分析方法 要想從繁雜的數(shù)據(jù)中挖出有價值的內(nèi)容,,洞察數(shù)據(jù)背后隱藏的規(guī)律,,回答一開始提出的問題,就要懂得使用合適的分析方法對數(shù)據(jù)進行描述,、分析,。 根據(jù)分析方法的內(nèi)容,我們可以將常用的數(shù)據(jù)分析方法分類以下七大類,。我們也可以根據(jù)應(yīng)用場景對分析方法進行劃分,,后面有機會我們再做詳細介紹。 (可查看本公眾號的“統(tǒng)計學(xué)”合集內(nèi)容詳細了解分析方法的原理和操作) 這七大類分析方法沒有嚴格按照相互獨立的原則進行劃分,,比如回歸分析被歸入了【因果分析】類,但嚴格來說,,回歸分析也可以算是【相關(guān)分析】,、【預(yù)測分析】。但我們不必糾結(jié)于此,,畢竟對分析方法的歸類只是方便我們的學(xué)習,、記憶和檢索,沒有實際的類型學(xué)意義,。況且,我們在實際研究分析中,,往往不會單獨采用某一種方法,,而是會根據(jù)研究目的,將不同方法結(jié)合使用,,以實現(xiàn)對分析問題的深層次理解和解釋,。當然,,這里介紹的還只是部分方法,在不同的領(lǐng)域還會發(fā)展出切合該領(lǐng)域場景的分析方法,,但不管怎么變,,其基礎(chǔ)的分析邏輯都是基于以下的七種方法類型。
對比分析,,是將不同的數(shù)據(jù)進行對比,,以分析它們的差異,揭示數(shù)據(jù)背后的發(fā)展變化和規(guī)律,。 對比分析一般分為橫向?qū)Ρ群涂v向?qū)Ρ?。橫向?qū)Ρ燃赐粫r間下的不同數(shù)據(jù)之間的對比,比如第一季度各城市門店的營業(yè)額之間的對比,,年度實際營業(yè)額與目標值的對比等,;縱向?qū)Ρ燃磾?shù)據(jù)在不同時間點的差異,可揭示數(shù)據(jù)隨時間變化的趨勢,。 2. 分類分析 所謂物以類聚,、人以群分。分類是數(shù)據(jù)簡化的常用方式,,我們可以把雜亂無序的總體按照某些特質(zhì)進行歸類,,使類別內(nèi)的個體之間差異盡可能小,各類別間的差異盡可能大,,以更便于下一步的深入分析,。 3. 分布分析 數(shù)據(jù)收集上來后,我們最常做的就是描述數(shù)據(jù)的分布,,比如不同性別的個案占比,,某一指標的均值是多少,一組數(shù)據(jù)中的波動程度有多大,。這些分析,,即是分布分析,可幫助我們了解數(shù)據(jù)的特定趨勢,。分布分析的對象不是一個數(shù)值,,而是一組數(shù)值,只有存在多個數(shù)值,,數(shù)據(jù)才會存在分布狀態(tài),。 4. 相關(guān)分析 相關(guān),是指變量之間的變化關(guān)系,。如果一個變量發(fā)生變化,,另一個變量也跟著變化,那么我們就可以認為這兩個變量存在相關(guān)關(guān)系,。相關(guān)關(guān)系不等于因果關(guān)系,,一般來說,,變量之間的相關(guān)關(guān)系,主要由于以下三個因素帶來: (1)相關(guān)是偶然的 (2)變量之間的相關(guān)可能直接受到其他潛在因素的影響 (3)一個變量是另一個變量的原因,,即兩個變量存在因果關(guān)系,,但需要注意,該自變量可能只是眾多原因的其中一個,。 5. 因果分析 因果分析即是要追本溯源,,追溯哪些因(稱為自變量)導(dǎo)致了這樣的果(稱為因變量)。相關(guān)是因果關(guān)系的必要條件,,如果因變量的變化與自變量的變化之間存在相關(guān),,那么自變量就可能(并不必然是)是因變量的原因。但相關(guān)并不意味必然有因果關(guān)系,,發(fā)現(xiàn)了相關(guān)性,,只是說明在統(tǒng)計學(xué)意義上兩個變量之間可能存在因果關(guān)系,之后還要探討因果鏈條,。 6. 預(yù)測分析 預(yù)測分析是通過對現(xiàn)有數(shù)據(jù)特征的分析來構(gòu)建統(tǒng)計模型,,然后用來對不完整的、未知的或者未來的知識進行判斷和預(yù)測,。其實前面介紹相關(guān)分析和因果分析方法也屬于預(yù)測分析的范圍,,但為了方便分類,且它們在實際研究中應(yīng)用得比較多,,因此就將它們作為了單獨的類別進行介紹,。 7. 推斷分析 數(shù)據(jù)收集是有成本的,收集所有數(shù)據(jù)是不現(xiàn)實的,,因此一般會采取抽樣的方式,,即從總體中抽取樣本,收集樣本的數(shù)據(jù),,然后再由樣本來推斷總體的參數(shù),、分布等信息。這種通過樣本來認識總體的過程,,即是推斷分析,。 05 提出建議 在企業(yè)研究中,數(shù)據(jù)分析的最終目的是要通過數(shù)據(jù)來驅(qū)動業(yè)務(wù)發(fā)展,,改善企業(yè)經(jīng)營狀況,。但實際上,很多人并沒有認識到分析研究的真正價值,,甚至覺得企業(yè)中的研究只能帶來成本,,無法真正給企業(yè)帶來價值,畢竟很多研究的價值難以被衡量,。因此,,在數(shù)據(jù)分析的產(chǎn)出中,還應(yīng)該基于結(jié)論提出針對問題,、目標的切實可行的建議,、解決方案,才能激起需求方的興趣,,才能更好地推動研究成果的落地,,最大效用地發(fā)揮數(shù)據(jù)分析在企業(yè)研究中的價值。 06 呈現(xiàn)分析結(jié)果
讀者導(dǎo)向,、邏輯清晰,、簡潔易懂、生動形象 2. 目標讀者及其需求 理清報告結(jié)果會有哪些人群看到,,他們有什么需求,,為什么要看你的這個結(jié)果。在實際研究項目中,,可根據(jù)項目的情況,、重要性、受益人,,來決定選擇哪種呈現(xiàn)方式,。 3. 內(nèi)容結(jié)構(gòu) 根據(jù)目標讀者及其需求,理清什么樣的呈現(xiàn)邏輯才會讓他們更易于理解,、才會更容易吸引他們的注意力,。一般來說,基于業(yè)務(wù)或需求方關(guān)心的核心問題層層拆解來編排報告內(nèi)容,,這種問題導(dǎo)向的結(jié)果匯報更易于讀者的理解,。 比如,要給某產(chǎn)品做市場定位,,數(shù)據(jù)分析結(jié)果就可以從以下方面進行結(jié)構(gòu)編排: (1)市場空間有多大,,值不值得進入:包括市場規(guī)模、增長趨勢 (2)當前市場可以細分為哪些類型,,不同細分市場有哪些特征 (3)應(yīng)該選擇哪個目標市場,?后續(xù)可以向哪些次要的細分市場進行拓展? (4)可以采取什么策略來營銷推廣該產(chǎn)品: A. 目標用戶長什么樣,,與其他細分市場的目標用戶相比,,有什么顯著特征 B. 目標客戶有哪些需求,與其他細分市場的目標用戶相比,,差異點在哪里 C. 選擇適合目標客戶的營銷方案 4. 呈現(xiàn)形式 盡可能實現(xiàn)數(shù)據(jù)化,、圖表化表達,以讓目標讀者更易理解、更有興趣閱讀,。 最后,,給大家分享一些最近整理的數(shù)據(jù)分析資料,全部打包好了,,直接領(lǐng),。 |
|