游戲數(shù)據(jù)分析的流程 游戲數(shù)據(jù)分析整體的流程將分為幾個階段,這幾個階段則是反映了不同企業(yè)數(shù)據(jù)分析的水平,,從另一個角度,也是在解析作為一名數(shù)據(jù)分析人員究竟該如何參與到游戲數(shù)據(jù)分析業(yè)務中,,與之有關的游戲數(shù)據(jù)分析師的工作我們將在1.4節(jié)重點闡述,。 如圖1-2所示,對于游戲數(shù)據(jù)分析系統(tǒng)及數(shù)據(jù)的利用,,我們分為了五個階段,,方法論、數(shù)據(jù)加工,、統(tǒng)計分析,,提煉演繹、建議方案,。從工程技術,、統(tǒng)計分析、數(shù)據(jù)挖掘以及用戶營銷幾個方面進行了覆蓋和研究,。 方法論 方法論是數(shù)據(jù)分析的靈魂,,是解決問題的普遍原則,貫穿分析始終的思想指導,。這個階段決定了我們?nèi)绾温顸c數(shù)據(jù),,如何設計分析指標,如何采集,,如何組織數(shù)據(jù),。 方法論多數(shù)是將業(yè)務進行了抽象,,形成了一套可以解決若干業(yè)務問題的思路,。就游戲業(yè)務來說,從游戲數(shù)據(jù)分析角度,,目前已經(jīng)存在幾套方法論,,比如游戲早期市場提及的是PRARA,,在進入移動游戲領域,以TalkingData的AARRR模型則提及得最多,,這套方法論綜合了PRARA,、網(wǎng)站分析,、社交網(wǎng)絡分析等諸多分析的特色,結合移動游戲市場的情況,,加以整理并提出的,。在后續(xù)的章節(jié)中,我們會重點介紹AARRR模型,。 方法論存在的意義就是要去解決問題,,是對于問題、目標,、方法和工具的概述,。一方面解決業(yè)務問題,另一方面則是分析思維的指導,。在后續(xù)有關游戲數(shù)據(jù)分析師的描述中,,我們強調(diào)對分析思想的鍛煉及方法的駕馭,學會基于不同角度和領域去看待業(yè)務問題,,這需要高度的抽象和概括能力,。從圖1-2我們也可以看到,方法論的確立,,決定了我們在游戲數(shù)據(jù)分析方向上要解決的問題,、采取的方法和使用的工具等。 當我們?nèi)鄙龠@樣的體系支撐時,,即使我們確立目標,,但是在實踐操作時將會變得非常緩慢,效率低下,。因為在整個的過程中,,我們要完成游戲數(shù)據(jù)分析的工作,需要開發(fā)人員,、設計人員和運營人員的參與,,當大家無法在統(tǒng)一的思想和方法的指導下,就無法進行有效地任務分配和需求理解,,進而導致今天我們看到這種現(xiàn)象:在很多的游戲公司,,運營人員與開發(fā)人員的溝通中頻頻會出現(xiàn)各種數(shù)據(jù)標準理解的不統(tǒng)一,分析功能開發(fā)得南轅北轍,。這些問題的出現(xiàn)不僅僅是溝通的問題,,更是對于游戲數(shù)據(jù)分析的體系和思想未形成一致的認識造成的。在方法論的階段有如下的兩點是需要重點關注和解決的,。 (1)業(yè)務需求 方法論是對業(yè)務需求的最高層級的抽象,,涉及具體業(yè)務時,在方法論的指導下,我們需要對業(yè)務需求進行拆解,,而這個階段,,從數(shù)據(jù)分析的角度來看,就是該如何進行數(shù)據(jù)埋點,。 數(shù)據(jù)埋點就是通過客戶端或者服務端,,通過在某些游戲位置追蹤玩家游戲行為而得到的相關數(shù)據(jù)。這些位置則是未來對特定業(yè)務分析的基礎數(shù)據(jù)支撐,。比如,,我們在進行用戶注冊分析時,需要在用戶注冊的相關代碼和邏輯位置進行數(shù)據(jù)采集點的設計,,這樣當游戲有玩家參與時,,我們就可以通過采集到的數(shù)據(jù),進行整理,,形成可計算的指標,。 經(jīng)過長期的發(fā)展后,基本上已經(jīng)形成了一些特定的數(shù)據(jù)指標,,而這些指標也可以涵蓋大部分的業(yè)務數(shù)據(jù)分析。多數(shù)時候,,我們常常會苦惱于如何進行數(shù)據(jù)埋點,,如何進行基礎的數(shù)據(jù)分析,實際上,,我們通過一些行業(yè)通用的數(shù)據(jù)指標白皮書就可以在短時間內(nèi)明確該如何進行數(shù)據(jù)的埋點和基礎數(shù)據(jù)統(tǒng)計分析,,這方面可以參考TalkingData在2012年發(fā)布的《移動游戲運營數(shù)據(jù)指標白皮書》。 (2)指標體系 當我們形成了基本的數(shù)據(jù)指標后,,我們要形成完整的指標體系,,并且要建立在方法論的指導基礎之上。在多數(shù)情況下,,指標具有很強的業(yè)務導向性和監(jiān)測作用,。比如在我們進行數(shù)據(jù)日報的制作過程中,我們就需要按照一定的邏輯組織我們的數(shù)據(jù),,用戶類數(shù)據(jù),,收益類數(shù)據(jù),渠道數(shù)據(jù)等等,。與此同時,,在這些指標基礎之上,數(shù)據(jù)分析人員可根據(jù)需要,,進一步加工和變換指標,,從而完成深度分析,比如我們對于新增付費用戶的研究,用戶生命周期價值的探討等,,就需要在基礎數(shù)據(jù)的指引下,,進一步建立新的數(shù)據(jù)規(guī)劃和指標拆解。 這部分指標工作看似是最基礎的部分,,但是最重要,。理清了業(yè)務需求,我們需要基于目標驅(qū)動構建指標體系,,在類似AARRR模型的指導下,,整體構建并不會有太多的特殊性,但重要的一點是,,所構建的指標體系需要能夠和業(yè)務匹配起來,,比如更具業(yè)務需要,重點予以關注的指標數(shù)據(jù),,或者關鍵業(yè)務的評估需要微型的指標體系來實施,。這一類是在方法論指導原則下完成的。 在指標體系中,,指標重在理解和標準化,,如果在構建指標體系階段,定義的指標標準不夠清晰,,那么在具體的開發(fā)實施階段,,就會產(chǎn)生很多問題,最終造成了類似統(tǒng)計數(shù)據(jù)不準確等問題,。此外,,在此階段定義的指標不是越多越好,所以要加深對于指標的深入理解,,借助數(shù)據(jù)分析來解決問題,,而不是羅列數(shù)據(jù),在構建的指標體系內(nèi),,每一個指標都將具備實際的分析價值和能夠反映特定的問題,,并且當問題得以解決時,我們還可以從該指標或者幾個指標的組合中評估效果,。 數(shù)據(jù)加工 對數(shù)據(jù)進行處理使其最終變成信息,,這個階段統(tǒng)稱為數(shù)據(jù)加工.在數(shù)據(jù)加工階段,我們重點要去解決的問題有兩點,。 (1)業(yè)務理解 系統(tǒng)最終是需要技術開發(fā)的,,在選定技術和工具之前,最重要的是要充分理解需求和標準定義,。在開發(fā)人員完成開發(fā)后,,如果發(fā)現(xiàn)其數(shù)據(jù)處理的結果并非是分析師或者業(yè)務人員所需要的,,那么就浪費了很多的時間和資源,因此是否形成一直的指標定義認識,,是否明確統(tǒng)一需求,,需要分析師、業(yè)務人員與開發(fā)團隊共同商議,,形成統(tǒng)一的認識,,否則將面臨重復開發(fā),需求更改等等一系列的問題,。在所有人員在這些問題達成一致后,接下來就要解決的是技術開發(fā)問題,。 (2)技術開發(fā) 確立使用什么技術和架構來完成整體的數(shù)據(jù)分析平臺的建設,,這是需要技術人員去評估的,而評估的一個重要參考就是前一個階段所確立的內(nèi)容,,技術人員對于業(yè)務分析需要的理解,,決定了未來構建的數(shù)據(jù)平臺的很多因素,比如高安全性,、高效性,、高可靠性、高可用性,、高可擴展性和可管理性,,等等。 在數(shù)據(jù)采集層級,,我們需要解決數(shù)據(jù)的發(fā)送機制、采集內(nèi)容和存儲方式等,。就目前的移動互聯(lián)網(wǎng)游戲來說,,主要采取在游戲客戶端植入統(tǒng)計分析SDK的方式來完成數(shù)據(jù)的采集,當然,,在部分公司中,,也采取了游戲服務器端完成數(shù)據(jù)的采集。兩種方式各自具備優(yōu)勢,,通過SDK植入游戲客戶端的采集方式,,在有關游戲用戶終端設備的信息,用戶會話時間等方面具備優(yōu)勢,,而通過服務器端的數(shù)據(jù)采集,,則在游戲內(nèi)諸如等級分析、關卡任務分析方面具備優(yōu)勢,,但是對于游戲用戶在客戶端設備上一些行為則無法做到采集和分析,。比如,,如圖1-4所示,在移動游戲客戶端的錯誤日志中,,多數(shù)情況下無法通過服務器端獲得的寶貴數(shù)據(jù),。
而這些數(shù)據(jù),經(jīng)過采集后,,則是可以快速了解目前產(chǎn)品的問題,,比如新增用戶很多,但是活躍時間和留存質(zhì)量很低,,分析錯誤日志則是一個很好的方式,。這一點在移動游戲數(shù)據(jù)分析方面是非常必要的,因為移動游戲環(huán)境和場景的多樣性,,使得我們必須重視解決看似很小的問題,。 在數(shù)據(jù)處理層級要對采集到的原始數(shù)據(jù)進行抽取、清洗和加載,,對雜亂的數(shù)據(jù)進行標準化,、映射、排重以及糾錯等操作,,最終將數(shù)據(jù)加載到數(shù)據(jù)倉庫中,。在這個階段需要完成的工作量是非常龐大的,尤其是在移動游戲領域,,當用戶終端的設備變得更加多樣,,地域更加分散后,數(shù)據(jù)的處理工作相比之前的端游和頁游,,變得更加的重要,,依賴程度更高。移動游戲需要更加快速的響應和迭代能力,,當我們通過數(shù)據(jù)發(fā)現(xiàn)了游戲在某些設備上存在問題時就要迅速的進行解決,,而此時,關鍵任務在于我們?nèi)绾伟l(fā)現(xiàn)這些問題并進行分析,。我們需要依托設備的標準化和糾錯去發(fā)現(xiàn)不同用戶群的設備分布情況,。在同樣情況下,我們也可以分析比如付費用戶更加傾向哪些分辨率的手機,,或者使用iPhone5的付費用戶的ARPPU是多少,,這些分析都要依托于強大的數(shù)據(jù)處理能力才能夠?qū)崿F(xiàn)。 在數(shù)據(jù)計算層級,,要進行實時的運算,,定義多維數(shù)據(jù)模型、業(yè)務模型,,比如基于時間維度,、地域維度,、用戶群維度、區(qū)服維度和渠道維度等,,按照小時,、日計算任務,根據(jù)業(yè)務要求進行數(shù)據(jù)運算,,并把結果集數(shù)據(jù)輸入到數(shù)據(jù)庫中,。 在業(yè)務信息層級,則需要將經(jīng)過采集,、處理并計算的數(shù)據(jù)最后經(jīng)過接口變成可被查詢的信息,,如果從開發(fā)層面解釋,就是龐大的報表系統(tǒng),,即直接面向最終分析師的數(shù)據(jù)產(chǎn)品,。 實際上數(shù)據(jù)加工階段的最終目的就是將數(shù)據(jù)轉(zhuǎn)化為可用的信息。從這點來看,,第三階段的統(tǒng)計分析則是與業(yè)務信息階段是結合非常緊密的,,統(tǒng)計分析要基于已經(jīng)加工好的數(shù)據(jù),進一步深入地透過更加多元的數(shù)據(jù)或者信息分析方法,,挖掘特征,。 統(tǒng)計分析 統(tǒng)計分析包含了統(tǒng)計和分析。統(tǒng)計分析是商業(yè)智能的一方面,,商業(yè)智能應用還包括決策支持系統(tǒng)(DSS),、查詢和報告、在線分析處理(OLAP),、預測和數(shù)據(jù)挖掘,,統(tǒng)計分析則是整理數(shù)據(jù)和分析數(shù)據(jù)的綜合。 此前我們需要收集數(shù)據(jù),,但是目的都是整理數(shù)據(jù)且最終要進行分析數(shù)據(jù),,數(shù)據(jù)向信息轉(zhuǎn)化的過程。為此需要描述數(shù)據(jù)的性質(zhì)和研究數(shù)據(jù)關系,,并通過一定的模型來變換角度解析數(shù)據(jù)內(nèi)在的聯(lián)系,而如果整體系統(tǒng)的開發(fā)度更高,,則可以就模型本身進行有效性的驗證,。在部分公司提供的統(tǒng)計分析系統(tǒng)上,我們已經(jīng)能夠看到部分的預測分析,,這也是向下個階段提煉演繹的重要過渡,。 對于游戲數(shù)據(jù)分析師來說,我們需要學習的更多的統(tǒng)計的思想,、方法和解題思路,。統(tǒng)計分析最關鍵的就是要分析數(shù)據(jù),,因為對于經(jīng)過整理和加工的數(shù)據(jù),如何提煉有用的決策信息,,一方面是依托于系統(tǒng)的數(shù)據(jù)采集和整理,,另一方面則需要分析師最終進行分析才會發(fā)揮價值。分析師的最大要求就是理解每一個方法背后的原則,、范圍和思想,。統(tǒng)計學的思維將我們對于事物的解讀能力提升到了一個更高的層次。 在進行一些游戲數(shù)據(jù)分析時經(jīng)常使用集中趨勢或者離散程度的指標,,而這些指標所代表的不只是一個計算方式,,更重要的是在最初誕生時,就是為了解決某一類問題而設計的解決辦法,,這是我們在分析基于計算方法下分析數(shù)據(jù)所最需要關心的事情,,比如在描述統(tǒng)計分析中,我們經(jīng)常使用集中趨勢,,它反映的是一組數(shù)據(jù)所有具有的共同趨勢,。 統(tǒng)計分析階段對分析師來說是非常重要的考驗,尤其是基本的分析能力,。當然,,作為一名分析師只具備在挖掘數(shù)據(jù)特征和分析數(shù)據(jù)方面的能力還不足以證明分析師的價值,數(shù)據(jù)分析本身是輔助決策的,,因此,,能夠挖掘提煉和演繹,與業(yè)務有效結合,,形成結論則是非常重要的,。所有的分析師不是為了分析數(shù)據(jù)而分析數(shù)據(jù),崇尚數(shù)據(jù),,信仰數(shù)據(jù),,但不要盲目。 提煉演繹 事實上,,每一次數(shù)據(jù)分析都要經(jīng)過長期的準備和努力,,曾有文章指出在整個數(shù)據(jù)分析環(huán)節(jié)中有80%以上的時間是在整理數(shù)據(jù),所以如何有效形成方法和經(jīng)驗就變得更加重要,。 可以預見的是,,當數(shù)據(jù)分析由系統(tǒng)來實現(xiàn)時,我們需要對關鍵業(yè)務具備數(shù)據(jù)的歸納和業(yè)務分析的模型組織,,比如在游戲數(shù)據(jù)分析中,,我們會針對鯨魚做分析,對留存做專門的分析,。這些都是通過業(yè)務的提煉才得以實現(xiàn)的,。 在很多情況下,,經(jīng)過積累,需要將一些重要業(yè)務和分析進行歸納,,總結出長期可以使用的分析模塊和數(shù)據(jù)采集體系,,如此當我們每一次面臨新游戲需要數(shù)據(jù)統(tǒng)計分析時,則不需要更多的額外開發(fā)成本,。 以移動游戲統(tǒng)計分析為例,,在經(jīng)過不斷的業(yè)務提煉和模型演繹后,從分析角度來看,,如圖1-6所示的幾個模塊是最為關心的,。 以上是經(jīng)過不斷的提煉總結出來的一些重要分析模塊,基于這些模塊,,我們需要記錄和完成的數(shù)據(jù)采集,,并且在參數(shù)設計上需要形成可以復用的接口。在如今移動游戲市場,,服務于第三方游戲統(tǒng)計分析服務的平臺提供了標準的數(shù)據(jù)接口,,從數(shù)據(jù)采集的角度,我們可以確立如圖1-7所示的標準統(tǒng)計接口,。 下面我們將通過TalkingDataGame Analytics在iOS平臺的數(shù)據(jù)統(tǒng)計接口設計的為例,,來描述具體的具體設計方法,其中涉及的標準接口有6個,。 (1)游戲啟動和關閉 用于準確追蹤用戶的游戲次數(shù),、游戲時長和初始渠道等信息:
(2)統(tǒng)計用戶賬戶 用于定義一個玩家,更新玩家最新屬性信息:
(3)跟蹤用戶充值 跟蹤玩家充值現(xiàn)金而獲得虛擬幣的行為,,充入現(xiàn)金反映至游戲收入中:
(4)跟蹤用戶消費點 跟蹤游戲中全部使用的虛擬幣的消費點,,如購買道具、VIP服務等,。
(5)任務關卡或副本 跟蹤玩家任務,、關卡、副本情況,。
(6)任務自定義事件 跟蹤和統(tǒng)計任何期望分析的數(shù)據(jù),,如功能按鈕的點擊、填寫輸入框,、廣告出發(fā)情況等,。
以上是從數(shù)據(jù)采集和具體分析兩個角度闡述了提煉演繹的重要性,作為分析師,,其提煉演繹的能力不僅僅是完成分析,,還在于優(yōu)化和完善分析系統(tǒng)的結構和設計,。這個階段的業(yè)務模型和分析師見解,,一方面影響了下一步的方案形成和指導決策,,另一方面,也決定了其提供的經(jīng)驗在后續(xù)的產(chǎn)品運營過程中是否可以作為可持續(xù)使用的方法,。 在西內(nèi)啟所著的《看穿一切數(shù)字的統(tǒng)計學》有一句話: 建議方案 前面幾個過程是從數(shù)據(jù)平臺,、標準分析系統(tǒng)、產(chǎn)品運營和精細化幾個關鍵詞在描繪游戲數(shù)據(jù)分析的流程,,而數(shù)據(jù)分析的最終是要形成方案或者決策指導,,因為分析結果體現(xiàn)不了價值,最終還是要和業(yè)務結合,,真正體現(xiàn)價值的是如何運用結果,。 建議方案就是解決如何有效利用分析結果。在很多情況下,,你會發(fā)現(xiàn)最能夠體現(xiàn)利用分析結果就是在獲取用戶和經(jīng)營用戶兩個方面,。在獲取用戶方面,我們需要針對那些還不是我們用戶的用戶進行轉(zhuǎn)化,,到達特定的用戶群,,即那批我們真正想要轉(zhuǎn)化的人,而如何選擇受眾,、選擇媒體需要充分利用分析結果,。對于廣告主來說永遠希望投放效果最大化,對于媒體來說則是收益效果最大化,,為此在最近的幾年我們看到了諸如DSP,、DMP、SSP和RTB等概念的出現(xiàn),,一定程度上就是利用我們不斷豐富的數(shù)據(jù)和分析結果,,不斷優(yōu)化我們在廣告方面的投放,不得不說這印證了西內(nèi)啟的那一句話,。 另一點,,從經(jīng)營用戶的目的來看,因為每一個用戶的獲取都需要成本,,在產(chǎn)品有限的生命周期內(nèi),,期望與每一個獲取的用戶生命周期也足夠長久,如此可以獲取更多的價值。而這一點,,在游戲領域也被逐漸利用起來,。 在以往的游戲數(shù)據(jù)分析領域,我們會發(fā)現(xiàn),,經(jīng)過數(shù)據(jù)分析后,,方案一旦形成,我們很難將這個方案執(zhí)行下去,,并且無法評估最終的效果,,因為在整個數(shù)據(jù)分析環(huán)節(jié)中,參與的部門的人員眾多,,數(shù)據(jù)分析結果與方案執(zhí)行往往很難做到一致,。不過在最近的移動游戲市場,已經(jīng)有很多的公司或者分析師慢慢注意到這一點,,因為移動設備可以更加精準地定位一個用戶,,同時移動提供了更加方便和快捷的消息推送和內(nèi)容下發(fā)機制,這使得我們至少從游戲運營層面可以做到根據(jù)設備,、地域,、渠道、游戲行為,、付費行為等更加準確和快速地對目標用戶進行營銷,,從一個層面已經(jīng)可以做到數(shù)據(jù)分析結果的最大化利用。 比如一款游戲,,如果一個活躍用戶連續(xù)三天不進入游戲,,則從游戲中流失的概率增加10%,此時我們就需要精確定位這樣一個群體,,進行目標用戶的營銷和召回計劃,。劃分的目標用戶如圖1-8所示。 根據(jù)分析結果,,最終通過A/B test等方式將運營消息和活動下發(fā)到用戶移動設備上,,使得目標用戶的轉(zhuǎn)化得以提升。這是對數(shù)據(jù)分析結果的最佳利用,,同時也是在不斷積累運營經(jīng)驗,,從長遠來看,會形成一系列的運營模型,,從此不必在摸著石頭過河,,也不必每一次運營活動和執(zhí)行都是通過感性認知完成。 建議方案是整個游戲數(shù)據(jù)分析的重要一環(huán),,因為最終我們還要進行效果的檢驗,,并且通過和分析目標進行比較,,是否達到了預期。整個數(shù)據(jù)分析過程其實一個循環(huán),,只不過在這一步是把分析結果的價值通過一定的手段和方式發(fā)揮出來,,最終經(jīng)過檢驗和不斷修正,形成經(jīng)驗和原則,。游戲數(shù)據(jù)分析師其實最需要突破的也恰恰是這一步,從方案執(zhí)行的實時性和分析師職能的突破兩個方面來看,,都將產(chǎn)生深遠的影響,,當然剛才提到的借助于內(nèi)容推薦只是達成這一目標的一種方式而已。 來源:TalkingData |
|
來自: 枯井道人 > 《統(tǒng)計》