國(guó)內(nèi)有一家民營(yíng)航空公司,,會(huì)員不下數(shù)百萬(wàn),會(huì)員的一個(gè)重要信息是郵箱地址,。另外一邊,,微博賬號(hào)申請(qǐng)也需要一個(gè)郵箱地址。通常來(lái)說(shuō),同一個(gè)郵箱地址意味著航空公司里的會(huì)員和微博里的會(huì)員,,應(yīng)該是同一個(gè)人,。公司做了一個(gè)篩選,合并出十萬(wàn)個(gè)用戶來(lái),。 然后一家第三方公司的數(shù)據(jù)部門介入,,主要任務(wù)是看這十萬(wàn)航空公司會(huì)員的微博用戶,在社會(huì)化媒體上的行為,,比如“說(shuō)”些什么,,比如喜歡介入什么樣的話題去轉(zhuǎn)發(fā)評(píng)論,比如喜歡關(guān)注什么樣的商業(yè)賬號(hào),。研究這類事的原因在于:這個(gè)航空公司很想知道它在社會(huì)化媒體上發(fā)起什么樣的活動(dòng)(以及活動(dòng)所配備的禮品刺激)會(huì)吸引到這十萬(wàn)會(huì)員參加,,成為earned media。 這個(gè)案例并非嚴(yán)格意義上的大數(shù)據(jù),,因?yàn)閿?shù)據(jù)還是不夠海量,。不過(guò),它的原理和大數(shù)據(jù)營(yíng)銷有關(guān):尋求相關(guān)性,。 相關(guān)性不是因果,,很難得出這樣的結(jié)論:因?yàn)?/B>經(jīng)常坐某某航空公司的班機(jī),所以喜歡參與某某活動(dòng)(反過(guò)來(lái)也不成立),。但這兩個(gè)變量之間,,從普遍意義上講,存在一定的關(guān)聯(lián),。這個(gè)道理就像穿紅襪子和炒股票的關(guān)系,,或許有一定的關(guān)聯(lián)系數(shù),但絕不是因果關(guān)系,。相關(guān)搞成了因果,,差不多和“迷信”就沒(méi)有區(qū)別了。 商業(yè)應(yīng)用上,,其實(shí)不太需要拼命挖掘因果,。你只要知道坐該航空公司班機(jī)和參加特定活動(dòng)之間存在一定概率就行了,至于究竟是為什么,,可以暫時(shí)忽略之,。對(duì)于營(yíng)銷業(yè)者而言,這個(gè)概率哪怕能幫助到營(yíng)銷活動(dòng)提高10%參與度,,都是不小的成效,。 但問(wèn)題在于,很多人把相關(guān)等同于因果,,這樣的做法會(huì)形成很有些誤導(dǎo)性的結(jié)論,。比如說(shuō),,當(dāng)在這個(gè)十萬(wàn)航空公司用戶中發(fā)現(xiàn),他們特別喜歡某類活動(dòng),,這個(gè)結(jié)論是不具有推廣性質(zhì)的,。再新增五萬(wàn)航空公司微博用戶時(shí),你很難把上述那個(gè)結(jié)論也放他們頭上,。因?yàn)檫@里面沒(méi)有因果關(guān)系,。要確認(rèn)因果關(guān)系,必須經(jīng)過(guò)一個(gè)很復(fù)雜的觀察和思考過(guò)程,,排除所謂“隱性變量”,。這不是那么簡(jiǎn)單的做一些數(shù)據(jù)分析就可以的,。相關(guān)性是因果的前提,,但是不等于因果。 于是,,大數(shù)據(jù)出現(xiàn)了,。 大數(shù)據(jù)尋求的是海量數(shù)據(jù),海量到什么份上,?就是全樣本,。全樣本和抽樣顯然是不同的。過(guò)去的研究,,由于操作性的關(guān)系,,很難做到全樣本,需要去抽樣,。抽樣的科學(xué)做法是“隨機(jī)”——不過(guò)這一點(diǎn)聽(tīng)著容易,,做起來(lái)相當(dāng)困難。真正的隨機(jī)抽樣需要花很多錢(利用社交網(wǎng)絡(luò)關(guān)系,,通過(guò)一個(gè)用戶做問(wèn)卷再發(fā)動(dòng)這個(gè)用戶找更多的人來(lái)做問(wèn)卷,,一點(diǎn)都不隨機(jī)),而且一個(gè)無(wú)法繞過(guò)的弊端在于:如果你使用調(diào)查問(wèn)卷的方法,,你很難排除回答者的語(yǔ)言回答一定就是ta心中真正的想法或者實(shí)際上的真正行為,。 大數(shù)據(jù)首先不是抽樣,它獲得的數(shù)據(jù)是全體樣本數(shù)據(jù),,其次它不是在讓用戶回答問(wèn)題,,而是實(shí)打?qū)嵉厝カ@取用戶的“行為”。用戶聲稱對(duì)某活動(dòng)會(huì)有興趣和用戶是否參加了某活動(dòng),,顯然后者更能說(shuō)明問(wèn)題,。 最重要的一點(diǎn),大數(shù)據(jù)分析和抽樣分析的核心區(qū)別在于:前者是動(dòng)態(tài)的,,后者是靜態(tài)的,。 前文提到,,隨機(jī)抽樣方法是成本很高的,故而它很難每天都去做一次——事實(shí)上,,為某個(gè)特定的問(wèn)題一個(gè)月乃至一個(gè)季度做一次隨機(jī)抽樣,,都很難實(shí)施。于是,,一個(gè)隨機(jī)抽樣所形成的結(jié)論,,其實(shí)是靜態(tài)的,它只能說(shuō)明在做那次調(diào)研時(shí)的一些相關(guān)性,。當(dāng)有新的用戶(樣本)加入時(shí),,很難再說(shuō)明過(guò)去的相關(guān)性是否能夠成立——除非,你能找到真正的排除了各種隱形變量后的因果關(guān)系,。 如果試圖減少成本去做非隨機(jī)抽樣,,那么,它的結(jié)論就更沒(méi)有推廣意義(學(xué)術(shù)一點(diǎn)稱之為外部效度性,,非隨機(jī)抽樣外部無(wú)效度),。當(dāng)新用戶加入后,非隨機(jī)抽樣的結(jié)論基本不能適用,。 但大數(shù)據(jù)的分析卻是動(dòng)態(tài)的,,每秒都有可能產(chǎn)生一個(gè)新的結(jié)論。讓我們用最常見(jiàn)的亞馬遜頁(yè)面上的“購(gòu)買此商品的顧客也同時(shí)購(gòu)買”來(lái)舉例,。 這個(gè)部分里的商品是活動(dòng)的,,由于新購(gòu)買的產(chǎn)生,會(huì)導(dǎo)致這個(gè)模塊里的商品可能會(huì)產(chǎn)生變化,。不過(guò),,這個(gè)模塊也有可能是導(dǎo)致商品集中化購(gòu)買的重要原因:用戶看到了這個(gè)模塊里推薦的商品而產(chǎn)生購(gòu)買的可能是很大的(也許ta本來(lái)就沒(méi)有任何購(gòu)買的念頭,甚至連這個(gè)商品都不曉得),。但對(duì)于大數(shù)據(jù)來(lái)說(shuō),,原因是什么一點(diǎn)也不重要,它要做的——至少在電子商務(wù)領(lǐng)域——無(wú)非是提高客單價(jià)罷了,。買了A書和買了B書之間的因果研究,,那是學(xué)者們的事,不是商人關(guān)心的事,。 大數(shù)據(jù)處理的方式不是探幽細(xì)究型的,,挖空心思去想究竟原因?yàn)楹螞](méi)有這個(gè)必要,不過(guò)拿出一些結(jié)論來(lái)演繹也是會(huì)鬧笑話的:比如吃海參有助于提高智商,。大數(shù)據(jù)其實(shí)不需要做什么演繹,,它的任務(wù)只是讓你在某一時(shí)刻能做到提升成功率的事,哪怕只有1%,。量一大,,1%都是極其可觀的,。 回到航空公司的具體案子來(lái)。10萬(wàn)同時(shí)擁有航空公司會(huì)員和微博會(huì)員的人,,并非隨機(jī)抽樣而得,,故而這10萬(wàn)對(duì)于整體數(shù)百萬(wàn)航空公司會(huì)員而言,沒(méi)有代表性,。但我們的目標(biāo)不是想尋求坐這家航空公司班機(jī)的人和參與某網(wǎng)絡(luò)活動(dòng)的因果關(guān)系,,我們只是想提升一下參與活動(dòng)概率并希望看到更多人會(huì)去轉(zhuǎn)發(fā)某個(gè)活動(dòng)罷了。故而,,10萬(wàn)微博用戶,,夠了。 在某一個(gè)時(shí)點(diǎn),,跑了一下數(shù)據(jù),,大致能看到一些相關(guān)性,于是我們開(kāi)始設(shè)計(jì)某種活動(dòng),,并有針對(duì)性地讓這10萬(wàn)微博用戶知道,,這次獲得的參與度和轉(zhuǎn)發(fā)率,比毫無(wú)數(shù)據(jù)支撐背景下的胡亂策劃,,成功率應(yīng)該會(huì)高一點(diǎn)。同樣的人力投入,,得到了相對(duì)而言的較高效果,,這就是數(shù)據(jù)分析的好處。 過(guò)了三個(gè)月后,,又有需要策劃的活動(dòng),,注意,這一次依然需要再跑一次數(shù)據(jù),。因?yàn)闃颖究赡懿皇侵挥?0萬(wàn)了,,也許15萬(wàn),也許運(yùn)氣不好有2萬(wàn)微博用戶已經(jīng)“死亡”,,只剩8萬(wàn),。另外一個(gè)可能是有某些新的外部變量加入,比如出來(lái)一種新的商品讓很多人趨之若鶩高度關(guān)注,。這個(gè)時(shí)候拿上一次的數(shù)據(jù)來(lái)指導(dǎo)策劃,,又是盲人騎瞎馬,夜半臨深淵了,。 不同的時(shí)點(diǎn),,或者目標(biāo)不同的活動(dòng),都需要再次跑數(shù)據(jù),,這可能是大數(shù)據(jù)分析的麻煩之處,。不過(guò),,計(jì)算機(jī)的長(zhǎng)處就是計(jì)算,花上一兩個(gè)小時(shí)設(shè)計(jì)幾個(gè)公式或模型,,相對(duì)于過(guò)去動(dòng)不動(dòng)要搞隨機(jī)抽樣,,便利性提高很多倍,值得嘗試,。 更宏大一點(diǎn)的就是真正意義上的“大數(shù)據(jù)”了,。今年年頭互聯(lián)網(wǎng)圈阿里要并購(gòu)新浪微博,從商業(yè)邏輯上講,,一個(gè)是中國(guó)最大的消費(fèi)平臺(tái),,一個(gè)是中國(guó)最大的碎片化言論平臺(tái),兩者數(shù)據(jù)的合并,,是頗能挖出更多的相關(guān)性來(lái),。 當(dāng)你發(fā)表一條微博時(shí),忽然配套出來(lái)了一條廣告,。是的,,你很煩,感覺(jué)又被騷擾了,。但從商業(yè)角度而言,,如果你過(guò)去的煩是一萬(wàn)次廣告推送才會(huì)有一次點(diǎn)擊,現(xiàn)在變成九千次一次點(diǎn)擊,,都是了不得的進(jìn)步,。一萬(wàn)次為什么會(huì)變成九千次?因?yàn)橐粋€(gè)人的言論和ta的消費(fèi)傾向,,的確是存在一定相關(guān)性的,。 廣告圈里一句名言:我知道我的廣告浪費(fèi)了一半,但我不知道浪費(fèi)了哪一半,。一些營(yíng)銷業(yè)者鼓吹說(shuō)他們可以讓你不浪費(fèi)那一半,。不要相信他們。對(duì)于廣告來(lái)說(shuō),,從浪費(fèi)50%到浪費(fèi)49%,,都是很值得去投入的事。建立在相關(guān)性而非因果上的大數(shù)據(jù)營(yíng)銷,,不可能讓廣告主從此不再浪費(fèi)廣告,,它只能做到:浪費(fèi)得少一點(diǎn)。 這就夠了,。 —— 銷售與市場(chǎng) 約稿 —— 再說(shuō)一下隨機(jī)樣本和全樣本的關(guān)系,。理論上講,你可以設(shè)計(jì)一個(gè)模型,,每秒鐘都在那里抽樣,,不是沒(méi)有操作性,。但問(wèn)題在于,隨機(jī)抽樣生成的結(jié)果都存在一定誤差,,既然手上已經(jīng)有全樣本,,又何必去搞什么抽樣。對(duì)于計(jì)算機(jī)而言,,計(jì)算1億個(gè)樣本,,和計(jì)算一千個(gè)樣本,代價(jià)雖然有差,,但全樣本沒(méi)有誤差,,已足以彌補(bǔ)這點(diǎn)代價(jià)。 作者:魏武揮 來(lái)源:http:///5484.html |
|
來(lái)自: 周秦漢唐 > 《營(yíng)銷知識(shí)》