隨著聚劃算業(yè)務(wù)的發(fā)展壯大,,每天報(bào)名的商家和商品也越來(lái)越多。目前,,每天的待審商品有2萬(wàn)多件。而審核小二為12人,,平均審核一件商品需要3-4分鐘的時(shí)間,。賣家催促審核的來(lái)電量始終很多,阻礙了賣家服務(wù)品質(zhì)的提升,。審核小二壓力巨大,。此外,審核小二們靠經(jīng)驗(yàn)去審核商品,,并沒(méi)有什么統(tǒng)一的標(biāo)準(zhǔn),。選進(jìn)來(lái)的商品能否賣得爆,小二們心中也沒(méi)有把握,。更長(zhǎng)遠(yuǎn)來(lái)看,,聚劃算的業(yè)務(wù)模式要轉(zhuǎn)型,要從報(bào)名商品審核轉(zhuǎn)向全網(wǎng)反向招商。這急需要一個(gè)標(biāo)準(zhǔn),,來(lái)告訴我們哪些商品有可能賣爆,,賣爆的可能性有多大;哪些商品是不靠譜的,,不靠譜的原因又是什么,。而大數(shù)據(jù)挖掘和分析則提供了這樣的解決方案。
人機(jī)結(jié)合,,數(shù)據(jù)化運(yùn)營(yíng)的必然選擇
目前世界上沒(méi)有任何一臺(tái)計(jì)算機(jī)的性能能夠比擬人腦,。運(yùn)營(yíng)小二在實(shí)踐中提煉出來(lái)的經(jīng)驗(yàn)和規(guī)則是最寶貴的知識(shí)。大數(shù)據(jù)解決方案如果忽視了人的經(jīng)驗(yàn),,則一定會(huì)像無(wú)頭蒼蠅,,盲目而不接地氣。而機(jī)器,,算法,,程序則能夠夜以繼日的挖掘出數(shù)據(jù)中的細(xì)節(jié),這些細(xì)節(jié)是人難以識(shí)別和發(fā)現(xiàn)的,,有些也難于解釋,。但是卻能夠產(chǎn)生出人意料的價(jià)值和效果。人機(jī)結(jié)合,,是讓數(shù)據(jù)價(jià)值最大化的必然選擇,。
在爆款模型解決方案的整體構(gòu)建中,運(yùn)營(yíng),,產(chǎn)品和數(shù)據(jù)科學(xué)團(tuán)隊(duì)進(jìn)行了多次溝通,,將業(yè)務(wù)痛點(diǎn)不斷提煉總結(jié),最終將整體解決方案的目標(biāo)定位在兩個(gè)點(diǎn)上,。第一,,最大可能的減少運(yùn)營(yíng)小二的審核工作量;第二,,模型算法推薦出來(lái)的高分商品,,將在實(shí)際售賣中比人選商品實(shí)現(xiàn)更高的成交。
針對(duì)第一點(diǎn),,運(yùn)營(yíng)提煉總結(jié)出了6條商品審核不通過(guò)的硬指標(biāo),,即:
1、賣家商品質(zhì)量DSR< 4.6
2,、報(bào)名備貨總額 < 10萬(wàn)元
3,、因選款無(wú)優(yōu)勢(shì)被拒絕次數(shù) > 3
4、報(bào)名價(jià)格 > 全網(wǎng)歷史最低價(jià)
5,、在淘寶的評(píng)價(jià)數(shù)量 < 3
6,、在淘寶的月銷量 < 3
觸發(fā)這6條指標(biāo)中的任意一條,,商品將不會(huì)通過(guò)審核,在模型中,,我們將這樣的商品打?yàn)?/span>0分,。在爆款模型整體解決方案構(gòu)建的第一期,我們將這六條規(guī)則固化,,發(fā)現(xiàn)每天待審的商品中有40%都因觸犯了這六條高壓線而打分為0,。然而,BI針對(duì)此規(guī)則監(jiān)控了2周時(shí)間,,發(fā)現(xiàn)0分商品依然有很多通過(guò)了審核,。0分商品的準(zhǔn)確率在70%-80%左右,其中女裝類目的準(zhǔn)確率只有50%左右,。也就是說(shuō),,根據(jù)運(yùn)營(yíng)經(jīng)驗(yàn)總結(jié)固化出來(lái)的規(guī)則也是有問(wèn)題的。針對(duì)這一點(diǎn),,BI團(tuán)隊(duì)再次與運(yùn)營(yíng)和產(chǎn)品進(jìn)行確認(rèn),。而運(yùn)營(yíng)也修正了他們的經(jīng)驗(yàn)。那些通過(guò)審核的0分商品中,,大部分是新品,,在全網(wǎng)的銷量和評(píng)價(jià)數(shù)很少,但是卻需要聚劃算給與支持,。針對(duì)這一點(diǎn),,BI又一次調(diào)整了0分規(guī)則,調(diào)整過(guò)后,,0分商品數(shù)量占整個(gè)審核商品的20%左右,,而準(zhǔn)確率則高于了90%。經(jīng)過(guò)多次調(diào)整和確認(rèn),,固化了運(yùn)營(yíng)經(jīng)驗(yàn)的0分規(guī)則滿足了預(yù)期,。
針對(duì)第二個(gè)目標(biāo),即模型推出爆款,,數(shù)據(jù)科學(xué)團(tuán)隊(duì)離線試驗(yàn)了多種機(jī)器學(xué)習(xí)的算法,,進(jìn)行大數(shù)據(jù)挖掘。在數(shù)據(jù)挖掘建模的過(guò)程中,,從特征的選擇,數(shù)據(jù)的清理,,算法庫(kù)的構(gòu)建,,集成,到最終的離線數(shù)據(jù)試驗(yàn),,算法效果比較,,數(shù)據(jù)科學(xué)團(tuán)隊(duì)進(jìn)行了大量的嘗試,。從近百個(gè)描述商品,賣家,,品牌,,平臺(tái)表現(xiàn)的指標(biāo)中,進(jìn)行變量選擇,;解決了定性變量在建模中所帶來(lái)的困難,;通過(guò)并行計(jì)算,提升了算法試驗(yàn)的效率,;最終構(gòu)建了包含變量選擇,,數(shù)據(jù)清理,以及邏輯回歸,,CART,,加權(quán)k近鄰,elastic net,,隨機(jī)森林,,gbm,支持向量機(jī),,神經(jīng)網(wǎng)絡(luò)以及flexiblelocal tree(FLT,,法決發(fā)明)等多種算法的算法庫(kù)。形成了機(jī)器學(xué)習(xí)算法方面的整體解決方案,。在此基礎(chǔ)之上,,又對(duì)數(shù)據(jù)進(jìn)行了反復(fù)的研究和算法試驗(yàn),最終從中選出了最適合聚劃算爆款模型應(yīng)用場(chǎng)景的FLT算法,。
之后,,BI團(tuán)隊(duì)部署了該算法,并針對(duì)女裝類目進(jìn)行了在線的對(duì)比試驗(yàn),。我們對(duì)比了6月1號(hào)到6月10號(hào)報(bào)名商品中通過(guò)審核后實(shí)際上聚的成交金額,,與模型打分。數(shù)據(jù)表明,,模型打分在50分以上的商品比50分以下的,,成交金額高出了50%。而且商品的成交金額與模型打分有著高度一致的保序性,。即模型打分越高的商品,,實(shí)際成交金額越高。這說(shuō)明了算法是有效的,,確實(shí)從大數(shù)據(jù)中找出了爆款的模式和規(guī)律,,而這些規(guī)律則是人難以發(fā)現(xiàn)的。
爆款模型的未來(lái)會(huì)怎樣,?
今天,,爆款模型通過(guò)對(duì)每一個(gè)商品進(jìn)行打分,,給予運(yùn)營(yíng)小二在商品審核過(guò)程中的參考。既能降低審核工作量,,又能選出爆款,。而將來(lái),隨著業(yè)務(wù)經(jīng)驗(yàn)在數(shù)據(jù)解決方案中的進(jìn)一步沉淀,,隨著機(jī)器算法的進(jìn)一步集成和參數(shù)調(diào)優(yōu),,爆款模型將會(huì)在商品排序,賣家備貨,,反向招商中給予運(yùn)營(yíng)很多的幫助,。甚至促進(jìn)業(yè)務(wù)模式的改變。而隨著該模型的推廣,,將會(huì)有更多我們想不到的需求,,可以借助它得以解決。
數(shù)據(jù)科學(xué)團(tuán)隊(duì)依然在緊鑼密鼓的推進(jìn)爆款模型,,從版本1.0到2.0到已經(jīng)成型的3.0,,算法在不斷的從數(shù)據(jù)中挖掘新的模式,而業(yè)務(wù)經(jīng)驗(yàn)也在這個(gè)過(guò)程中沉淀和整合,。我們有理由相信,,爆款模型在未來(lái)大有可為。