文章作者:楊帆,、楊楠楠 編輯整理:Hoh 內(nèi)容來源:《數(shù)據(jù)產(chǎn)品經(jīng)理:實戰(zhàn)進階》 出品平臺:DataFun 注:歡迎轉(zhuǎn)載,轉(zhuǎn)載請在留言區(qū)留言,。 導(dǎo)讀:用戶畫像作為當(dāng)下描述分析用戶,、運營營銷的重要工具,被全部互聯(lián)網(wǎng)人熟知,,用戶畫像的定義并不復(fù)雜,,是系統(tǒng)通過用戶自行上傳或埋點上報收集記錄了用戶大量信息,為便于各業(yè)務(wù)應(yīng)用,,將這些信息進行沉淀,、加工和抽象,形成一個以用戶標(biāo)志為主key的標(biāo)簽樹,,用于全面刻畫用戶的屬性和行為信息,這就是用戶畫像,。 畫像這種結(jié)構(gòu)化的用戶信息加工方式,,極大程度上做到了完整、全面且直觀地刻畫用戶,。畫像是用戶在產(chǎn)品的檔案,,便于人工使用、機器輸入和算法理解,。簡而言之:畫像是由標(biāo)簽樹及末級標(biāo)簽的標(biāo)簽值構(gòu)成的,,全面定量刻畫用戶的結(jié)構(gòu)化信息產(chǎn)品。畫像是標(biāo)簽的總成,,用戶標(biāo)簽是具體刻畫用戶的結(jié)構(gòu)化信息,,以下簡稱標(biāo)簽。 本文將介紹用戶畫像的構(gòu)建思路,,在畫像構(gòu)建的過程中,,我們把工作分為兩步:
1. 畫像從0到1的構(gòu)建思路一個比較成熟的畫像系統(tǒng),,會有成千上百的標(biāo)簽,這些標(biāo)簽的生產(chǎn)不是一次完成的,,而是隨著業(yè)務(wù)的發(fā)展需要,,逐步補充完善,最終呈現(xiàn)在大家眼前的就是一棵龐大的標(biāo)簽樹,。 跟自然界的樹木一樣,,要想長得茁壯參天,必須有一個穩(wěn)定的根基和合理的結(jié)構(gòu),用戶畫像的構(gòu)建也是一樣的,,前期最重要的仍然是搭好畫像骨架,,確保后續(xù)的發(fā)展過程中,依然保持清晰的結(jié)構(gòu)和高延展性,。相反的,,如果一開始為了搶時間,將大量標(biāo)簽無序的堆在線上,,后期管理和使用的難度會迅速凸顯出來,,重構(gòu)的代價巨大。 上面說到,,一個好的標(biāo)簽樹結(jié)構(gòu)要滿足兩個條件,,“高概括性”和“強延展性”,高概括性意味著結(jié)構(gòu)體系能夠很好的包含一個用戶的基本屬性和產(chǎn)品交互的相關(guān)行為,,同時對于業(yè)務(wù)重點單獨強調(diào),,沒有遺漏;“強延展性”意味著結(jié)構(gòu)全面的同時也有一定的抽象概括能力,,保證新增的標(biāo)簽可以很好的找到對應(yīng)的分類,,整個體系不會過于收斂局限。 按照這個原則,,畫像通常從八個維度組織標(biāo)簽,,分別為:基本屬性、平臺屬性,、行為屬性,、產(chǎn)品偏好、興趣偏好,、敏感度,、消費屬性、用戶生命周期及用戶價值,。 下圖所示為用戶整體架構(gòu)示例: ① 基本屬性 基本屬性是指一個用戶的基本社會屬性和變更頻率低的平臺特征,,例如真實社會年齡、性別,、婚姻狀況,、昵稱、號碼,、賬號,、lbs等標(biāo)簽。這些標(biāo)簽類型多為直采型,,可從用戶基本信息表中直接獲取,,不需要統(tǒng)計或者算法挖掘,。 示例:社會性別_女 ② 平臺屬性 平臺屬性是用戶在平臺上表現(xiàn)出的基本屬性特征,是利用用戶行為進行算法挖掘,,標(biāo)識用戶真實屬性的標(biāo)簽,。 最典型的平臺屬性標(biāo)簽例如平臺年齡標(biāo)簽,這里就有一個疑問,,為什么在用戶的基礎(chǔ)屬性中已經(jīng)有年齡標(biāo)簽,,但在平臺屬性中重復(fù)又有一個呢,這里就涉及兩者之間的差別,。設(shè)想一個真實的場景:一個用戶社會身份為20歲,,但他喜歡中年人的穿衣風(fēng)格,在使用app購物的時候,,表現(xiàn)出的真實偏好為30-40歲,,對于這樣使用產(chǎn)品時表現(xiàn)出的用戶心智和真實年齡不相符合的用戶,如果只采用上傳的基本屬性,,給他推薦年輕人喜歡的物品,,是不是很難命中個體用戶的興趣呢? 兩種不同的標(biāo)簽,,本質(zhì)上是用戶自己上傳信息的隨意性和挖掘信息的權(quán)威性差異,,是用戶社會屬性和真實屬性差異。 我們仔細分析一下兩者在數(shù)據(jù)源,、計算邏輯、標(biāo)簽格式,、標(biāo)簽值和應(yīng)用場景的差異,,如下: 數(shù)據(jù)源與計算邏輯:基礎(chǔ)屬性是利用用戶自行上傳的存儲在用戶基礎(chǔ)信息表里的數(shù)據(jù),平臺屬性則利用客戶端或者服務(wù)端埋點上報采集的用戶行為數(shù)據(jù)進行挖掘計算生成,?;緦傩允堑湫偷闹辈尚蜆?biāo)簽,平臺屬性是典型的算法挖掘型標(biāo)簽,。 末級標(biāo)簽和輸出標(biāo)簽值:以性別為例,,基本屬性代表用戶真實的社會身份,是確定的事實,,所以典型標(biāo)簽形式為“性別_女”,,而平臺屬性則代表用戶在性別維度的偏好概率,所以典型形式為“性別_女_0.80”其中‘女’為末級標(biāo)簽,,0.80則代表用戶在平臺的女性身份上表現(xiàn)出的傾向程度,。 應(yīng)用場景:平臺屬性通過用戶行為進行挖掘,更能代表用戶的真實傾向,,輸出結(jié)果比基本屬性準(zhǔn)確率高,,在定向營銷和算法里,,年齡、性別等通常采用平臺屬性,。而社會屬性中電話,、身份證、賬號,、昵稱等使用較多,。 ③ 行為屬性 行為屬性記錄的是用戶的全部單點行為,用戶的單點行為包括啟動,、登錄,、瀏覽、點擊,、加車,、下單等非常多,而且跟不同的產(chǎn)品,,不同的模塊交互,,不同的時間窗選取,行為就更加復(fù)雜了,,如何能夠全面的梳理,,可以按照“產(chǎn)品*功能模塊*用戶單點行為*時間”四大要素來組織。 這里的“產(chǎn)品*功能模塊*用戶單點行為*時間”意思是一個完整的行為應(yīng)該包含“哪個產(chǎn)品”“哪個功能模塊”“哪個行為”“哪些時間要求”幾要素,,例如某瀏覽器體育頻道距今最近一次訪問時間,。按照這幾要素組織行為,不容易發(fā)生遺漏,。 示例:產(chǎn)品初次登錄時間,,最后一次啟動距今時間,30天內(nèi)搜索行為頻次,,一個月內(nèi)閃屏訪問次數(shù)等,。 ④ 產(chǎn)品偏好 產(chǎn)品偏好是對用戶使用某些產(chǎn)品、產(chǎn)品核心功能或者其他渠道的偏好程度的刻畫,,屬于挖掘型標(biāo)簽,,其中產(chǎn)品的選取可以包括自家產(chǎn)品、競品,;功能和渠道包括站內(nèi)產(chǎn)品功能,,也包括push、短信,、開屏,、彈窗等幾大運營和產(chǎn)品法寶。 示例:搜索模塊偏好,、直接競品_京東偏好,、短信偏好,。 ⑤ 興趣偏好 興趣偏好是用戶畫像內(nèi)非常重要的維度,以電商產(chǎn)品為例,,用戶對商品的喜愛程度是用戶最終的信息之一,,興趣偏好就是對用戶和物品之間的關(guān)系進行深度刻畫的重要標(biāo)簽,其中最典型的要屬品牌偏好,、類目偏好和標(biāo)簽偏好,。 示例:品牌偏好_優(yōu)衣庫_0.91類目偏好_美妝_0.80、標(biāo)簽偏好_紅色_0.70,?!?/p> ⑥ 敏感度 在營銷活動時,我們留意到有些用戶不需要優(yōu)惠也會下單,,而有些用戶一定要通過優(yōu)惠券刺激才會轉(zhuǎn)化,,優(yōu)惠券的額度也影響了用戶下單的金額,這種情況下,,如何識別對優(yōu)惠敏感的用戶發(fā)放合理的券額的優(yōu)惠券,,保證優(yōu)惠券不浪費,去報促銷活動的ROI最大,,其中一個很重要的標(biāo)簽就是用戶的敏感度標(biāo)簽,,敏感度代表用戶對平臺活動或者優(yōu)惠的敏感程度,也是典型的挖掘類標(biāo)簽,。 示例:熱點敏感度,、折扣敏感度。 ⑦ 消費屬性 無論是電商,、內(nèi)容或者其他領(lǐng)域,,公司的目標(biāo)最終都是收益,所以消費屬性往往作為一個單獨的維度重點刻畫,。消費屬性包括統(tǒng)計型標(biāo)簽——消費頻次,、消費金額,、最近一次消費時間等,,也包括挖掘型標(biāo)簽——消費能力和消費意愿,同時包含敏感度標(biāo)簽——優(yōu)惠促銷敏感度,、活動敏感度,、新品敏感度、爆款敏感度等,。 ⑧ 用戶生命周期及用戶價值 用戶生命周期是用戶運營的重要法典,,一個用戶從進入產(chǎn)品到離開,通常會經(jīng)歷“新手”“成長”“成熟”“衰退”“流失”5個典型階段,,每個階段對用戶運營存在策略差異,,畫像在其中的作用是明確標(biāo)記用戶所處生命周期的階段,,便于后續(xù)業(yè)務(wù)同學(xué)落地。 用戶價值是體現(xiàn)用戶為產(chǎn)品貢獻價值高低的標(biāo)簽,,最經(jīng)典的是RFM模型獲得交易維度標(biāo)簽,,與此同時,也應(yīng)該看到用戶的其它價值,,例如為產(chǎn)品貢獻活躍度,,通過裂變拉來新用戶,這些都可設(shè)計相應(yīng)的標(biāo)簽,。 示例:新手,、成長、成熟,、衰退,、流失、高價值用戶,、VIP等級等,。 2. 畫像從1到100的構(gòu)建思路在前面一節(jié),我們討論了一個用戶畫像的基礎(chǔ)框架應(yīng)該如何搭建,,這一節(jié)討論一下,,有了基礎(chǔ)框架,到底應(yīng)該如何著手一步一步完善畫像標(biāo)簽樹,,如何從一個基于業(yè)務(wù)的需求落地為標(biāo)簽的設(shè)計,,如何將標(biāo)簽應(yīng)用到具體的業(yè)務(wù)中。 要解決“如何做”“如何用”兩大問題,,要從這個問題的根本入手思考,,也就是我們?yōu)槭裁匆鲇脩舢嬒瘢脩舢嬒竦淖饔檬鞘裁?,了解了這個問題,,便能水到渠成的根據(jù)用途合理的設(shè)計方案。 用戶畫像的主要目的有三個,,具體如下: 第一用于用戶信息的統(tǒng)計,,建立對產(chǎn)品對用戶的基本認(rèn)知;第二用于用戶定向營銷,,利用人群圈選投放物料,;第三用于算法,沉淀用戶特征,,供模型使用,。所以標(biāo)簽的完善也可以按照這三個維度不斷豐富,以下分別舉例說明標(biāo)簽建設(shè)的思路,。 ① 用于統(tǒng)計,,對產(chǎn)品對用戶的基本認(rèn)知 每個產(chǎn)品功能策略完善,,都需要建立在對產(chǎn)品對用戶的充分認(rèn)知基礎(chǔ)上,也就是說,,用戶是誰,,有何特點,基本情況如何,,這些是用戶畫像需要回答的重要問題,。 思路拆解:既然要了解用戶的基礎(chǔ)信息,就需要將用戶基本屬性進行拆解:年齡,、性別,、居住城市(幾線)、家庭結(jié)構(gòu)(婚否,、孩否)等,。為了盈利考慮,還需要了解基本的收入水平,、消費能力等,。將拆解的維度抽象,構(gòu)建對應(yīng)標(biāo)簽,,然后進行分布統(tǒng)計,,便能生成一份基本的用戶認(rèn)知報告。 標(biāo)簽結(jié)果:年齡,、性別等,。 ② 用于定向營銷和精細化運營 運營同學(xué)作為畫像的重要業(yè)務(wù)使用方,每天都會通過標(biāo)簽圈選人群,,做定向的用戶,、活動、內(nèi)容精細化運營,,以及各app每天都在進行的促銷活動,。這些運營和活動的場景分布在產(chǎn)品的各個渠道和各個資源位,對場景和人群的驚喜程度要求都很高,。 我們舉例一個日常工作中最常見的需求:通過一次數(shù)據(jù)分析發(fā)現(xiàn),,產(chǎn)品的流失用戶占比提升,通過討論,,大家認(rèn)為通過一次結(jié)合利益點的push推送,,召回流失用戶,,是有效且快速的手段,,同時push作為各個業(yè)務(wù)都在爭取的有限資源,希望可以提高使用效率,,確保push這個資源渠道的整體ROI,,以上需求希望畫像可以支持,。 思路拆解:從這個需求背景中,我們做一次關(guān)鍵詞提取,,不難發(fā)現(xiàn),,關(guān)鍵詞如下是“流失用戶”、“利益點”,、“push”“效率”,。其中流失用戶是用戶身分識別,利益點是用戶優(yōu)惠敏感度,,push是產(chǎn)品渠道資源,,效率意味著要盡可能的確保全選人群精準(zhǔn),不能為了覆蓋率犧牲準(zhǔn)確率,。 思路拆解完畢,,具體落地就變得簡單多了,參考步驟如下: 第一步:需要流失用戶的口徑和標(biāo)簽,,這里需要用到用戶生命周期的劃分,,從中識別并標(biāo)識出流失用戶。 第二步:分析對流失用戶拉回效果最好的利益點,,例如優(yōu)惠券,、折扣、禮品或者是其他內(nèi)容,。這一步需要運營和數(shù)據(jù)同學(xué)根據(jù)日常經(jīng)驗和數(shù)據(jù)分析獲得,,對于畫像的要求是基于分析結(jié)論,挖掘不同用戶對于優(yōu)惠折扣的敏感程度,,這一部分在標(biāo)簽架構(gòu)敏感度部分有論述,,最終目的是確保每一分錢都能花在刀刃上。 第三步:確定拉回的明確目標(biāo),,是拉回規(guī)模還是準(zhǔn)確率,,通過需求分析可以確定,本次拉回在資源有限的情況下,,需要提升人群識別的準(zhǔn)確率,,畫像實現(xiàn)準(zhǔn)確率的方法有兩條路徑,一是提升畫像算法的準(zhǔn)確率,,這部分主要依賴算法本身,,無法一蹴而就,所以這里選擇的方法是增加人群全選的條件,,可就是新增標(biāo)簽,,供圈選求交 根據(jù)背景分析,我們可以增加流失用戶關(guān)于push渠道的打開意愿的標(biāo)簽,提高push資源的使用效率,。 經(jīng)過上述分析,,需要生產(chǎn)的標(biāo)簽如下:
通過以上需求分析和思路拆解,,畫像的建設(shè)過程應(yīng)該比較明確,這里再留一個思考的case,,可以嘗試如何分析如何落地:平臺新上一款商品,,初期需要在某模塊展示給目標(biāo)用戶做推廣,同時盡量不打擾其他非目標(biāo)用戶,,不降低該資源位的整體轉(zhuǎn)化效率,。 思路拆解提示:商品的目標(biāo)用戶——商品可以按照哪些維度拆分關(guān)鍵信息?模塊位置——用戶的模塊功能使用偏好是什么,?準(zhǔn)確率的要求——如何提升畫像應(yīng)用的準(zhǔn)確率,? 回答好以上問題,這個需求的標(biāo)簽便能順利獲得,。 ③ 用于算法,,主要應(yīng)用于搜索推薦、風(fēng)控廣告等策略方向,,標(biāo)簽可以直接作為用戶特征使用 標(biāo)簽除了用于基本的用戶群體描述,,定向營銷和精細化運營,還有一個相對來說新穎又廣泛的用途,,用于各算法的各個環(huán)節(jié),,在召回和排序兩大經(jīng)典策略流程中,都可以用到用戶畫像,,這里我們舉例畫像在推薦系統(tǒng)的召回層應(yīng)用案例,。 需求背景:推薦系統(tǒng)的本質(zhì)是從海量信息中計算用戶最感興趣的部分,對應(yīng)推薦系統(tǒng)的“召回-粗排-精排”,,是一個“層層精選”的過程,。其中召回層是精選的第一道流程,為后續(xù)計算打分準(zhǔn)備初步的興趣候選集,,這里候選集的生成方法之一就是用戶畫像法,。仍然以電商業(yè)務(wù)為例,,講述如何用用戶畫像做興趣召回。 思路拆解:召回的作用是粗篩,,幫助推薦系統(tǒng)計算第一道用戶興趣池,這里用戶對物品的興趣興趣可拆解為對商品品牌,、類目和商品標(biāo)簽的興趣,,這部分就已經(jīng)轉(zhuǎn)化為上述文章中的已知內(nèi)容,用戶標(biāo)簽中是有品牌偏好標(biāo)簽,、類目偏好標(biāo)簽和標(biāo)簽偏好標(biāo)簽的,,只需要在所有品牌、類目,、標(biāo)簽下維護一個按照商品質(zhì)量或者熱度倒敘的列表,,這樣只要獲取到用戶標(biāo)識,邊能從用戶畫像中獲取偏好的品牌,、類目和標(biāo)簽,,再從品牌、類目和標(biāo)簽下的商品列表中召回相應(yīng)的商品,,根據(jù)候選集大小的設(shè)計,,做top k截斷召回。這部分商品完成了初步的召回,,為進入下一個流程進行粗排和精排做準(zhǔn)備,。 以上章節(jié),選自:《數(shù)據(jù)產(chǎn)品經(jīng)理:實戰(zhàn)進階》 新書推薦: 本書鮮讀專欄價:89元=電子書(提前三個月看到) 紙質(zhì)書 12個作者維護的付費知識星球,。如果轉(zhuǎn)發(fā)鏈接,,還可以拿到更大優(yōu)惠:可以得到成交返利的40%。(具體操作方法,,可識別文末海報二維碼,,獲得詳細教程,以及知識星球加入方式,。) 以下為作者楊楠楠老師對本書的介紹: 1. 為什么要寫這本書: 本書誕生于數(shù)據(jù)產(chǎn)品經(jīng)理社群,。 四年前,我在知乎上開始寫數(shù)據(jù)產(chǎn)品經(jīng)理的專欄,,幾個月間,,有幾千名讀者關(guān)注我,加我微信,,于是我就建立了數(shù)據(jù)產(chǎn)品的微信群,。 很多人都在群里問,有沒有一本可以讓數(shù)據(jù)產(chǎn)品經(jīng)理系統(tǒng)學(xué)習(xí)的書,? 世上本沒有這樣的書,,問的人多了,我決定自己寫一本。 考慮到個人的經(jīng)歷,,始終只是數(shù)據(jù)產(chǎn)品的眾多種類中的一部分,,于是我在群里召集大家一起寫。 響應(yīng)者眾,,有20多名數(shù)據(jù)產(chǎn)品經(jīng)理,,報上來的章節(jié)有30章。超過了我的預(yù)期,。而我挨個聊下來,,發(fā)現(xiàn)每個人手里,都有足夠好的項目,,在自己的領(lǐng)域,,也有足夠的資歷來傳播經(jīng)驗。 于是跟華章的總編輯楊福川老師商量,,我們決定出兩本書,,一本講專業(yè)知識:《數(shù)據(jù)產(chǎn)品經(jīng)理進階》,一本講案例:《數(shù)據(jù)產(chǎn)品經(jīng)理實戰(zhàn)》,。 在三四年處理眾多問題和咨詢的過程中,,我發(fā)現(xiàn)數(shù)據(jù)產(chǎn)品經(jīng)理隨著成長,主要分成以下幾個階段:
我們的每個作者,,都已經(jīng)超越了上述兩個階段,。 他們是這個行業(yè)的中堅力量,也愿意給這個行業(yè)留下自己的痕跡,。 《數(shù)據(jù)產(chǎn)品經(jīng)理實戰(zhàn)》書,,主要回答了第二個問題,每個案例在業(yè)內(nèi)都屬于非常好的項目,,給公司帶來了較大的收益,。 而《數(shù)據(jù)產(chǎn)品經(jīng)理進階》(以下簡稱《進階》)這本書,主要篤實數(shù)據(jù)產(chǎn)品經(jīng)理的知識結(jié)構(gòu),,幫助讀者度過第一個階段,,包括以下內(nèi)容: ① 為了讓你可以進一步了解數(shù)據(jù)產(chǎn)品經(jīng)理,我們提供了:數(shù)據(jù)產(chǎn)品的行業(yè)視野,、產(chǎn)品經(jīng)理自身的能力要求,、以及面試和招聘,; ② 為了讓你hold住全場,成為團隊的驅(qū)動力,,我們提供了通用能力模塊,,包括數(shù)據(jù)分析能力、產(chǎn)品經(jīng)理的項目運轉(zhuǎn)能力,; ③ 只有數(shù)據(jù)部門能使用數(shù)據(jù),,沒法做到數(shù)據(jù)驅(qū)動。讓公司的每個部門,、每個人,,都能方便快捷的使用數(shù)據(jù)做決策,,才算是數(shù)據(jù)賦能,,才能夠極大的提升整個公司的數(shù)據(jù)水平。 這需要良好的數(shù)據(jù)建設(shè)能力,。 所以,,我們提供了數(shù)據(jù)采集、治理,、應(yīng)用,、能力輸出的整個鏈條的內(nèi)容:
④ 策略產(chǎn)品可以直接將數(shù)據(jù)變現(xiàn),,是非常重要的一個數(shù)據(jù)產(chǎn)品的方向,我們提供了搜索,、用戶畫像等常見的策略產(chǎn)品的知識,。 不同的公司對數(shù)據(jù)的要求不同,有些公司會更關(guān)注可以直接進行數(shù)據(jù)變現(xiàn)的能力,,有些公司會更關(guān)注數(shù)據(jù)建設(shè)的能力,。 那對于一個新手,要不要了解這么多內(nèi)容,? 這里提供一個做事思路:不要給自己設(shè)限,。你先留意了這些內(nèi)容,才會對公司的數(shù)據(jù)現(xiàn)狀進行思考和認(rèn)知積累,,才能知道公司的數(shù)據(jù)有哪些機會,。 產(chǎn)品管理的主動權(quán),,應(yīng)該是產(chǎn)品經(jīng)理自己爭取來的,而不是等待別人給你,。 在你去爭取之前,,我們希望,我們提供的這些章節(jié),,是你最好的武器,。 2. 讀者對象:
3. 致謝 非常感謝12名作者,在工作的百忙之中,,犧牲自己的休息時間,,辛苦撰寫文章。 感謝機械工業(yè)出版社華章公司的編輯楊福川老師:在這半年多的時間中始終支持我的寫作,,對書的架構(gòu)和寫作提出寶貴意見,。 感謝項目經(jīng)理徐湲策:同時協(xié)調(diào)兩本書的20位作者,是一件非常辛苦和瑣碎的事情,。在項目開始的前半個月,,我?guī)缀醵荚趨f(xié)調(diào),沒有時間寫書,,可見這份工作實在是占用時間和精力,。于是我在群里招項目經(jīng)理,小徐主動站出來承擔(dān)了這個責(zé)任,,并展現(xiàn)了他在項目管理方面的專業(yè)性,。 有十余名志愿者參與了本書的試讀,并提出寶貴意見,,對本書的質(zhì)量有很大幫助,。他們是:黃宇、夢婷,、范昱輝,、王資涵; |
|