第162位講者:謝幸 微軟亞洲研究院社會計算組主任研究員 中國科學技術(shù)大學兼職博士生導師 什么叫用戶畫像,?就是通過用戶產(chǎn)生的各種數(shù)據(jù),,去試圖理解用戶的性格及各類屬性,如年齡,、性別,、愛好等。 要對這些進行深入研究并不容易,,但在心理學領(lǐng)域,,這些已經(jīng)研究了上千年。 公元前400年左右,,有一個叫希波克拉底的古希臘醫(yī)學家,,他提出「四體液說」的概念,他認為人體中有四種體液:黑膽汁,、黃膽汁,、血液和黏液。 這四種體液的分布決定了人的性格,。如果你容易抑郁,,則是黑膽汁比較多;你比較樂觀,,則是血液比較多,;你沖動易怒,則是黃膽汁比較多,;你冷靜理智,,則是黏液比較多。 在現(xiàn)代醫(yī)學看來,,體液學說并不科學,,但這對人格的探討和分類卻很有啟發(fā)。 心理學有「詞匯學假說」,,是指在研究人格時,,我們不用漫無目的地去觀察各種各樣的人,,而是可以簡單一點,直接去看人類語言中相關(guān)的詞匯即可,。 在100多年前,,心理學家們翻閱詞典,從里面找到了18000多個單詞描述人,,然后又從這當中找出4000多個詞用于描述人格,。 雖然這些詞好像很少,但實際操作起來還很復雜,。心理學家不想那么復雜,,于是他們通過一些因素分析的方法,找到以上那些詞匯的相關(guān)性,,再將之歸類,,歸到比較小的維度里。 現(xiàn)在比較流行的分類是「大五人格理論」,,即外向性,、隨和性,、神經(jīng)質(zhì)、盡責性和開放性。 心理學家整理的這些詞匯,,以及生成這樣的人格分類體系,,很多方法都是數(shù)據(jù)驅(qū)動的,,跟計算機科學有很多緊密的聯(lián)系,。我們最關(guān)注的一點就是,能不能自動計算用戶的大五人格呢,? 心理學里面有一種方法叫行為測量,。就是如果你每天抽出足夠長的時間觀察一個人,即便不問問題也能大概猜出他的性格,。但這需要大量行為數(shù)據(jù)做支撐,,在過去比較麻煩。 但現(xiàn)在這個事情比較容易了,,為什么呢,?因為有了社交網(wǎng)絡,大家會主動告訴別人自己在干嘛,。比如你今天來聽演講會發(fā)一條朋友圈,,這體現(xiàn)你某方面的特質(zhì);你去高大上的餐廳吃飯,,你發(fā)張照片秀一下,,這也會體現(xiàn)了你的特質(zhì)。 我們把所有用戶提供的數(shù)據(jù)結(jié)合起來,,就可以相對準確地去猜測,。我們提出了一個「人格推測模型」,,其特點就是去集成不同來源的用戶數(shù)據(jù),包括你發(fā)的文字,、圖片,、常用的表情符號,以及你填寫的個人資料等,。 你們可能會說,有了這個模型以后,,怎樣進行訓練呢,?其實還是要和心理學家合作,因為首先我們得標注這些用戶的行為特點和人格特征,,它們之間是否有映射或者聯(lián)系,。把這樣的映射輸入模型里面,我們才能訓練出一個好的模型,。 比如說我們可以計算你發(fā)表的文字和性格之間的關(guān)系,,得出文字和每個維度是正相關(guān)還是負相關(guān)。如果經(jīng)常在朋友圈里面寫「青春」「自我」的人可能比較外向,;經(jīng)常寫「面對」「失敗」的人就比較內(nèi)向,。 有些人經(jīng)常寫「時代」「社會」「成功」等非常正能量的詞匯,他們盡責性比較高,;一些寫「隨便」「萌萌」「氣質(zhì)」這些詞的人,,盡責性則比較低。 所謂盡責性是指他更在乎結(jié)果還是過程,,在乎結(jié)果的人就是盡責性比較高,,在乎過程的人則盡責性比較低。所有的這些人格都沒有好壞之分,。 大家可以看看自己發(fā)表的文字,,看你的朋友圈寫了一些什么呢?體現(xiàn)你什么樣的性格,? 我們還計算了頭像和大五人格的相關(guān)性,,比如內(nèi)向的用戶可能不太喜歡用正臉,更偏好用側(cè)臉,,或者看不清全臉的這種照片,;比較外向的用戶可能用很夸張的表情,或者卡通的照片,。 比較開放的用戶經(jīng)常會用一些合影或活動的照片,,開放性比較低的人可能經(jīng)常用自拍做頭像。所以大家可以看你的頭像是什么,,是不是暴露了你的性格,? 我們做了很多用戶理解和人格推測的工作,,但下一步呢? 我們真正的目標是想搭建一個更像人的機器人,。 去年,,有一個俄羅斯創(chuàng)業(yè)者的朋友去世了,他非常痛苦,,就在想那我怎么去悼念他,?他就收集了朋友的8000多條短信,用其訓練了一個機器學習的聊天模型,。你可以跟這個模型對話,,它可以用他朋友的話語方式來回應你,就好像這個人還活著一樣,。 我們需要和心理學家一起來合作,,讓機器人更逼真,更像人類,。那么,,做這樣的聊天機器人有什么用呢? 在未來我們希望聊天機器人能夠幫助解決實際的社會問題,,比如有很多農(nóng)村留守兒童,,他們的父母在外地打工,這些孩子非常孤獨,,我們是不是可以通過這樣的聊天機器人幫助他們緩解一些心理問題,,并陪伴他們呢? 我們希望讓機器人擁有像人類一樣的思維,,當人類需要的時候,,能夠真的幫助人類,去陪伴他們,。 |
|