來(lái)自MIT News Office 作者:Rob Matheson 機(jī)器之心編譯出品 參與:楊超,,汪汪 每月都有數(shù)百萬(wàn)人通過(guò)網(wǎng)絡(luò)給出積極或者消極的醫(yī)療反饋。一些人會(huì)在論壇上抱怨無(wú)效的處方,,或者討論哪種藥的治療效果最好,;另外一些人則會(huì)在博客上描述自己的癥狀,以及減輕的方法,。 MIT 孵化的初創(chuàng)公司dMetrics 相信這種網(wǎng)絡(luò)聊天對(duì)于醫(yī)療行業(yè)來(lái)說(shuō)是信息寶藏,。「在醫(yī)療領(lǐng)域有一個(gè)非結(jié)構(gòu)化數(shù)據(jù)的巨大世界,,這些數(shù)據(jù)需要被翻譯成有用的信息,。」Paul Nemirovsky說(shuō),。他和 Ariadna Quattoni共同成立了dMetrics公司,。 這家初創(chuàng)公司開(kāi)發(fā)了一個(gè)平臺(tái)「DecisionEngine」,該平臺(tái)可以使用機(jī)器學(xué)習(xí)和自然語(yǔ)言處理(自然語(yǔ)言處理可以幫助電腦更好地理解人類對(duì)話)來(lái)挖掘數(shù)十億關(guān)于藥物,、醫(yī)療裝置和其他醫(yī)療產(chǎn)品的對(duì)話中的有價(jià)值的信息。這些討論出現(xiàn)在博客,、Facebook,、Twitter、論壇中,,甚至是新的文章或者視頻后的評(píng)論中,。 從這些大量的雜亂無(wú)章的數(shù)據(jù)中,軟件可以從中洞察消費(fèi)者的決策,。Nemirovsky 說(shuō),,「從這些對(duì)話中,,我們可以看到人們做了什么、沒(méi)有做什么,、想要做什么,、可能會(huì)做什么、在過(guò)去做了什么,,以及他們需要什么,、害怕什么、期待什么,?!?/p> Nemirovsky解釋說(shuō),,如今 dMetrics 具有一個(gè)數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)包含了與病人報(bào)告的疾病,、解決方案和結(jié)果相關(guān)的每一條公共評(píng)論,這些信息來(lái)自于數(shù)百萬(wàn)的網(wǎng)絡(luò)資源中,,涉及到了超過(guò) 14000 種醫(yī)療產(chǎn)品的信息,。 該公司的客戶(包括財(cái)富 500 強(qiáng)和非盈利組織)可使用 dMetrics 的軟件來(lái)回答一些具體的問(wèn)題,例如有多少病人,,出于什么特殊的原因,,在特定的時(shí)間內(nèi),使用一種具體的藥物,,或者哪些消費(fèi)者在考慮放棄該公司的藥物,,轉(zhuǎn)而使用競(jìng)爭(zhēng)對(duì)手生產(chǎn)的藥物。 盡管專注于醫(yī)療行業(yè),,dMetrics 公司(總部位于紐約布魯克林)也與金融和政治組織的消費(fèi)者一起測(cè)試這個(gè)平臺(tái),。例如,信用卡公司可以分析為什么消費(fèi)者會(huì)偏愛(ài)某一些信用卡,;政治學(xué)家可以使用這款軟件來(lái)分析人們關(guān)心的問(wèn)題,,以及人們對(duì)于自己觀點(diǎn)的堅(jiān)持程度。 「對(duì)于所有類型的問(wèn)題,,你不僅需要理解人們的用詞,,而且需要理解這些詞語(yǔ)背后的概念,」Nemirovsky 說(shuō),。 解讀語(yǔ)言和表達(dá) Nemirovsky 說(shuō),,其他軟件通常都依賴本體(正式命名和定義)來(lái)感知整體人氣和品牌知名度。例如,,軟件會(huì)統(tǒng)計(jì)某一個(gè)單詞(例如某一個(gè)具體藥物的名字)的提及次數(shù),,從而決定其是否重要,它也可以檢測(cè)「積極」詞匯或者「消極」詞匯,。 「但是語(yǔ)言和表達(dá)并不是這樣工作的,,作為人類,,我們要更加復(fù)雜一點(diǎn),」Nemirovsky 說(shuō),。 據(jù) Nemirovsky 介紹,,DecisionEngine 可以更好地提煉出文本中的含義,因?yàn)檫@款軟件(現(xiàn)在包含了大約 200 萬(wàn)行代碼)一直被訓(xùn)練用于識(shí)別不同的單詞和同義詞,、解釋語(yǔ)法和語(yǔ)義,。「在線文本的分析非常困難,,其中包含了俚語(yǔ),、拼寫錯(cuò)誤、Run-on sentences(指我們連接句子時(shí)沒(méi)有使用適當(dāng)?shù)臉?biāo)點(diǎn)符號(hào)來(lái)連接兩個(gè)或兩個(gè)以上的句子)和瘋狂的標(biāo)點(diǎn)符號(hào),。討論也都是雜亂無(wú)章的,。」 Nemirovsky 建議可以將這款軟件視為一個(gè)三級(jí)漏斗,,當(dāng)漏斗變得越來(lái)越窄時(shí),,分析就越精細(xì)。在漏斗的頂端,,該軟件會(huì)挖掘出與特定醫(yī)療產(chǎn)品相關(guān)的單詞或者短語(yǔ),,并找到所有提及的地方,同時(shí)過(guò)濾出其中的一些噪聲信息,,例如假冒的網(wǎng)站和用戶或垃圾郵件,。接下來(lái)的一級(jí)則涉及到將評(píng)論者的親身經(jīng)歷與市場(chǎng)推廣材料和新聞等信息相分離。最下面的一層則篩選出人們的決定和回應(yīng),,例如使用或打算使用產(chǎn)品,;經(jīng)歷了害怕或者困惑;轉(zhuǎn)而使用一種不同的藥物等,。 Nemirovsky 以網(wǎng)上論壇的評(píng)論為例進(jìn)一步解釋了這款軟件,,「例如,現(xiàn)在我在服用藥物 A,,同時(shí)也使用 10 毫克的藥物 B,,效果不錯(cuò)。明天我要去見(jiàn)我的醫(yī)生,,看能不能在我目前的藥物中加入藥物 C,。就我個(gè)人而言,藥物 A 脾氣非常古怪,,只有當(dāng)我有好的睡眠質(zhì)量、吃得好,、鍛煉好,,并且每周使用該藥物次數(shù)有限的情況下才對(duì)我有效果,。」 Nemirovsky 說(shuō),,其他的軟件也許僅僅檢測(cè)其中的積極和消極詞匯(例如「好」,、「不錯(cuò)」Vs.「古怪」、「有限」等),。而 DecisionEngine 卻可以識(shí)別更多的信息,,包括藥物 A 和藥物 B 的結(jié)合使用和效果;藥物 B 的用量,;對(duì)藥物 C 的考慮,;當(dāng)個(gè)人生活習(xí)慣(例如「好的睡眠質(zhì)量」)不同時(shí)藥物 A 的不同效果;評(píng)論者對(duì)三種藥物的同步使用,;對(duì)專業(yè)醫(yī)護(hù)人員的拜訪計(jì)劃等,。 這些關(guān)于信息的深入分析使得客戶能很快采取措施。例如,,如果消費(fèi)者打算換藥,,制藥公司希望了解換藥的原因是不是他們沒(méi)有正確使用藥物,并找到一種方式來(lái)解決這個(gè)問(wèn)題,。 Nemirovsky 說(shuō),,最近,一家制藥公司使用 DecisionEngine 來(lái)確定一種抗過(guò)敏藥是否可以改善一小組病人的生活質(zhì)量,。通過(guò)分析這些病人的具體問(wèn)題,,該公司發(fā)現(xiàn)該藥物具有非常理想的積極效果,且效果遠(yuǎn)超其他幾家競(jìng)爭(zhēng)公司的產(chǎn)品,。該公司在監(jiān)管提交階段(這是任何醫(yī)療產(chǎn)品進(jìn)入市場(chǎng)的重要步驟)使用了這些研究結(jié)果,。「監(jiān)管部門在審批中考慮在線病人報(bào)告是很罕見(jiàn)的現(xiàn)象,,」Nemirovsky 說(shuō),。 人人都是專家 在 2000 年代后期的MIT,Nemirovsky(當(dāng)時(shí)還是 MIT 媒體實(shí)驗(yàn)室研究生)和 Quattoni(當(dāng)時(shí)正在計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室學(xué)習(xí))因?yàn)楣餐倪h(yuǎn)大目標(biāo)走到了一起:通過(guò)大數(shù)據(jù)讓每個(gè)人都成為專家,。 他們當(dāng)時(shí)的計(jì)劃是將機(jī)器學(xué)習(xí)和自然語(yǔ)言處理結(jié)合起來(lái),,從而翻越非結(jié)構(gòu)化數(shù)據(jù)這座大山,將相關(guān)信息提供給任何想要這些信息的人,?!溉绻隳軌蛟谡_的時(shí)間為人們提供正確的信息,那么任何人都可以成為專家,?!筃emirovsky 說(shuō)。 在開(kāi)發(fā)這款軟件的過(guò)程中,,他們發(fā)現(xiàn)醫(yī)療對(duì)大多數(shù)人的日常生活是一個(gè)非常重要的話題,?!妇歪t(yī)的病人情況非常復(fù)雜,有時(shí)病人拜訪醫(yī)生之后,,可能更加不確定自身的情況,。然后他們就會(huì)上網(wǎng)發(fā)聲,我到底怎么回事,?我應(yīng)該怎么辦,?」 因此他們決定將研究重心集中在醫(yī)療行業(yè),并向 MIT 創(chuàng)業(yè)指導(dǎo)服務(wù)中心(VMS)求助,。MIT 創(chuàng)業(yè)指導(dǎo)服務(wù)中心為他們指明了一些創(chuàng)業(yè)公司需要解決的問(wèn)題:籌資,、運(yùn)營(yíng)、市場(chǎng)營(yíng)銷,、法律問(wèn)題以及其他相關(guān)問(wèn)題,。「一些現(xiàn)在看起來(lái)非常明顯的問(wèn)題,,對(duì)于那時(shí)的我們來(lái)說(shuō)真是一點(diǎn)都不明顯,。VMS 幫助了我們很多,尤其是第一次創(chuàng)業(yè)的時(shí)候,?!筃emirovsky 說(shuō)。 Nemirovsky 畢業(yè)后不久,,他和 Quattoni 便在波士頓創(chuàng)立了 dMetrics 公司,,之后才將公司搬到了布魯克林。經(jīng)過(guò)多年的打拼,,該初創(chuàng)公司的雇員從兩人發(fā)展到了 16 人(其機(jī)器學(xué)習(xí)和自然語(yǔ)言處理的研究已經(jīng)被學(xué)術(shù)期刊引用超過(guò) 4500 次),,并且獲得了四項(xiàng)美國(guó)國(guó)家科學(xué)基金會(huì)的資助,用于繼續(xù)開(kāi)發(fā)技術(shù),。 dMetrics 接下來(lái)的目標(biāo)將其軟件應(yīng)用到醫(yī)療,、政治和消費(fèi)金融領(lǐng)域之外的更多領(lǐng)域,旨在讓這些數(shù)據(jù)可以幫助到每一個(gè)人,。Nemirovsky 說(shuō),,dMetrics 的目標(biāo)與早期在 MIT 時(shí)的目標(biāo)并沒(méi)有太大差異,「我們的愿景是讓每一個(gè)人都可以自由獲取專業(yè)知識(shí),?!?/p> 本文由機(jī)器之心原創(chuàng)編譯,轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán),。 ------------------------------------------------ 機(jī)器之心是Comet Labs旗下的前沿科技媒體,。Comet Labs是由聯(lián)想之星發(fā)起、獨(dú)立運(yùn)作的全球人工智能和智能機(jī)器加速投資平臺(tái),攜手全球領(lǐng)先的產(chǎn)業(yè)公司和投資機(jī)構(gòu),,幫助創(chuàng)業(yè)者解決產(chǎn)業(yè)對(duì)接,、用戶拓展、全球市場(chǎng),、技術(shù)整合、資金等關(guān)鍵問(wèn)題,。旗下業(yè)務(wù)還包括:Comet舊金山加速器,、Comet北京加速器、Comet垂直行業(yè)加速器,。 加入機(jī)器之心(全職記者/實(shí)習(xí)生):[email protected] 投稿或?qū)で髨?bào)道:[email protected] 廣告&商務(wù)合作:[email protected] ↓↓↓點(diǎn)擊「閱讀原文」查看機(jī)器之心網(wǎng)站,,獲取更多精彩內(nèi)容。 |
|
來(lái)自: richard_168 > 《待分類》