久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

微軟發(fā)布智能化知識圖譜,,助力計算機掌握“常識”

 luxb696 2016-12-11


撰文
微軟研究院

當我們在討論人工智能時,請注意,,我們通常在討論弱人工智能,。

雖然我們現(xiàn)有的資源與之前可謂不同日而語——部署在云端的海量計算資源已經(jīng)像水和電一樣唾手可得了;互聯(lián)網(wǎng)所容納的信息也遠遠超過了過去幾千年來人們所有的知識儲備,;以深度學習等為代表的機器學習算法的發(fā)展,,也讓計算機能夠從這些龐大的數(shù)據(jù)中獲取知識。

但是我們也不得不正視一些事實,,當前的人工智能更多的是針對某個具體的問題,,發(fā)展對應的算法和技術(shù),有人稱之為“拼圖式”的工作方法:我們做出了視覺模塊,、再拼上語音模塊,、推理模塊——把每個子領(lǐng)域的功能做好,然后再組合出一個完整的智能系統(tǒng)出來,。

微軟一直在為這份屬于全人類的人工智能大拼圖貢獻力量,。從底層的可編程芯片F(xiàn)PGA,到Azure云平臺的部署,從微軟認知工具包(Microsoft Cognitive Toolkit),,到應用層面的能供每一個沒有人工智能背景也能開發(fā)出屬于自己的智能應用的微軟認知服務……隨著人工智能拼圖不斷趨于完整,,科學家們始終會問自己:計算機真的能像人類一樣智能了嗎?

昨日,,微軟亞洲研究院正式發(fā)布Microsoft Concept Graph知識圖譜 和Microsoft Concept Tagging 模型,,用于幫助機器更好地理解人類交流并且進行語義計算。Microsoft Concept Graph是一個大型的知識圖譜系統(tǒng),。其包含的知識來自于數(shù)以億計的網(wǎng)頁和數(shù)年積累的搜索日志,,可以為機器提供文本理解的常識性知識。



Apple是什么

10月初,,你的微博,、微信可能都被一首叫《PPAP》的神曲占領(lǐng)了。什么,,你還沒聽過,?那讓我們先來看看這首曲子:

這首歌是有日本諧星古坂和仁(PIKO太郎)于8月25日發(fā)布在YouTube上的,一開在日本小范圍內(nèi)炒紅,;后來由新媒體9GAG發(fā)布,,其瀏覽數(shù)據(jù)立馬飆升。9月25日,,9GAG在Facebook上傳了PPAP,,被大V轉(zhuǎn)發(fā)以后,迅速火起來,。目前,,這個視頻的播放量已經(jīng)過億,并且榮登美國公告牌單曲榜Hot 100,。能登陸Hot 100是個什么概念呢,?對于亞洲歌曲上榜歷史數(shù)據(jù)來說,最近的一次,,是2012年鳥叔的 《江南Style》蟬聯(lián)了7周亞軍的位置,。

這首魔性的神曲的歌詞非常簡單易學:“I have a pen. I have an apple. Apple-pen!”

小編為什么要把這個魔性的神曲分享給大家呢?下面問題來了:當PIKO太郎說出“I have an apple.”時,,你第一反應這個“apple”是一種水果,,還是一家公司?

你也許會意識到,,很多時候幫助你做出判斷的并不是一些能夠清晰列在書本的知識,,而是大量常識性的概念。例如“筆是一種寫字的工具”,、 “筆是豎直形的可以捏在手里”,、“蘋果是一種水果或一家公司”等等概念,都有助于我們對歌詞的判斷和理解。

當下,,計算機究竟有多智能了,?它可能能輕而易舉的戰(zhàn)勝一個三四十歲經(jīng)驗豐富的世界頂尖棋手,,但是它的學習能力以及完成一般任務的能力可能都遠不及一個三四歲的孩童,。研究員們從人類的學習成長過程開始入手,試圖找到逐步實現(xiàn)機器智能的解決方法,。

這個問題的答案可能是“常識”——理解是萬物的基礎(chǔ),。人們在正式上小學、初中接受系統(tǒng)性教育開始,,已經(jīng)早早地開始了學習的過程,。這種與生俱來的本能能讓你進入小學之前已經(jīng)了解諸如“糖是甜的食品”、“水是一種液體”這一類基礎(chǔ)的概念,,并且隨著年齡的增長,,這種并不屬于某個專業(yè)領(lǐng)域的開放性常識也在人們的認知中日積月累,并不斷豐富,。

微軟亞洲研究院昨日發(fā)布的Microsoft Concept Graph就在試圖讓計算機復制這些常識性概念,,其核心知識庫包含了超過540萬條概念。除了包含一些被絕大部分通用知識庫包含的概念,,例如“城市”,、“音樂家”等,Microsoft Concept Graph還包含數(shù)百萬長尾概念,,例如“抗帕金森治療”,、“名人婚紗設(shè)計師”、“基礎(chǔ)的水彩技巧”等,,而這些概念在其他的數(shù)據(jù)庫中很難被找到,。除了概念,Microsoft Concept Graph同樣包含了大量數(shù)據(jù)空間(每條知識概念都包含一系列的實體或者子概念,,例如“太陽系”底下可能就會包括“水星”,、“火星”、“地球”等等),。


Apple是甜的

當你看到“Apple是甜的”這句話時,,你幾乎可以肯定這里的“Apple”指的是我們最常見的那種水果。在這幾毫秒的時間里,,你觸發(fā)的是“根據(jù)上下文語境確定語義”這一技能,。微軟亞洲研究院的研究員們同樣也為計算機點亮了這棵技能樹。

Microsoft Concept Tagging模型可以將文本詞條實體映射到不同的語義概念,,并根據(jù)實體文本內(nèi)容被標記上相應的概率標簽,。例如“微軟”這個詞可以被自動映射到“軟件公司”和“科技巨頭”等概念,并帶有相應的概率標簽。這個模型讓計算機擁有常識性的計算能力,,讓機器“了解”人類的意識,,從而讓機器可以更好地理解人類的文本交流。具體來說,,概念模型根據(jù)人類的概念推理將實體或者短語映射到大量自動習得的概念空間(向量空間),。這種映射關(guān)系是人類和機器都可以理解的。因此該模型提供了文本理解所需的文本概念映射,、短語語義化理解等功能,。


Microsoft Concept Tagging模型區(qū)別于以往常見的文本推理模型的根本區(qū)別是他是基于網(wǎng)絡之上的一個推理模型,將文本映射到一個顯式的知識空間,,將文本概念化,。以搜索引擎為例,絕大多數(shù)的用戶的查詢詞數(shù)量是很少的,,搜索引擎在返回結(jié)果時需要將查詢詞進行額外的信息化,,將很短的文本映射到大量的概念空間里面,從而解釋了這一段文本,。傳統(tǒng)的模型對于文本的推理幾乎不可解釋,,而Microsoft Concept Tagging模型用不同的概念去描述一個詞,并給出對應的概率,,使機器能夠更好地理解文本,,另一方面可計算的顯性詞向量也體現(xiàn)了我們?nèi)祟愔悄芘c人工智能相結(jié)合的理念(HI AI,human in the loop),。例如社交網(wǎng)絡的設(shè)置中,,工程師可能會人為設(shè)置一些關(guān)鍵字去屏蔽一些不當言論,但是并不是每一個敏感詞工程師都能準確找到,。例如工程師屏蔽了“希特勒”,、“納粹”,卻忽略了“法西斯”,,現(xiàn)在Microsoft Concept Tagging模型就能對已有的概念進行延展,,在系統(tǒng)中找到其他類似的相關(guān)性很大的關(guān)鍵字,做更多智能的擴展,。

理解是萬事萬物的基礎(chǔ)

“我們想做的,,是讓計算機能夠更好地理解人類?!爆F(xiàn)負責Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的微軟亞洲研究院資深研究經(jīng)理閆峻博士說,,“理解是萬事萬物的基礎(chǔ),我們用計算機抓取過去這些不成文的開放領(lǐng)域的常識,,能夠幫助計算機更具象地了解這個世界,?!?nbsp;


(從左至右)為微軟亞洲研究院研究員紀蕾,資深研究經(jīng)理閆峻,,研究員張大衛(wèi)

對于這類知識圖譜,,學術(shù)界和工業(yè)界都有參與,但始終離不開一些根本問題:如何去獲取實體,、實體和實體之間的屬性和關(guān)聯(lián),。在過去,知識庫系統(tǒng)和人類的思考方式差異巨大,。例如“奧巴馬生日”,,過去計算機能理解這個詞的含義,但是卻不能直接給你回答,,而此次微軟開放的Microsoft Concept Graph 和 Microsoft Concept Tagging模型就希望能為人們提供一個更智能化知識圖譜,借助它,,從實體到抽象概念,,計算機都能夠理解。


談及Microsoft Concept Graph 和 Microsoft Concept Tagging模型的下一步計劃,,閆峻博士表示目前該模型暫只能支持英文,,還要和高校合作完成中文的支持工作。在完成中文的知識庫構(gòu)建之后,,再逐步擴展到多語言版本,。其次,人類的語言還涉及到比喻,、夸張和玩笑等高層次跨領(lǐng)域的抽象表達方法,,這也是接下來需要讓機器不斷學習的方向。最后,,從短文本的理解到長文本的理解,,如理解兩個完全不同的故事,但語義層面在表達同樣的道理,,也是他們接下來不斷努力的方向,。

Microsoft Concept Graph 和 Microsoft Concept Tagging模型可以應用于不同的文本處理應用,包括搜索引擎,、自動問答系統(tǒng),、在線廣告系統(tǒng)、推薦引擎,、聊天機器人,、以及人工智能系統(tǒng)等。目前這個模型已經(jīng)進入了微軟的多個產(chǎn)品和服務中,。微軟亞洲研究院高級研究經(jīng)理閆峻博士表示:“我們希望Microsoft Concept Graph和Microsoft Concept Tagging模型的發(fā)布可以推動知識挖掘,、自然語言處理等領(lǐng)域的發(fā)展,,最終推動人工智能的進步?!?/span>

本文經(jīng)微信公眾號“微軟研究院AI頭條”授權(quán)轉(zhuǎn)載,。

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,,謹防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多