剛從國家天文臺的老同學處聽來一個小道消息,說他們跟騰訊合作,,使用騰訊的人工智能算法和GPU算力,,提升了在FAST望遠鏡(中國天眼)數(shù)據(jù)中搜尋脈沖星的效率,并且已經(jīng)藉此發(fā)現(xiàn)了新的脈沖星,。 騰訊使用的具體方法目前還沒有公布,,具體發(fā)現(xiàn)的是什么樣的脈沖星也要等論文發(fā)了才知道,不過這不妨礙我們根據(jù)已經(jīng)歷年來已經(jīng)公開的材料,,做一番猜測,。 在此之前,我會先簡單回顧脈沖星研究的意義,,以及簡單介紹脈沖星的搜索方法,。如果對這些背景已經(jīng)有所了解,,就可以直接跳到第三部分,看看人工智能是如何應用在脈沖星搜索中的,。 脈沖星研究的意義脈沖星是1967年,,當時正在劍橋大學讀研究生的約瑟琳·貝爾女士發(fā)現(xiàn)的。雖然已經(jīng)過去了50多年,,脈沖星仍然是一個不斷給人驚喜的研究領域,。 它一被發(fā)現(xiàn),首先就證實了一個遙遠的猜測:1934年,,巴德和茲維基在中子剛剛發(fā)現(xiàn)兩年之際,,提出可能存在一種完全由中子構(gòu)成的天體——中子星。 而發(fā)出極短周期(通常小于1秒)脈沖的這種新天體,,提示我們它就是「中子星」這種此前僅僅是猜想的致密物體。 中子星的質(zhì)量比太陽還重,,而直徑只有十幾公里,。相當于在北京三環(huán)以內(nèi)集中了幾十萬個地球質(zhì)量,。于是一個首當其沖的問題就是,,這么致密的物質(zhì)組成的天體,其上物質(zhì)的狀態(tài)和性質(zhì)是怎樣的,? 這個問題的答案就藏在脈沖星的“心電圖”中,。長期監(jiān)測我們會發(fā)現(xiàn),隨著轉(zhuǎn)動能量的消耗,,脈沖星的自轉(zhuǎn)周期逐漸減慢,。但是偶爾,它的自轉(zhuǎn)會突然有一個小幅加速(“glitch”)——這種脈沖星“心率”的突變,,應當起源于脈沖星地質(zhì)結(jié)構(gòu)的突變,,也就是脈沖星上的“地震”。 就像地球物理學家可以通過地震波的傳播摸清地球核,、幔、殼的結(jié)構(gòu),,天文學家也可以通過監(jiān)測脈沖星上的地震,,研究極端致密物態(tài)組成的中子星的結(jié)構(gòu)。 除了glitch的時候以外,,脈沖星的周期非常穩(wěn)定,,堪比原子鐘。于是脈沖星研究的另一個用途,,是利用這種宇宙中天然存在的精密時鐘,,對廣義相對論進行驗證,。 天文學家對一對兒在1974年發(fā)現(xiàn)的毫秒脈沖星進行長期監(jiān)測,發(fā)現(xiàn)其相互繞轉(zhuǎn)周期加速的趨勢,,完全符合廣義相對論的預言——它們之間不斷相互接近,,正是由于兩個致密天體繞轉(zhuǎn)時攪動時空,發(fā)出引力波,,不斷帶走轉(zhuǎn)動能量,。這是人類第一次獲得引力波存在的間接證據(jù)。 將來,,脈沖星還將以另一種方式為引力波研究做出貢獻:當宇宙中某個地方發(fā)生雙黑洞并合之類的引力波事件,,引力波如海嘯般向外擴散、掃過若干脈沖星,,我們原則上可以通過監(jiān)測這些脈沖星的周期變化,,探知這次引力波事件的存在——這一方法,叫做“脈沖星計時陣列”,。 脈沖星陣列還有另一個用途:在未來的星際旅行中,,脈沖星可以充當“星際GPS”,為星際飛船提供導航所需的參考信號,。 脈沖星的搜索方法脈沖星用處很多,,但總要先找到它們,才談得上如何利用,。 對于早期發(fā)現(xiàn)的那些亮脈沖星,,它們輻射強度的周期性變化,用肉眼就能直接看出: 但對于大部分脈沖星而言,,單個脈沖的強度很弱,,幾乎完全埋沒在噪聲中,只有通過按照周期折疊,,讓噪聲彼此抵消,,才能增強信噪比,把脈沖形狀“露出來”,。 但是問題來了,,對于尚未發(fā)現(xiàn)的脈沖星,怎么知道它周期是多少,、又該按什么周期折疊呢,? 有一個辦法,就是傅立葉變換,。通過變換,,可以計算出數(shù)據(jù)有哪些周期性信號。 對于射電天文觀測,還有另外一個復雜性,。脈沖星跟我們之間,,可能充斥著非常復雜的電離態(tài)星云。 脈沖星的信號經(jīng)過這些星云時,,會跟其中的自由電子發(fā)生相互作用。不同頻段的信號受到的影響不同:比較低頻的,,會受到比較強的“阻滯”,,晚一些到達觀測者;比較高頻的,,會早一些到達觀測者,。 就像光通過棱鏡時,由于不同顏色的光在玻璃中光速不同,、折射率不同,,會產(chǎn)生的色散現(xiàn)象一樣,電磁波通過星際介質(zhì)時的這種效應,,也被稱作“色散”,。 對于未知的脈沖星,我們是無法預知其色散的,。我們只能大致估計出銀河系內(nèi)脈沖星的色散的數(shù)值范圍,,然后在這個范圍內(nèi)以一定間隔取值,,對數(shù)據(jù)進行“盲”消色散,。盲消色散之后的結(jié)果,才能進行傅立葉變換及按周期折疊,。 顯然,,在取值范圍內(nèi)眾多可能的色散中,正確的那個色散可以給出最好的信噪比,;而越離譜的盲猜值,,信噪比就越差: 使用脈沖星搜尋程序PRESTO,,我們可以對脈沖星巡天的原始數(shù)據(jù)進行盲消色散和折疊處理,,得到一系列(大量)這樣的脈沖星候選體分析圖表: 原則上觀察這樣的脈沖星候選體分析圖表,天文學家就可以判斷出一組信號是否來自脈沖星,;以及如果是脈沖星的話,,它的周期、色散量等各項參數(shù)是多少。 人工智能在脈沖星搜索中的應用下面問題來了,。PRESTO產(chǎn)生了一大堆這樣的圖,,天文學家就算再熟練,一秒看一張,,也看不過來呀,! 畢竟脈沖星巡天是FAST望遠鏡的重要任務之一,而FAST每天可以產(chǎn)生500TB的數(shù)據(jù),,算下來每周都會產(chǎn)生三千萬張脈沖星候選體的分析圖表,。 你想想如果你導師讓你這個小博士生一周看三千萬張圖,100個你不吃不喝啥也不干也看不過來呀,。 咋辦呢,?笨辦法,雇一幫熱愛科學的高中生代勞,,美名其曰公眾科學: 美國 Pulsar Search Collaboratory 項目就是這么干的,。 這樣做不是不行,順便搞搞中學生天文教育也是好事,。但人一多,,標準就不好把控。而且人眼的特征識別能力雖然強,,對于特別弱的信號,,仍然會有遺漏和誤判。 于是天文學家開始求助于人工智能,。 大而化之,,人工智能在脈沖星搜索中的應用又分兩種[1]: 一種,是天文學家先用PRESTO等軟件把脈沖星候選體的特征數(shù)據(jù)提取好,,諸如周期,、色散量、信噪比,,再如脈沖在整個周期中占的比例(占空比),、脈沖的數(shù)量和形狀、是否由于身處雙星系統(tǒng)而有周期性多普勒效應,,等等,。 接下來,把這些參數(shù)組合喂給神經(jīng)網(wǎng)絡:給機器提供一些已知脈沖星的參數(shù)進行深度學習,,然后用訓練好的模型去分析海量未知數(shù)據(jù),。 由于前一種方法中,提取參數(shù)這一步可能引入誤差,,還有一種更“懶惰”而有效的方法:直接把PRESTO產(chǎn)生的那幾張圖(前一節(jié)末圖中幾個紅框標記的)喂給AI,,讓AI自己進行畫面特征提取,。 這次跟國家天文臺中國天眼團隊合作的是騰訊優(yōu)圖實驗室,這是一個聚焦計算機視覺,、專注圖像處理的團隊,,因此我有理由相信,他們采用的是后一種方案,。 另外據(jù)本人獨家采訪參與該工作的研究人員,,騰訊云還提供了強大的GPU算力,有效加速了消色散和折疊過程,。面對FAST的海量數(shù)據(jù),,強大的算力顯然也是天文學家必不可少的重要工具。 在騰訊的AI算法和GPU算力加持下,,3000萬張圖,,只需要3天時間就可以分析完成,確保了FAST脈沖星巡天數(shù)據(jù)可以得到及時有效的處理,。 有這樣的工業(yè)界先進技術(shù)加持,,天文學家再也不怕數(shù)據(jù)處理不完啦。 參考
|
|