?你曉得一億有多大嗎?科學家開發了一種名為的強大新計算機程序,即人工智能AI算法,該程序可以挨個象素地剖析天文圖象數據,以辨識和分類來自天文觀測大量數據集中的所有星體和星體。是一個深度學習框架,融合了為圖象和語音辨識等應用開發的各類人工智能技術。加洲學院圣克魯斯學校估算天體化學研究小組負責人、天文學和天體化學學院士布蘭特·羅伯遜(Brant)表示:
天文學數據集的快速下降,致使手動化一些傳統上由天文學家完成的任務顯得至關重要。有些事情我們人類根本做不到,所以必須想辦法借助計算機來處理未來幾年將從小型天文觀測項目中獲得的海量數據。羅伯遜與瑞安·豪森(Ryan)合作,前者是加洲學院巴斯金工程大學的計算機科學研究生,在過去五年里開發并測試了。其研究結果現已發表在《天體化學學》期刊上,豪森和羅伯遜也公開發布了代碼。
星體的形態,從像我們銀河系這樣的旋轉盤狀星體,到無定形的橢圓形星體,都可以告訴天文學家星體是怎樣隨著時間推移而產生和演變的。大規模的觀測天體物理專業代碼,比如將在澳大利亞正在建設的維拉·魯賓天文臺進行的遺產時空觀測(LSST),將形成大量的圖象數據,羅伯遜早已參與了怎樣借助那些數據來理解星體產生和演變的規劃。LSST將使用32億象素的單反,每天拍攝800多張全景圖象,每周兩次記錄整個可見天空。

想像一下天體物理專業代碼,假如你去找幾個天文學家,要求她們對數十億個天體進行分類,她們如何可能做到這一點?現今新研究將才能手動對這種天體進行分類,并借助這種信息來了解星體的演進。其他天文學家早已使用深度學習技術對星體進行分類,但之前的努力一般涉及更改現有圖象辨識算法,研究人員向算法提供要分類星體的精選圖象,所以研究人員專門為天文圖象數據從頭開始建造了,該模型使用天文學家使用的標準數字文件格式的原始圖象數據作為輸入。
象素級分類是的另一個重要優勢,對于其他模型,你必須曉得哪里有哪些東西,并向模型提供一張圖象,它會立刻對整個數據集的星體進行分類。會為你發覺星體,并挨個象素地處理,所以它可以處理十分復雜的圖象,你可能會在圓盤后面聽到一個圓球。對于有中心隆起的圓盤,它會單獨對隆起進行分類,所以它的功能十分強悍。為了訓練深度學習算法,研究人員使用了2015年一項研究中的信息,在那項研究中,數十名天文學家對來自項目哈勃太空望遠鏡圖象中大概1萬個星體進行了分類。

之后,將應用于來自哈勃遺留領域的圖象數據,這種數據結合了幾次哈勃深場觀測所獲得的觀測結果。當處理一張天空區域的圖象時,它會生成一組新的天空部份圖象,其中所有對象都按照它們的形態進行顏色編碼,將天文對象與背景分開,并辨識點源(星體)和不同類型的星體。輸出包括每位分類的置信度級別。該程序在加洲學院紐約校區的lux超級計算機上運行,可以快速生成對整個數據集的挨個象素剖析。
博科園|研究/來自:加利福尼亞學院圣塔克魯茲中學
研究發表刊物《天體化學學》
博科園|科學、科技、科研、科普
