位于歐洲核子研究中心(CERN)的大型強子對撞機(LHC)是目前世界上最大的粒子加速器,在里面進行的實驗每秒產生大約一百萬吉字節(jié)(GB ,十億字節(jié))的數(shù)據(jù)。即使經過壓縮,LHC在一小時內積累的數(shù)據(jù)也與社交網(wǎng)站臉書整年收集的數(shù)據(jù)量相當。這么海量的數(shù)據(jù),給存儲和分析帶來了極大難題。幸運的是,粒子物理學家不必自己處理所有這些數(shù)據(jù)。他們與一種稱為機器學習的人工智能(AI )攜手合作,來處理這些數(shù)據(jù)。
來自美國能源部斯坦福直線加速器中心(SLAC)和費米國家加速器實驗室的科學家,在8月2
日發(fā)表于《自然》雜志的一篇文章中,總結了機器學習在粒子物理學領域的當前應用和未來前景。
該論文共同作者、美國威廉瑪麗學院的亞力山大·拉多維奇說:“機器學習算法自己知道如何進行各種分析,這有望為我們節(jié)省無數(shù)小時的設計和分析工作。” 拉多維奇目前正參與費米實驗室的NuMI離軸中微子實驗(NOVA)。
機器學習篩查大數(shù)據(jù)
機器學習已被證明在分析領域非常成功。為了處理像在LHC內進行的那些現(xiàn)代實驗中產生的海量數(shù)據(jù),研究人員應用所謂的“觸發(fā)器”—— 專用的硬件和軟件,它們能實時決定哪些數(shù)據(jù)可保存下來以供分析,哪些數(shù)據(jù)可以丟棄。
論文作者之一、麻省理工學院的邁克·威廉姆斯說,機器學習算法至少可由做出其中70%的決定。威廉姆斯目前正參與LHCb 實驗,該實驗可幫助科學家揭示為何宇宙中物質的數(shù)量遠遠多于反物質的數(shù)量。
LHC中巨大的超環(huán)面儀器(ATLAS)與緊湊渺子線圈(CMS )能發(fā)現(xiàn)希格斯玻色子,每個探測器都有數(shù)百萬個傳感元件,其信號需要放在一起才能獲得有意義的結果。 SLAC的邁克爾· 卡根說道:“這些信號組成了一個復雜的數(shù)據(jù)空間,我們需要了解它們之間的關系,得出結論,例如,探測器中某個粒子的軌跡是由電子、光子還是其他東西產生。 ”
中微子實驗也受益于機器學習。NOVA研究了中微子在穿越地球時如何從一種類型轉變?yōu)榱硪环N類型,這些中微子振蕩可能潛在地揭示一種新類型中微子的存在,一些理論認為,這種中微子是暗物質的粒子。 NOVA的探測器正在監(jiān)視中微子撞擊探測器材料時產生的帶電粒子,并且,機器學習算法可以識別它們。
咨詢熱線
0519-86051316