인공지능의 알고리즘을 이용한 거대하드론 가속기
인공지능의 알고리즘을 이용한 거대하드론 가속기
  • 김수아 기자
  • 승인 2015.12.04 22:49
  • 댓글 0
이 기사를 공유합니다

차세대 입자충돌실험은 만일 입자물리학자와 인공지능연구자들이 결합하게 된다면 세계에서 가장 발전된 생각하는 기계의 특징이 될 것이다. 이러한 기계는 인간이 많은 노력을 하지 않고도 많은 발견을 하게 될 것이다. 

발견을 위한 욕망과 10년이 지나도 관리할 수 없는 정도의 엄청난 데이터를 갖고 있다는 사실로 인해서 스위스의 제네바 근처의 거대하드론가속기(LHC)에서 연구하는 물리학자들은 인공지능전문가들의 도움을 필요로 하고 있다. 지난 11월 9일에서 13일 사이에 이 두 학계의 연구자들이 워크숍에 참여해서 어떻게 발달된 인공지능기술이 LHC의 발견을 빠르게 수행할 수 있는 방법에 대해서 논의했다. 입자 물리학자들은 “우리들 혼자서 할 수 없다는 것을 알게 되었다”고 CERN의 입자물리학 연구소에서 개최한 워크숍에 참석한 파리 남부대학 (University of Paris South)의 컴퓨터 과학자인 세실 제르망 (Cécile Germain)은 말했다. 

컴퓨터 과학자들은 이러한 움직임에 대해서 대응하기로 했다. 지난해에 제르망은 시뮬레이션 데이터센트에서 힉스 보손(Higgs boson)의 흔적을 ‘발견할 수 있는’ 프로그램을 작성하는 경선을 조직하는데 도움을 주었다. 이 경서에 1700여 개 이상의 연구팀이 지원했다. 입자 물리학자들은 이미 AI분야를 친숙하게 생각하고 있다.

특히 LHC의 두 개의 대규모 실험인 ATLAS와 CMS가 2012년에 힉스 보손을 발견할 때 데이터의 패턴을 인식하도록 하는 알고리즘을 훈련시키도록 하는 일종의 AI의 한 형태인 기계학습을 이용하여 이 연구에 참여했다. 알고리즘은 입자충돌로부터 나타난 파편의 시뮬레이션을 이용하여 좀 더 일상적인 수백만 개의 현상 중에서 희귀한 힉스 입자의 붕괴를 만들어내는 패턴을 찾아내도록 학습되었다. 그리고 실제 물체에서 작동하도록 했다. 

하지만 가까운 미래에 이 실험은 데이터 수집에 있어서 좀 더 스마트해질 것이다. CMS와 ATLAS는 각각 매초에 수백만 개의 충돌을 만들어낸다. 그리고 1000개의 현상 중에서 한 개만을 찾아내고 나머지는 무시하는 기준을 이용한다. 2025년에 업그레이드를 통해서 그 숫자는 20배 증가하게 될 것이고 측정기는 어떤 것을 선택하게 될지 결정하는 좀 더 복잡한 방법을 사용하게 될 것이라고 이번 CERN 워크숍을 조직하는데 도움을 준 캘리포니아 공대 (CalTech)의 CMS 물리학자인 마리아 스피로풀루 (Maria Spiropulu)는 말했다. 그녀는 “우리는 미지의 영역에 들어가고 있다”고 말했다. 

이러한 협력연구의 실마리는 다른 LHC 실험에서 비롯되었다. LHCb는 입자와 반물질 사이의 미세한 비대칭을 연구하는 것이다. LHCb실험팀은 어떤 데이터를 선택해서 유지할지를 결정하는 기계학습을 이용하여 측정기의 프로그램을 만들었다. LHCb는 온도와 압력의 미세한 흔들림에 민감하다. 그래서 어떤 데이터가 흥미로운 것인가를 결정해야 한다. 기계학습은 실시간으로 적용될 것이다. 이번 AI 프로젝트를 이끌고 있는 CERN의 LHCb 물리학자인 블라디미어 글리고로프(Vladimir Gligorov)는 “이러한 것을 아마도 시도한 적이 없다”고 말했다.

입자물리학 실험은 보통 업그레이드 이후 적합하게 조정을 위해서 몇 달의 시간을 보낸다고 글리고로프는 말했다. 하지만 에너지 업그레이드 이후 2주 이후 측정기는 1974년에 두 개의 연구팀이 각각 발견했던 J/Ψ meson이라는 입자를 재발견했다. 당시에 이 입자의 발견은 노벨상 감이라고 평가되었다. 앞으로 CMS와 ATLAS는 LHCb의 경험을 따를 것이라고 스피로풀루와 다른 연구자들은 주장했다. 그리고 이 측정기 알고리즘은 실시간으로 작동하게 될 것이다. 스피로풀루는 “어떻게 데이터를 분석할지에 대해서 혁명적인 변화가 일어날 것”이라고 말했다. 

AI에 대한 의존도 증가는 새로운 문제를 일으킬 수 있다. 대부분 알려진 입자를 발견하는데 집중해서 세부적인 연구가 가능했던 LHCb와는 다르게 ATLAS와 CMS는 새로운 입자 발견을 위해서 마련된 실험이다. 데이터를 버린다는 아이디어는 원칙적으로 엄청난 발견의 가능성을 가지고 있으며 비투명성 알고리즘에 의한 기준은 많은 물리학자들을 불안하게 만들 것이라고 제르망은 말했다. 연구자들은 어떻게 이 알고리즘이 작동하는지 그리고 이들이 물리학적 원칙에 의거한 것인지를 알고자 한다라고 그녀는 말했다. 그녀는 “이것은 물리학자들에게는 악몽”이라고 말했다. 

이러한 접근법을 찬성하는 사람들은 또한 시도와 테스트의 기술을 버리라고 주장한다고 글리고로프는 말했다. 그는 “이것은 엄청난 협력이다. 그래서 새로운 방법에 대한 허가를 얻음으로써 새로운 시대를 여는 것이 될 것”이라고 말했다. LHCb는 1000명의 구성원을 가지고 있으며 ATLAS와 CMS는 3000명씩 연구자들로 이루어져 있다. 

이러한 문제에도 불구하고 이 워크숍에서 가장 문제가 된 이슈는 입자물리학이 심지어 좀 더 복잡한 AI를 이용해야 하면 어떻게 이용해야 하는가에 대한 것이다. 특히 복잡한 형태의 딥러닝(deep learning)이라는 형태의 기술이다. 기초적인 기계학습 알고리즘은 이미지와 같은 샘플 데이터를 가지고 훈련하는 것으로 각 그림이 보여주는 것이 무엇인지를 ‘말해주는 것’이다. 하지만 구글 해석기나 애플의 보이스 인식기술인 시리와 같은 소프트웨어에서 사용되는 딥러닝에서 컴퓨터는 이러한 감독을 받지 않는다. 그리고 대상물체를 자체적으로 분류한다. 

비록 이들은 이러한 수준의 통제를 편안하게 생각하지 않지만 CERN의 워크숍에서 몇몇 참여자들은 어떻게 딥러닝을 물리학에 적용할 것인가를 논의했다. 캘리포니아 주립대학 어바인 (UC Irvine)의 AI 연구자인 피에르 발디(Pierre Baldi)는 기계학습을 다양한 과학분야에 적용해서 협력연구자들이 어떻게 연구를 진행할 것인가를 설명하면서 딥러닝기술은 암흑물질을 찾는데 사용할 수 있는 암흑지식으로 알려져 있다고 말했다. 딥러닝은 이론물리학자들이 아직 예측하지 못한 임자를 발견을 하는데 도움을 줄 수 있을 것이라고 이번 워크숍을 주최한 CERN의 물리학자인 마우리치오 피에리니(Maurizio Pierini)는 말했다. 그는 “이것은 일종의 보험으로 이론물리학자들의 정확한 예측이 아직 이루어지지 않은 경우에 대한 보험”이라고 말했다. 

출처: KISTI 미리안 『글로벌동향브리핑』<네이처> 2015년 12월 1
Nature 528, 18–19 (03 December 2015) doi:10.1038/528018a
원문출처:http://www.nature.com/news/artificial-intelligence-called-in-to-tackle-lhc-data-deluge-1.18922
 

 

Tag
#N

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.