S2W와 KAIST 연구진이 공동 개발한 AI 언어 모델인 ‘다크버트(DarkBERT)’가 세계적인 주목을 받고 있다.
다크웹상에서 각종 범죄 데이터를 효과적으로 추출할 수 있도록 훈련한 다크웹 전문 언어 모델 다크버트는 지난 5월 4일 세계적인 자연어처리 학술대회 ACL (Association for Computational Linguistics)에 연구 성과가 채택되고 논문이 공개된 이후 그 출현 소식이 트위터와 IT 미디어를 통해서 전 세계로 빠르게 확산되고 있다.
이번 연구를 주도한 카이스트와 에스투더블유(S2W)사 연구진에 따르면 “다크웹을 학습시킨 AI 모델은 전 세계적으로 처음이다”라며 “다크웹과 같은 신종 사이버 위협에 대한 효과적은 대응력을 전 세계의 기관과 기업에 보급할 수 있는 계기가 마련된 것이라 기대감이 높다”고 말했다.
미국의 유명 IT 전문지 Tom’s Hardware는 “다크웹용 ChatGPT의 출현”라는 기사로 비중 있게 다루었고, 영국의 HackRead는 “다크버트: 다크웹에 대한 현저한 보안 강화책”, 일본의 IT Media는 “한국 연구진이 개발한 대규모 다크웹 언어모델, 다크버트”로 소개하며 주목하고 있다.
소셜미디어 상에서의 관심도 뜨겁다. S2W에 따르면 다크버트는 트위터에서 지금까지 27개국에서 100만 조회수를 기록하고 있으며, 구글社의 CISO Phil Venables가 다크버트의 출현에 대해 언급하는 등 AI 분야와 사이버 보안분야 양쪽에서 모두 높은 관심을 받고 있다.
다크웹은 마약, 정보 유출, 랜섬웨어, 해킹 등 최근 급증하는 사이버범죄들의 온상이 되고 있는 익명 기반의 네트워크다. 각종 불법거래와 유해 콘텐츠들로 가득하지만 빠르게 사라지는 휘발성과 탈중앙화 기술로 보호되고 있어서 정확한 출처나 증거가 되는 데이터를 얻기가 매우 어렵다. 일반적인 인터넷 브라우저로는 접속이 안되고, 추적이 불가능한 익명화 기술이 적용되어 있어 많은 수사기관을 물론 기업들이 실체를 파악하는 데 어려움을 겪어 소위 ‘어둠의 네트워크’라고 불린다.
OpenAI사의 챗GPT 및 구글의 Bard 등 다양한 생성형 언어모델의 출시는 최근 뜨거워진 빅 테크 기업 간 AI를 둘러싼 경쟁상황을 잘 설명해 준다. 빠르게 발전하는 AI 기술의 발전만큼 그에 대한 우려도 덩달아 증폭되고 있다. 챗GPT를 이용한 악성코드 제작법이 시연되기도 하고, AI를 활용한 공격 방안들이 다크웹 내에 공유되는 사례도 있었다.
S2W에 따르면 다크버트는 다크웹의 문제점을 해결하는 것에 있어서 ▲다크웹상의 범죄/위협 활동에 대한 정확한 분류 ▲랜섬웨어 및 정보유출 사이트에 대한 탐지 ▲사이버 안보나 범죄에 대한 중요한 위협활동 모니터링 및 탐지 ▲범죄자와 해커들이 사용하는 은어와 신조어에 대한 높은 이해력과 추론 등의 영역에서 활용될 수 있다는 것이다.
다크버트 논문 교신저자 KAIST 신승원 교수은 “다크버트는 다크웹 약 6백만 페이지(2.2TB, 테라바이트)이상에 달하는 정보를 학습하였으며, 사이버 위협 시나리오별 테스트를 통해 유출된 정보를 효과적으로 탐지하고 식별하는 훈련을 수행하였기 때문에 정확성과 신뢰성이 핵심인 보안 분야에서 사용이 가능한 AI 모델이다”이라 밝혔다.
국제적으로 사이버 범죄의 온상인 다크웹에 대한 전용 AI 모델인 다크버트가 전 세계의 이목을 끌고 있는 것도 사이버보안에 대한 AI 경쟁력이 곧 사이버 안보와 맞닿아 있기 때문이다.
2023년을 기점으로 한층 더 강력해진 사이버 보안에 대한 미국 정부의 노선을 중심으로, 향후 정부와 민간기업 간 사이버 보안 전력과 관련된 협력 사례가 많이 증가하였다. 실제로 2022년 11월 국가정보원, 과학기술부, 국방부 등이 포함된 정부기관과 S2W를 포함한 5개 민간 보안 기업이 최초로 함께 사이버 위협 통합 대응을 위한 민관 합동 협력 센터인 ‘국가 사이버 안보 협력센터’가 개설하였다.
S2W 서상덕 대표는 “다크버트는 국경의 경계가 없는 무수히 넓은 위협 공간에서 공격자의 행동을 꼼꼼히 살펴보며 수사와 분석을 돕는 인공지능이다. 이를 위해서는 사이버 범죄에 사용되는 언어를 잘 학습하고 이해하는 것이 기본이다”라고 말하며, “다크버트는 가장 어두운 곳의 정보를 다루지만 밝고 안전한 세계를 지키는 일에 지금까지 출시된 어떤 AI 언어 모델보다 의미 있는 기여를 하게 될 것”이라고 강조했다.
피엔에프뉴스 pnfnews@pnfnews.com