1천500억개 매개변수 가진 거대 언어 모델로, 다양한 산업 분야 활용 가능
국립국어원, SKT AI 언어 모델 활용한 '국어 정보 처리 경진대회' 개최 예정
AI스피커 '누구'를 비롯해 우리말을 통한 음성명령이 가능한 장치들의 음성인식 능력이 앞으로는 크게 개선될 것으로 보인다. 영어에 비해 우리말을 이용한 음성인식 및 명령은 그동안 뒤쳐져있었던 것이 사실이다.
SK텔레콤이 7일 국립국어원과 업무 협약을 체결하고, 국립국어원의 언어 정보를 활용해 한국어에 최적화된 차세대 인공지능(AI) 언어 모델을 개발하기로 했다고 밝혔다.
차세대 AI 한국어 모델은 사람의 능력 수준으로 평가되는 GPT-3와 유사한 성능을 발휘하는 한국어 범용 언어 모델(이하 GLM, General-Purpose Language Model)로, 언어 관련 문제풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3의 기능을 한국어에서도 구현할 수 있게 된다.
GPT-3는 Open AI가 개발한 영어 기반의 최신 AI 언어 모델로, 기존 GPT-2보다 자연스러운 언어 표현이 가능하고 범용적 사용이 가능하다.
GLM은 일상의 감성대화, 다양한 업종의 고객센터 대화 뿐 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있으며, 이를 기반으로 새로운 산업 분야에 추가 활용될 수 있을 것으로 기대된다는게 SKT의 설명이다.
SKT가 개발하는 GLM은 1천500억개의 매개변수를 가진 거대 언어 모델로 개발될 예정으로, 1천750억개의 매개변수를 가진 GPT-3를 기반으로 개발되는 만큼 GLM은 한국어 AI 언어 모델의 결정판이 될 것으로 예상된다.
SKT는 올해 말까지 GLM을 개발하여 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 예정이며, 다양한 서비스에도 적용할 계획이다. 또한, 한국어 언어모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 추진할 예정이다.
이와 함께 국립국어원은 2021년 국어 정보처리 시스템 경진대회'를 SKT의 AI 언어 모델을 활용하여 AI의 언어소통 능력을 겨루는 방식으로 개편하여 한글 주간에 개최하기로 했다.
데이비스 에릭 하트먼 SKT Language Superintelligence Labs장은 "SKT는 한국어에 최적화된 인공지능 언어모델을 선제적으로 개발해 한국어의 정보화에 이바지하고 있다"며 "이번 국립국어원과의 협력을 계기로 한국어의 과학화, 세계화에도 기여할 계획"이라고 밝혔다.
[파이낸셜신문=황병우 기자]