기자명 안지해 기자
  • 입력 2021.12.14 12:06

3000억 파라미터 보유·이중언어 구사…"독점 아닌 일반 공개로 생태계 만들 것"

14일 진행한 LG AI 토크 콘서트에서 배경훈 원장이 키노트 스피치를 하고 있다. (사진제공=LG그룹)

[뉴스웍스=안지해 기자] LG가 초거대 인공지능(AI) ‘엑사원(EXAONE)’을 공개하며 글로벌 초거대 AI 생태계 확장을 예고했다.

LG AI연구원은 14일 'LG AI 토크 콘서트'에서 초거대 AI '엑사원' 공개하고, 그동안의 연구 성과와 향후 계획을 발표했다. 초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 딥러닝 효율을 높인 차세대 AI를 뜻한다. 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단을 할 수 있다. 

엑사원은 'EXpert Ai for everyONE'을 축약한 단어로 '인간을 위한 전문가 AI'를 의미한다. 또 'EX'는 '전문가'라는 의미 외에 10의 18승 즉, 100경을 뜻하는 접두어 'EXA'를 뜻한다. 인류가 지금까지 사용한 모든 단어를 데이터로 저장한다고 가정할 때 그 양이 5엑사바이트(Exabyte)일 만큼 매우 큰 단위이며, 초거대 AI의 규모를 가늠하기에 적합한 단어다.

LG AI연구원은 지난 5월부터 인간의 뇌에서 정보를 학습하고 기억하는 시냅스와 유사한 역할을 하는 인공 신경망의 파라미터를 13억개부터 130억개, 390억개, 1750억개 등 단계적으로 키우며 초거대 AI를 연구해왔다. 

이날 공개한 엑사원은 국내 최대인 약 3000억개의 파라미터를 보유하고 있다. 언어뿐 아니라 이미지, 영상까지 인간의 의사 소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 멀티 모달리티 능력을 갖췄다. 

LG AI연구원은 멀티 모달 AI로 가는 첫 단계로 자체 개발한 알고리즘으로 언어를 이미지로, 이미지를 언어로 변환하는 기술과 품질 모두 글로벌 최고 수준의 성능을 의미하는 SOTA(State-of-the-art)를 달성했다.

엑사원이 그린 호박 모양의 모자 이미지. (사진제공=LG그룹)

LG는 향후 멀티 모달 AI 기술이 고도화되면, AI가 데이터를 습득해 이해하는 수준을 넘어 추론하고, 시각과 청각을 비롯한 다양한 감각 영역을 넘나드는 창조적 생성을 할 수 있다고 설명했다. 기존 AI는 텍스트를 분석해 이미지를 찾는 수준이라면, 엑사원은 "호박 모양 모자를 만들어 줘"라는 주문에 학습된 정보를 기반으로 스스로 판단해 세상에 없던 ‘호박 모양의 모자’ 이미지를 만들어 낼 수 있다.

이날 LG AI연구원은 이날 엑사원이 제공할 수 있는 새로운 고객 경험에 대한 영상도 공개했다. 영상에는 메타버스 공간에서 크리스마스 파티를 준비하는 엑사원이 고객이 말하는 의도를 파악해 의상을 직접 만들어 추천하고, 집안의 공간을 꾸미는 과정을 담았다.

LG는 이 같은 멀티 모달 AI를 개발하기 위해 LG AI연구원은 세계 최대 규모의 학습 데이터를 활용했다. 엑사원은 말뭉치 6000억개와 언어·이미지가 결합된 고해상도 이미지 2억5000만장 이상을 학습했다. 특히 미국 AI연구소 오픈AI가 개발한 초거대 AI인 'GPT-3'가 영어를 학습하거나, 국내에서 개발 중인 다른 초거대 AI들이 한국어에 집중하는 것과 달리 엑사원은 원어민 수준으로 한국어와 영어를 이해하고 구사하는 이중 언어 AI라는 점도 차별화 포인트라고 연구원은 강조했다.

LG AI연구원은 엑사원을 제조와 연구, 교육, 금융을 비롯한 사실상 모든 분야에서 '상위 1% 수준의 전문가 AI'로 활약할 수 있도록 만들 계획이다. 이를 위해 LG 계열사와의 협업을 통한 실증과 국내를 포함한 글로벌 AI 연합 결성해 활용 영역 확대, 초거대 AI 대중화를 통한 상생환경 구축 등 3단계로 준비할 방침이다.

LG AI연구원은 우선 엑사원을 사용할 수 있는 통로인 오픈 응용프로그램 인터페이스(API)를 LG 계열사들에게 공개해 전자·화학·통신 등 LG 사업 전반에 초거대 AI를 적용할 수 있도록 했다. 2단계인 글로벌 파트너사와의 연합을 결성할 때 가장 중요한 요소인 데이터 보안 문제를 해결하기 위해 '엑사원-튜닝(EXAONE-Tuning)'이라는 알고리즘도 자체 개발했다. 또 일부 기업이 독점하는 것이 아니라, 일반 대중까지 공개하는 대중화를 통한 상생환경 구축 방안도 검토 중이다.

국내 초거대 AI의 개발 연구는 LG 외에도 네이버, 카카오, SK텔레콤, KT과 같은 정보통신기술(ICT) 기업에서 진행하며 앞다퉈 투자하고 있다.

네이버는 지난 5월 국내 첫 초거대 AI이자 한국어로 된 세계 최대 언어모델인 '하이퍼클로바'를 공개했고, 700페타플롭 이상의 슈퍼컴퓨터를 도입했다. 카카오의 AI 전문 자회사 카카오브레인은 지난달 16일 GPT-3 모델을 활용한 한국어 특화 초거대 AI 언어모델 'KoGPT'의 기술을 공개했고, SK텔레콤은 1500억개 매개변수를 기반으로 GPT-3과 비슷한 성능을 가진 한국어 범용 언어모델을 목표로 지난 4월부터 국립국어원과 협력 중이다. KT도 국내 주요 기업·연구기관과 함께 AI 원팀을 꾸려 내년 상반기까지 2000억 매개변수 이상의 초거대 AI 모델을 개발해 AI 음성인식 단말기인 '기가지니3' 등에 적용할 계획이다.

배경훈 LG AI연구원장은 "어려운 난제를 해결하기 위해 끊임없이 도전하고, 우수한 연구 성과를 바탕으로 고객에게 꼭 필요한 전문가 AI를 만드는 연구원이 되고자 한다"며 "캐나다 토론토대와 미국 미시건대, 서울대, 카이스트 등 국내외 주요 대학과 연구개발 연계 체계를 더욱 강화하고, 향후 API 공개·외부 파트너십을 통해 집단 지성으로 글로벌 초거대 AI 생태계를 만드는 데 기여할 것"이라고 말했다.

저작권자 © 뉴스웍스 무단전재 및 재배포 금지