기자명 전다윗 기자
  • 입력 2023.07.19 14:00

'할루시네이션' 방지 총력…답변과 함께 근거까지 함께 제시
전문가 '유니버스'·R&D '디스커버리'·시각화 '아틀리에' 구성

19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 배경훈 LG AI연구원장이 '엑사원 2.0'을 소개하고 있다. (사진제공=LG)
19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 배경훈 LG AI연구원장이 '엑사원 2.0'을 소개하고 있다. (사진제공=LG)

[뉴스웍스=전다윗 기자] 신성장동력 중심으로 그룹 체질 개선에 주력하고 있는 LG가 초거대 멀티모달 AI '엑사원 2.0'을 공개했다. 엑사원 2.0은 생성형 AI의 고질적 문제인 '할루시네이션'을 최소화해 '전문가도 사용 가능한 AI'를 표방한다. LG는 국내외 파트너사와 협력을 통해 엑사원 2.0의 실질적 성공 사례를 만들어 '글로벌 AI 컴퍼니'로 거듭날 것이란 청사진을 제시했다. 

LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 초거대 멀티모달 AI(인공지능) '엑사원 2.0'과 이를 기반으로 한 3대 플랫폼 ▲유니버스 ▲디스커버리 ▲아틀리에를 차례로 공개했다. 지난 2021년 첫선을 보인 '엑사원'을 한 단계 진화시킨 모델이다. 

19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 배경훈 LG AI연구원장이 엑사원 2.0을 소개하고 있다. (사진제공=LG)
19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 배경훈 LG AI연구원장이 엑사원 2.0을 소개하고 있다. (사진제공=LG)

엑사원 2.0은 각 분야에 특화된 전문가들이 사용할 수 있는 생성형 AI를 목표로 탄생했다. 챗GPT를 시작으로 대규모 데이터를 기반으로 한 생성형 AI들이 쏟아져 나오고 있으나, 여전히 전문가들과 산업 현장에선 실제 적용된 사례가 손에 꼽게 적다. 생성형 AI 특유의 할루시네이션 현상 때문이다. 할루시네이션은 생성형 AI가 질문의 맥락과 관련 없거나 사실이 아닌 내용을 마치 옳은 답처럼 내놓는 현상을 통징하는 말이다. 맞지 않는 내용을 사실처럼 전달해 거짓 정보를 전파할 가능성이 크다. 

'세종대왕 맥북프로 사건'은 할루시네이션의 대표적 사례다. 챗GPT 초기 모델에 세종대왕 맥북프로 사건이란 가공의 이야기를 묻자 "조선왕조실록에 기록된 일화로 세종대왕이 훈민정음 초고를 작성하던 중 분노해 맥북프로를 던졌다"는 황당한 답변을 내놔 온라인상에서 일종의 '밈'이 됐다. 

엑사원 2.0은 이러한 할루시네이션을 방지하기 위한 안전장치를 갖췄다. 답변과 함께 논문 등 그 근거까지 함께 제시하도록 했다. 거짓 답변을 내놓을 가능성을 최대한 낮추고, 전문가가 직접 근거를 통해 답변의 사실 여부를 판단할 수 있게 하기 위해서다. 

이에 따라 전문가용 대화형 AI 엑사원 유니버스는 질의응답·대화, 텍스트 분류·요약, 키워드 추출·생성, 번역 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 완전히 탈바꿈했다. 

다른 대화형 AI들과 달리 사전 학습한 데이터는 물론 각 도메인별 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 생성한다. 또, 질문에 대한 답변과 함께 화면 좌측과 우측에 각각 질문과의 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 표시한다.

화학 및 바이오 분야 발전 앞당길 신소재·신물질·신약 개발 플랫폼 엑사원 디스커버리는 논문, 특허 등 전문 문헌의 텍스트뿐 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등을 AI가 읽고 학습할 수 있는 형태로 데이터베이스화하는 심층 문서 이해(DDU) 기술을 적용했다.

LG AI연구원은 엑사원 디스커버리를 통해 1만회가 넘었던 합성 시행착오를 수십회로 줄이고, 연구개발 소요 시간은 40개월에서 5개월로 단축시킬 수 있을 것으로 예상했다.

이미지를 언어로 표현하고 언어를 이미지로 시각화하는 AI 플랫폼 엑사원 아틀리에는 저작권이 확보된 이미지·텍스트가 짝을 이룬 페어 데이터 3억5000만장을 학습한 엑사원 2.0을 기반으로 이미지 생성과 이미지 이해에 특화된 기능을 제공한다. 캡셔닝 AI는 처음 보는 이미지까지 자연어로 설명할 수 있으며, 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등의 메타 데이터를 생성한다. 

배경훈 LG AI연구원장은 "할루시네이션을 구조적으로 해결하기 위해 노력했다. 처음부터 질문한 내용과 가장 유사한 논문 등 자료들을 찾아오고 그 안에서 필요한 정보들을 이해하고, 그걸 바탕으로 답변을 내놓도록 했다"며 "하지만 할루시네이션은 어쩔 수 없는 현상이다. 100% 해결됐다고 볼 수 없다. 그래서 근거까지 함께 제공하며 전문가들이 판단할 수 있도록 했다. 생성형 AI의 신뢰성을 높이는 데 주력해서 연구를 진행할 예정"이라고 설명했다. 

19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 LG AI연구원의 연구 리더들이 질의응답을 진행하고 있다. (사진=전다윗 기자)
19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 LG AI연구원의 연구 리더들이 질의응답을 진행하고 있다. (사진=전다윗 기자)

LG의 다음 목표는 국내외 파트너사들과 협업해 실제 산업 현장에서 엑사원 2.0을 적용한 사례를 만들어 가는 것이다. 이화영 LG AI연구원 AI 사업개발유닛장은 "아직 시장 단계라 생성형 AI 시장 규모를 예측하는 것은 조심스럽다. 2027년 생성형 AI 시장이 200조원에 육박한다는 전망도 있으나 현재는 어떤 곡선을 그리게 될지 판단하기 어려운 상황"이라며 "챗GPT 나온 이후 여러 시도가 있었지만 실제 상용화된 사례는 많지 않은 것으로 안다. 잠재력 높은 분야에 선제적으로 투자해 먼저 시장에 진입하려고 한다. 톱티어 파트너사와 함께하면 퍼스트 무버 어드벤티지가 있을 것으로 판단한다. 전략적으로 아낌없이 투자하고 있다"고 말했다. 

한편, LG는 지난 2018년 구광모 LG그룹 회장 취임 후 AI를 미래 성장동력으로 낙점하고 과감한 투자를 이어가고 있다. 2020년 그룹 AI 연구의 싱크탱크 역할을 할 LG AI연구원을 설립한 데 이어, 지난해에는 향후 5년간 AI·데이터 분야 연구개발에 3조6000억 원을 투입해 미래 기술을 선점하고 인재 영입에도 적극 나서기로 했다. 이번 엑사원 2.0 공개 역시 이러한 그룹 체질 개선 작업의 일환이다.

배 원장은 "LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업이다. 세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다”며 "국내외 파트너사와의 협력을 통해 실질적인 성공 사례를 만들어 가며 다른 생성형 AI들과는 차별화된 고객 가치를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것"이라고 강조했다.

저작권자 © 뉴스웍스 무단전재 및 재배포 금지