• 입력 2023.05.31 16:51
(인포그래픽=하정우 네이버 AI LAB 센터장 발표자료 캡처)
(인포그래픽=하정우 네이버 AI LAB 센터장 발표자료 캡처)

[뉴스웍스=최승욱 기자] "ChatGPT는 뛰어난 성능에도 불구하고 전문분야에서 활용하기에는 생성 결과물의 정확도와 신뢰도가 낮다. 초거대 인공지능(AI) 시대를 맞아 국내 산업경쟁력을 확보하려면 범용모델의 한계를 극복하고 신시장을 개척할 수 있는 '분야별 특화모델' 개발 지원이 필요하다." (성석함 SKT 정책협력 담당 부사장) 

"ChatGPT와 Bard는 데이터와 파라미터로 학습해 풍부한 표현력을 갖고 있으나 환각(hallucination) 이슈 등으로 인해 거짓 정보가 포함된 답변을 내놓은 한계를 노출하고 있으며 과도한 운영비용으로 인한 낮은 수익성 또한 문제로 지적되고 있다." (김유철 LG AI 연구원 AI X 유닛 부문장)

"한국의 초거대 AI 기술이 한국어 정보나 우리가 보유하고 있는 데이터를 기반으로 'AI 주권'을 강조하며 국내 시장 '수성'에 무게를 두는 것도 중요하지만 궁극적으로 해외 시장에 진출해 'AI 주도' 할 수 있는 기술 혁신 전략과 AI 성장전략이 필요한 시점이다." (김진우 카이스트 기술경영학부 초빙교수)

윤영찬 더불어민주당 의원과 변재일 민주당 의원, 박대수 국민의힘 의원이 31일 국회의원회관 제2소회의실에서 '초거대 AI 시대의 대한민국 그리고 AI 주권'을 주제로 주최한 토론회에서 제기된 의견들이다.

한국은 전세계에서 거의 유일하게 구글에게 잠식당하지 않은 자체 검색엔진시장을 갖고 있는 국가다. 초거대 AI라는 새로운 도전이자 기회를 어떻게 활용하느냐에 따라 우리의 미래경쟁력도 좌우될 것이다. 효율적인 대응방안을 마련하는 것은 국가 이익과 직결되는 중요한 과제가 아닐 수 없다.  

글로벌 빅테크 기업들 간에 초거대 AI 플랫폼을 먼저 차지하기 위한 경쟁이 달아오르면서 초거대 AI 시대가 우리 앞에 성큼 다가오고 있다. 구글이 한국을 제외한 전세계 검색엔진시장에서 독주한 것처럼 초거대 생성형 AI 분야에서도 소수 기업의 독과점체제가 공고화되는 것 아니냐는 우려가 제기되는 실정이다. 한국이 초거대 AI 시대 개막에 적절히 대응하지 못한다면 특정 기업이나 국가에 관련 기술과 시스템이 종속돼 'AI 주권'을 지킬 시간이 얼마 남지 않을 수 있다는 경고도 나온다. 

마이크로소프트의 지원 아래 OpenAI는 지난해 11월 30일 ChatGPT를 공개한뒤 두 달 만에 월 1억명 이상의 사용자를 확보했다. ChatGPT는 GPT-3.5 또는 GPT-4를 대화 형태로 제공하는 챗봇 서비스이다. 선풍적인 인기를 끈 이유는 정말로 쓰기 쉬운 사용자 경험을 제공하기 때문이다. 인터넷에 접속하고 로그인한뒤 채팅으로 요구 사항을 입력하자마자 답변이 나온다. 사용자가 원하는 내용으로 시를 즉각 작성하는가 하면 컴퓨터 프로그래밍도 척척 해낸다. OpenAI의 독주가 우려되자 지난 2월에는 구글과 메타가 각각 Bard, LLaMA를 내놓고 서비스를 시작했다. 이에 맞서 OpenAI는 3월 GPT-4를 출시하면서 사용요금을 대폭 올렸다.

(인포그래픽=하정우 네이버 AI LAB 센터장 발표자료 캡처)
(인포그래픽=하정우 네이버 AI LAB 센터장 발표자료 캡처)

이런 움직임 속에서 한국의 초거대AI에 대한 대응을 살펴보면 걱정되는 측면이 적지 않다. 네이버는 2021년 5월 미국, 중국에 이어 세계 세 번째이자 국내 최초로 초거대 언어생성 인공지능모델 하이퍼클로바(HyperCLOVA)를 내놓았다. 이후 현대백화점 AI 카피라이터 '루이스'가 하이퍼클로바를 활용, 업무소요시간을 2주에서 3시간으로 줄이고 500개 이상의 스타트업이 챗봇서비스 등으로 쓰고 있지만 별다른 주목을 끌지 못했다. 챗GPT의 위력이 알려지자 하이퍼클로바를 업그레이드한 하이퍼클로바X를 7~8월경 내놓을 예정이다.

(그림=이진형 KT Large AI 사업담당 상무 발표자료 캡처)
(그림=이진형 KT Large AI 사업담당 상무 발표자료 캡처)

KT는 지난해 11월 초거대 AI모델 '믿음'을 출시했지만 아직까지는 자사의 AI컨택센터(AICC) 서비스에 도입하는데 그치고 있다.

(그림=김경훈 카카오 AI 정책지원 이사 발표자료 캡처)
(그림=김경훈 카카오 AI 정책지원 이사 발표자료 캡처)

카카오는 제시된 한국어를 이해하고 사용자의 의도에 맞춰 문장을 생성하는 KoGPT 2.0를 올해 하반기 중에 공개할 예정이다. 사용자가 입력한 문장과 이미지를 기반으로 새로운 이미지를 생성하는 Karlo도 하반기 중에 내놓을 방침이다.

윤영찬 민주당 의원이 31일 환영사를 읽고 있다. (사진=원성훈 기자)
윤영찬 민주당 의원이 31일 환영사를 읽고 있다. (사진=원성훈 기자)

윤영찬 의원은 이날 환영사에서 "초기 AI모델의 특성이 업무효율화였다면 초거대 AI는 사회 기반시스템이자 플랫폼으로 작동할 수 있는 확장성을 가지고 있다"며 "게임체인저로 부각되는 초거대 AI를 구동하기 위한 필수 인프라인 클라우드 산업은 이미 아마존(AWS)을 포함한 해외 기업이 장악하고 있고 국내 기업들이 선점하고 있는 공공시장마저 넘보고 있다"고 밝혔다. 윤 의원이 지적한 것처럼 ChatGPT와 같은 파운데이션 모델들이 블랙홀처럼 데이터를 빨아들이면서 파생되는 데이터 주권 이슈, 국내 파운데이션 모델이 제대로 나오지 못할 경우 글로벌 경쟁에서 뒤처지는 문제, AI가 일상화될수록 더 커질 윤리적 이슈 등에 대해 정치권과 정부, 기업이 머리를 맞대고 해결방안을 조속히 마련할 필요가 크다.

윤 의원과 함께 국회 디지털혁신과미래포럼 공동대표를 맡고 있는 박대수 의원은 "AI 기술을 한 단계 넘어선 초거대 AI가 등장하면서 전세계는 인터넷 등장이후 새로운 문명의 전환점이 될 것으로 기대하고 있다"면서도 "사람들의 삶을 더 편리하게 변화시킬 것이라는 기대와는 달리 특정 성별, 종교, 인종에 편향된 데이터를 학습하도록 조작된 AI로 인해 불공정 채용이 발생하는 등 데이터의 신뢰도·저작권·보안 등 다양한 부작용이 발생되고 있다"고 지적했다.

이런 문제를 고려해 최근 끝난 G7정상회의는 '신뢰할 수 있는 AI'라는 공통목표를 달성하기 위해 생성형 AI와 관련된 국제규범과 국제적 정보 유통 채널을 만들기로 합의한 바 있다. 한국도 AI의 편향성이나 사생활 침해, 부정확한 정보 양산 등을 해결하는 국제적 공조에 적극 참여하도록 노력해야 함은 당연하다.

(포스터제공=윤영찬 의원실)
(포스터제공=윤영찬 의원실)

가장 시급한 과제는 한국이 빠른 시간 내에 강력한 AI 생태계를 구축하는 것이다. 김진표 국회의장은 이날 축사를 통해 "한국의 AI 기술 역량은 선두국가인 미국, 중국에 아직 못 미친다"며 "세계적인 생성 AI 글로벌 스타트업 250개 가운에 한국 기업은 3개에 불과하다. 세계 공동 13위 수준이다"고 전했다.

해법은 무엇일까. 김유철 LG AI연구원 부문장은 "사실에 기반한 답변, 저작권 영향 없는 결과물, 추론 최적화를 통한 경제성 실현 등 기술적인 차별화를 통해 글로벌 경쟁력을 확보해야 한다"며 "이미 일반 AI 분야에서 B2C 사례를 만들고 있는 미국, 중국과 대비해 산업별로 특화된 사례를 만드는 것이 차별점과 파급력, 경제성 측면에서 유리할 것"이라고 제안했다. 김 부문장은 "한국은 국내 기술을 기반으로 초거대 AI의 활용사례와 관련 제도를 선제적으로 만들고 운영하면서 글로벌 베스트 프랙티스(Best Practice)로서 AI 주권을 확립해야 한다"며 “이를 통해 자체 초거대 AI를 보유하고 있지 않지만 미국, 중국 등의 기술에 종속되는 것을 우려하거나 도입에 어려움을 겪는 동남아, 중동 등 해외시장에 진출해야한다"고 강조했다. 미국과 중국 간의 패권 다툼 경쟁의 틈새를 겨냥, 한국 AI기업이 세계적 수준의 초거대 AI 원천기술을 수출한다면 그야말로 좋은 일이다. 이를 위해 방대한 데이터를 갖고 있는 정부의 적극적인 참여와 공조가 시급하다.  

김경훈 카카오 AI 정책지원 이사는 "개방형 전략을 통해 국내 AI 생태계가 글로벌 빅테크에 종속되는 것을 막고 AI 기술 주권을 수호할 것"이라며 "KoGPT와 Karlo는 웹사이트(카카오 디벨로퍼스)를 통해 API(응용프로그램인터페이스)형태로 공개할 방침"이라고 밝혔다. 김 이사는 AI 주권 확보 방안으로 ▲AI 모델 학습을 위해 정부 슈퍼컴퓨터 유휴 리소스 활용 지원 ▲민간에서 수집불가능한 공공데이터의 지속적 수집과 공급 ▲AI 연구개발 유연성 확보를 위한 프로그램형 R&D 전환을 손꼽았다. 

이진형 KT Large AI 사업담당 상무도 "양질의 한국어 데이터를 확충하기 위해 공개 가능한 범위 내 개인정보 데이터 활용에 대한 제도적 보완이 필요하고 정확성이 뛰어난 공공기관 텍스트 데이터에 대해서도 적극적인 개방을 검토해야 한다"고 밝혔다. 이 상무는 ▲국가 차원의 초거대 AI 보유 기업과 수요 기업 매칭으로 빠른 협력 추진 ▲초거대 AI 활용시 국가와 기업의 민간 데이터 보호를 위한 법률 제정 및 연구투자 ▲생성형 AI가 만들어낸 산출물에 대한 지식재산 관련 논의 필요 등을 제시했다.

AI업계는 민간 기업에서 맡기 힘든 선행기술 개발에 있어 정부의 과감한 R&D 자금 지원과 빠른 사업 추진을 바라고 있다. 글로벌 AI 경쟁 심화를 감안, 관련 기술이나 서비스에 대한 사전 규제를 최소화하고 AI 윤리와 신뢰성 확보를 위한 민·관협력을 강화해야한다는 요구는 타당하다.

정부는 4월 내놓은 '초거대 AI 경쟁력 강화 방안'의 미진한 부분을 서둘러 보완할 필요가 크다. 국회도 AI 학습을 위해 저작물에 대한 TDM(Text Data Mining)을 허용하는 저작권법 개정안을 본격적으로 심의, 민간에서 활용가치가 높은 데이터를 편리하게 활용할 수 있도록 법률적 기반부터 마련해야할 것이다

저작권자 © 뉴스웍스 무단전재 및 재배포 금지