기자명 문병도 기자
  • 입력 2021.09.07 11:51

ETRI 연구팀, 한글 행정문서 질의응답(QA)·패러프레이즈 API 공개

ETRI 연구진이 엑소브레인 OpenAPI 기술의 활용 분야를 설명하고 있는 모습(왼쪽부터 임준호 책임연구원, 김민호 책임연구원, 배용진 선임연구원, 이형직 책임연구원)
임준호(왼쪽부터) 책임연구원, 김민호 책임연구원, 배용진 선임연구원, 이형직 책임연구원이 엑소브레인 오픈API 기술의 활용 분야를 설명하고 있다. (사진제공=ETRI)

[뉴스웍스=문병도 기자] 한국전자통신연구원(ETRI) 연구팀이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 인공지능(AI) 기술을 개발했다. 

이 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털에 공개되어 누구나 쉽게 이용할 수 있다.

인공지능(AI)이란 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술을 말한다. 컴퓨터가 인간의 지능적인 행동을 모방할 수 있도록 한 것이다.

인간과 같이 사고하고 학습하고 판단하는 논리적인 방식을 사용하는 고급 컴퓨터 프로그램을 지칭하기도 한다. 2016년 알파고와 이세돌 기사와의 바둑대결로 인공지능의 우수성과 발전가능성이 입증됐다

행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. '출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?'라는 질문을 입력하면, '100만 원 이하인 경우, 실장 전결'과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

이 기술은 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

패러프레이즈 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성 문제가 있다. '그는 빨간 자전거를 샀다'와 '그가 산 자전거는 빨간색이다'라는 문장은 사람과 기계가 쉽게 구분하지만, '그는 빨간 자전거를 안 샀다'라는 문장과는 구분을 잘하지 못한다. 

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 이 기술을 개발했다. 견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

이번 연구는 2013년부터 ETRI가 총괄 및 1세부과제를 맡은 과학기술정보통신부와 정보통신기획평가원(IITP)의 혁신성장동력 프로젝트와 전체 세부과제를 이끄는 엑소브레인 과제의 일환으로 이뤄졌다. 

저작권자 © 뉴스웍스 무단전재 및 재배포 금지