기사 메일전송
ETRI, 사람처럼 문서 이해하는 AI 기술 개발
  • 김만석
  • 등록 2021-09-07 09:43:25

기사수정



국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다. 이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API ’2종을 개발했다고 밝혔다. 

ETRI는 인공지능 SW를 이용해 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있는 기술을 개발했다. 

먼저 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. 

예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면,‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

본 기술은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 

그 결과 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또한, 패러프레이즈(Paraphrase) 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 

앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다. 

예를 들어 ‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만, ‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다. 

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다. 

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다. 

현재는 한글 문서 대상으로만 서비스를 제공하지만, 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다. 

덕분에 사내 규정, 메뉴얼, 온라인 공고 등 다양한 문서와 분야에 적용될 전망이다.

연구진은 오피스 문서 서식이 다양하고 정형화되지 않아 인공지능 기술을 적용하기 어려웠지만, 견고성이 높은 데이터를 구축하고 무엇이 문제인지 판단하는 알고리즘 성능을 높이면서 본 성과를 낼 수 있었다고 밝혔다.

향후에는 GPT-3에 대응하여 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개하면서 AI 기술력을 고도화하고 플랫폼 개발에도 기여한다는 계획이다. 

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다.”라고 밝혔다.

한편 본 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털(https://aiopen.etri.re.kr/)에 공개되어 누구나 쉽게 이용할 수 있다.


0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. '리얼시그널' 웹사이트...부동산, 예금, 주식, 가상자산 보유 현황 확인 (사진=네이버db)[뉴스21 통신=추현욱 ]고위 공직자들의 실제 부동산 보유 현황을 보여주는 웹사이트가 등장해 눈길을 끈다. 공개된 고위공직자 재산공개 자료를 기반으로 만들어진 온라인 서비스 '리얼시그널'이 그것이다.리얼시그널에는 대통령, 국회의원, 장·차관, 고위 법관 및 검사, 군 장성 등 약 7000명의 자산 내역이 담겨 있..
  2. 태광그룹, 애경산업 지분 63% 4700억원에 인수...매매 예정일자, 내년 2월 19일 [뉴스21 통신=추현욱 ] 태광산업 컨소시엄이 4700억원에 애경산업을 인수한다.AK홀딩스와 태광산업 등은 각각 이사회를 열고 이같은 내용이 담긴 주권 양수도 방안을 승인했다고 지난 20일 밝혔다.매각 대상 주식은 애경산업 보통주 1667만2578주다. AK홀딩스 보유주식 1190만4812주와 애경자산관리 보유주식 476만7766주다.이는 애경산업 전체 발행주...
  3. 제천 S목욕탕 여탕 냉탕서도 ‘인분’…남탕 이어 위생 논란 확산 충북 제천의 한 목욕탕 입구에서 대변을 본 혐의로 40대 남성이 입건된 가운데, 같은 지역의 또 다른 목욕탕에서도 인분이 반복적으로 발견돼 시민 불안이 커지고 있다.제천시 청전동의 S 목욕탕을 이용 중인 A(여) 씨는 “최근 냉탕에서 인분이 떠다니는 일이 잇따랐다”며 “지금까지 8차례나 이런 일이 있었지만, 누가 그런 짓을 ...
  4. 24일 경찰 고위직 경무관 51명 인사 전보...서울경찰청 '수사 3인방' 전격 교체, 세관 마약 수사 외압 의혹 경찰 간… [뉴스21 통신 =추현욱] 경찰청이 24일 경무관 51명에 대한 전보 인사를 단행했다. 경문관은 '경찰의 별'로서 시·도경찰청 차장, 서울·부산·경기·인천 등 경찰청 부장, 경찰청 심의관 등으로 근무한다.경찰청 국제협력관으로 이재영 서울경찰청 범죄예방대응부장, 치안상황관리관으로 강순보 강원경찰청 공공안전부장...
  5. 제천시, 11월 3일부터 자체 경제활력지원금 지급 시작 충북 제천시가 지역 내 소비 촉진과 경기 회복을 위해 ‘제천시 자체 경제활력 지원금’을 오는 11월 3일부터 지급한다.지원금은 제천시민 1인당 20만 원, 기초생활 보장 수급자·차상위계층·한부모가족 등 취약계층은 30만 원이 지급된다.지급대상은 10월 10일 기준 제천시에 주민등록이 있는 시민, 그리고 제천에 체류 중인 결.
  6. 이재명 “트럼프 이해하게 됐다”… “김정은, 오랫동안 잘 참았다” 이재명 대통령이 도널드 트럼프 미국 대통령과의 첫 정상회담 이후 “서로 공감이 가능한 자리였다”고 평가하며 한미 관계에 대한 신뢰를 강조했다.이 대통령은 23일 공개된 CNN 인터뷰에서 “트럼프 대통령의 삶이나 일을 추진하는 방식, 이런 점들에 대해 조금은 더 많이 이해하고 있다고 생각한다”며 “서로 많은 교감이 ...
  7. 삼성전자·삼전우·하이닉스, 시총 '1020조'...“한국도 이제 천조국 등극” [뉴스21 통신=추현욱 ] 24일 코스피는 전 거래일 대비 2.5% 상승한 3941.59에 마감했다. ‘4천피’까지 단 1.48%, 59포인트를 남겨놓게 됐다.이날 랠리 역시 반도체주가 이끌었다.삼성전자는 2.38% 오른 9만8800원, SK하이닉스는 6.58% 상승한 51만원에 거래를 마쳤다. SK하이닉스 주가가 50만원을 넘어선 것은 이날이 처음이다.시가총액 1·2위인 .
역사왜곡
모바일 버전 바로가기