기사 메일전송
ETRI, 사람처럼 문서 이해하는 AI 기술 개발
  • 김만석
  • 등록 2021-09-07 09:43:25

기사수정



국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다. 이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API ’2종을 개발했다고 밝혔다. 

ETRI는 인공지능 SW를 이용해 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있는 기술을 개발했다. 

먼저 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. 

예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면,‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

본 기술은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 

그 결과 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또한, 패러프레이즈(Paraphrase) 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 

앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다. 

예를 들어 ‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만, ‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다. 

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다. 

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다. 

현재는 한글 문서 대상으로만 서비스를 제공하지만, 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다. 

덕분에 사내 규정, 메뉴얼, 온라인 공고 등 다양한 문서와 분야에 적용될 전망이다.

연구진은 오피스 문서 서식이 다양하고 정형화되지 않아 인공지능 기술을 적용하기 어려웠지만, 견고성이 높은 데이터를 구축하고 무엇이 문제인지 판단하는 알고리즘 성능을 높이면서 본 성과를 낼 수 있었다고 밝혔다.

향후에는 GPT-3에 대응하여 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개하면서 AI 기술력을 고도화하고 플랫폼 개발에도 기여한다는 계획이다. 

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다.”라고 밝혔다.

한편 본 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털(https://aiopen.etri.re.kr/)에 공개되어 누구나 쉽게 이용할 수 있다.


0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. 비산먼지 속 철거 강행…제천시는 몰랐나, 알면서도 눈감았나 충북 제천시 청전동 78-96번지 아파트 철거 현장을 둘러싼 논란이 단순한 ‘관리 소홀’을 넘어 즉각적인 작업중지 명령이 필요한 사안이라는 지적이 커지고 있다.현장 확인 결과, 대기환경보전법과 산업안전보건법 위반 정황이 동시에 확인되며, 이는 행정기관의 재량 문제가 아닌 법 집행의 영역이라는 평가다.◆첫째, 살수 없는 철...
  2. 초등생부터 89세까지 ‘알몸 질주’… 제천시 주최 겨울 마라톤 논란 제18회 제천 의림지 삼한 초록길 알몸마라톤 대회가 11일 충북 제천시 의림지 삼한의 초록길 일원에서 성황리에 개최됐다.제천시 육상연맹이 주최한 이번 대회는 매년 전국에서 1,000명 이상의 마라토너가 참가하는 겨울철 대표 이색 스포츠 행사로, 제천의 매서운 겨울 추위를 온몸으로 이겨내는 독특한 콘셉트로 전국 마라톤 동호인들의 꾸.
  3. 3선 제한·연임 도전·후보군 압축… 충주·제천·단양, 2026 지방선거 판도 윤곽 2026년 6월 치러질 제9회 전국동시지방선거를 1년여 앞두고 충북 북부권인 충주·제천·단양 지역 자치단체장 선거 구도가 서서히 윤곽을 드러내고 있다.지역별로 무주공산, 현직 연임 도전, 후보군 압축이라는 상반된 상황이 전개되면서 예선 단계부터 치열한 경쟁이 예고된다.충주시장 선거는 3선 연임 제한으로 현직 시장이 출마하...
  4. 국가데이터처, 2024년 기준 한국인 "건강수명 65.5세에 불과!"...기대수명 83.7세 [뉴스21 통신=추현욱 ]1만973명, 1만4884명, 2만1655명. 지난 2024년 사망한 50~54세, 55~59세, 60~64세 사람들의 숫자다. 평균 수명이 80세를 훌쩍 넘긴 시대라는 점을 감안하면 상당히 이른 죽음이다. 대부분은 사고가 아니라, 병이었다. 암이 가장 큰 원인이었고 심장 질환, 간 질환, 뇌혈관 질환도 주요 사망 원인이다.“피곤하다. 쉬고 싶은데 그럴 ...
  5. 윤석열 전 대통령 '내란 우두머리' 구형, 13일로 연기 내란 우두머리 혐의를 받고 있는 윤석열 전 대통령 등 내란 사건 피고인들에 대한 구형이 다음 주 화요일로 연기됐다.서울중앙지법 형사25부는 다음 주 화요일인 오는 13일을 윤 전 대통령 등 8명의 내란 사건 재판 추가 기일로 지정해 결심공판을 진행하기로 했다.이에 따라 윤 전 대통령 측의 증거조사와 '내란' 특검의 구형도 미뤄지...
  6. 정읍시, 강설 ·한파 예고에 시민 안전 현장점검 전북특별자치도 정읍시지역에  10일부터 12일까지 예보된 강설과 한파에 대비해 시민 안전을 지키기 위한 긴급 현장 점검을 실시하며 선제적 대응에 나섰다. 9일 이학수 정읍시장을 비롯해 손연국 도시안전국장, 김성익 재난안전과장 등 주요 관계자가 함께해 제설 자재 보관 창고와 한파 쉼터를 중점적으로 점검했다. 이학수 시장은 제...
  7. 정읍시,아이돌봄서비스 본인부담금 최대 70% 지원 전북특별자치도 정읍시가 양육 공백이 발생한 가정의 경제적 부담을 줄이기 위해 올해부터 아이돌봄 서비스 본인 부담금을 최대 70%까지 지원한다고 8일 밝혔다.아이돌봄서비스는 전문 양성 교육을 이수한 아이돌보미가 가정으로 직접 찾아가 아동을 돌봐주는 제도로, 서비스 종류는 ▲시간제 서비스(기본형·종합형) ▲영아종일제 서..
역사왜곡
모바일 버전 바로가기