기사 메일전송
ETRI, 사람처럼 문서 이해하는 AI 기술 개발
  • 김만석
  • 등록 2021-09-07 09:43:25

기사수정



국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다. 이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API ’2종을 개발했다고 밝혔다. 

ETRI는 인공지능 SW를 이용해 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있는 기술을 개발했다. 

먼저 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. 

예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면,‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

본 기술은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 

그 결과 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또한, 패러프레이즈(Paraphrase) 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 

앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다. 

예를 들어 ‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만, ‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다. 

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다. 

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다. 

현재는 한글 문서 대상으로만 서비스를 제공하지만, 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다. 

덕분에 사내 규정, 메뉴얼, 온라인 공고 등 다양한 문서와 분야에 적용될 전망이다.

연구진은 오피스 문서 서식이 다양하고 정형화되지 않아 인공지능 기술을 적용하기 어려웠지만, 견고성이 높은 데이터를 구축하고 무엇이 문제인지 판단하는 알고리즘 성능을 높이면서 본 성과를 낼 수 있었다고 밝혔다.

향후에는 GPT-3에 대응하여 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개하면서 AI 기술력을 고도화하고 플랫폼 개발에도 기여한다는 계획이다. 

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다.”라고 밝혔다.

한편 본 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털(https://aiopen.etri.re.kr/)에 공개되어 누구나 쉽게 이용할 수 있다.


0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. “표 계산 끝났나”…제천,새마을 1천명에 회의수당, 선거 앞둔 노골적 ‘조직 챙기기’ 논란 지방선거를 앞둔 시점, 충북 제천시의회가 새마을지도자에게 회의 수당을 지급하는 조례개정을 추진하면서 ‘표심 관리용 입법’이라는 비판이 거세다.국민의힘 소속 이정임·윤치국 의원은 지난 13일 ‘제천시 새마을운동조직 육성 및 지원 조례 일부 개정 조례안’을 공동 발의했다. 개정안은 시장 또는 읍·면·.
  2. [속보] 미국 대법원, 트럼프의 국가별 상호관세 '위법' 판결 [속보] 미국 대법원, 트럼프의 국가별 상호관세 '위법' 판결
  3. "코스피 5800시대"...글로벌 자금 유입에 채권혼합형 ETF '10조' 돌파 [뉴스21 통신=추현욱 ] 대한민국 자본시장이 유례없는 호황기를 맞이하며 새로운 이정표를 세웠다. 글로벌 자금의 강력한 유입에 힘입어 코스피 지수가 5800선을 돌파한 가운데, 안정적인 수익을 추구하는 채권혼합형 ETF(상장지수펀드) 시장 역시 사상 처음으로 순자산 10조 원을 넘어서며 질적 성장을 입증했다.글로벌 ‘바이 코리아’&...
  4. 대통령특별지시사항 적극행정실천(주아르헨티나 한국대사관 동포간담회) 【 대통령특별지시사항적극행정사례-주아르헨티나한국대사관-동포간담회시행및보고】주아르헨티나 한국대사관이재명대통령 특별지시사항 적극행정실천“ KB금융그룹/국민은행의 위법 & 불법행위 (아르헨티나 교민150여명이상, 20여년 피눈물과 고통외면 사건관련 현지 최대민원 특별동포간담회 실시)대통령께 보고되도록 재외동포...
  5. 트럼프 '상호관세 종료' 행정명령…대체수단으로 관세 10%, 24일 0시 1분부터 발효 [뉴스21 통신=추현욱 ] 도널드 트럼프 미국 대통령이 20일(현지 시간) 연방 대법원의 상호관세 위법 판결에 따라 해당 관세 징수를 종료하는 내용의 행정명령에 서명했다.백악관 홈페이지에 공개된 행정명령에서 트럼프 대통령은 국제비상경제권한법(IEEPA)에 근거해 부과된 관세들이 더 이상 효력이 없으며 절차가 완료되는 대로 추가 징수는 ...
  6. 무안 양돈농장서 ASF 확진… 전남도, 확산 차단 총력 [뉴스21 통신=박철희 ] 전라남도는 지난 20일 무안군 현경면 소재 양돈농장에서 아프리카돼지열병(ASF)이 확진됨에 따라 신속한 초동방역 조치를 실시하고 확산 차단에 총력을 기울이고 있다고 밝혔다.해당 농장은 돼지 3,500마리를 사육 중이며, 농장주의 폐사 신고를 접수한 전남도동물위생시험소가 정밀검사를 진행한 결과 ASF로 최종 확진됐...
  7. 해남군, 2026년 농어민 공익수당 신청 접수 시작 [뉴스21 통신=박철희 ] 해남군이 2026년 농어민 공익수당 지급 신청을 받는다. 올해 지급액은 70만 원으로, 지난해보다 10만 원 늘었으며 전액 해남사랑상품권으로 상반기 중 지급될 예정이다.신청 기간은 2월 19일부터 3월 13일까지이며, 주소지 읍·면사무소에서 접수할 수 있다. 대상은 농업·어업·임업 경영정보를 등록한 경영체.
역사왜곡
모바일 버전 바로가기