기사 메일전송
ETRI, 사람처럼 문서 이해하는 AI 기술 개발
  • 김만석
  • 등록 2021-09-07 09:43:25

기사수정



국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다. 이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API ’2종을 개발했다고 밝혔다. 

ETRI는 인공지능 SW를 이용해 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있는 기술을 개발했다. 

먼저 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. 

예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면,‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

본 기술은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 

그 결과 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또한, 패러프레이즈(Paraphrase) 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 

앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다. 

예를 들어 ‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만, ‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다. 

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다. 

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다. 

현재는 한글 문서 대상으로만 서비스를 제공하지만, 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다. 

덕분에 사내 규정, 메뉴얼, 온라인 공고 등 다양한 문서와 분야에 적용될 전망이다.

연구진은 오피스 문서 서식이 다양하고 정형화되지 않아 인공지능 기술을 적용하기 어려웠지만, 견고성이 높은 데이터를 구축하고 무엇이 문제인지 판단하는 알고리즘 성능을 높이면서 본 성과를 낼 수 있었다고 밝혔다.

향후에는 GPT-3에 대응하여 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개하면서 AI 기술력을 고도화하고 플랫폼 개발에도 기여한다는 계획이다. 

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다.”라고 밝혔다.

한편 본 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털(https://aiopen.etri.re.kr/)에 공개되어 누구나 쉽게 이용할 수 있다.


0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. “성범죄 의혹 의원이 어떻게 시민을 대표하나” 무소속 한채훈, 강제추행 재판에 사퇴 요구 거세져 [뉴스21 통신=홍판곤 ]서울중앙지방법원에 따르면 한채훈 의원은 지난 24일 형사20단독 재판부에서 강제추행 혐의로 3차 공판을 받았다. 한 의원은 지난해 7월 4일 밤, 서울 강남의 한 주점 화장실에서 여성을 추행한 혐의를 받고 있다.검찰은 당초 벌금 1,000만 원 약식기소 처분을 내렸으나, 이후 정식재판으로 넘어간 것으로 전해졌다. 공판을 ...
  2. [1보] 이재명 대통령, 남아공서 프랑스 마크롱 대통령과 첫 회담 [1보] 이재명 대통령, 남아공서 프랑스 마크롱 대통령과 첫 회담
  3. 파주시, 내년 설 명절 전후 1인당 10만원 ‘기본생활안정지원금’ 지급...예산안, 시의회 통과하는 대로 [뉴스21 통신=추현욱 ]파주시가 소비 증진과 민생 안정을 위해 내년 초 시민들에게 1인당 10만원의 ‘기본생활안정지원금’을 지급한다.25일 국내 유력 매체에 따르면 최근 파주시는 파주시의회에 예산안을 제출했다. 여기에 기본생활안정지원금과 관련된 내용이 담겼다. 총 사업비는 531억원 규모다. 지원금은 지역 화폐인 파주페이로 .
  4. “도심 속 힐링 명소 태화강국가정원, 겨울 문턱에 감성 더하다” [뉴스21 통신=최세영 ]초겨울 햇살 속에서 울산 태화강국가정원이 황금빛 억새와 고즈넉한 수변 풍경을 드러내며 시민들의 발길을 사로잡고 있다. 십리대숲을 따라 흐르는 강바람, 부드러운 정원길, 그리고 무장애 탐방로까지 갖춘 국가정원은 계절마다 새로운 풍경을 선사하며 울산의 대표 관광지로 자리 잡고 있다.태화강국가정원은 2020년...
  5. [속보] 메르츠 獨총리, "한반도·北 상황에 관심…한국의 대중국 인식 궁금" 메르츠 獨총리 "한반도·北 상황에 관심…한국의 대중국 인식 궁금"
  6. 고성군 반암항 '어촌뉴딜' 실상은 '유령 계원'놀이터? (강원 고성 =서민철 기자) 총사업비 100억 원 이상이 투입된 강원도 고성군 '반암항 어촌뉴딜 300' 사업이 어촌계의 불투명한 운영과 행정 당국의 관리 감독 부실로 인해 좌초 위기에 처했다. 특히 어촌계 운영을 좌지우지하는 계원 중 상당수가 실제 거주하지 않는 '위장 전입자'라는 의혹이 제기됐으나, 고성군과 거진읍은 형식...
  7. '건조특보' 강원 양양군 서면서 산불…인근 주민 긴급 대피령 [뉴스21 통신=추현욱 ]22일 강원 양양군 서면 서림리에서 난 산불이 번지면서 지자체에서 인근 주민들에게 긴급 대피를 안내했다.양양군은 이날 오후 7시 35분께 서림리와 갈천, 송천 등 화재 지역 인근 주민들에게 재난 안전 문자를 보내 마을회관 등으로 대피할 것을 권고했다.불길이 바람을 타고 조침령 5부 능선 인근까지 번지고 있어, 산림...
역사왜곡
모바일 버전 바로가기