기사 메일전송
ETRI, 사람처럼 문서 이해하는 AI 기술 개발
  • 김만석
  • 등록 2021-09-07 09:43:25

기사수정



국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다. 이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API ’2종을 개발했다고 밝혔다. 

ETRI는 인공지능 SW를 이용해 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있는 기술을 개발했다. 

먼저 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. 

예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면,‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

본 기술은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 

그 결과 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또한, 패러프레이즈(Paraphrase) 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 

앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다. 

예를 들어 ‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만, ‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다. 

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다. 

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다. 

현재는 한글 문서 대상으로만 서비스를 제공하지만, 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다. 

덕분에 사내 규정, 메뉴얼, 온라인 공고 등 다양한 문서와 분야에 적용될 전망이다.

연구진은 오피스 문서 서식이 다양하고 정형화되지 않아 인공지능 기술을 적용하기 어려웠지만, 견고성이 높은 데이터를 구축하고 무엇이 문제인지 판단하는 알고리즘 성능을 높이면서 본 성과를 낼 수 있었다고 밝혔다.

향후에는 GPT-3에 대응하여 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개하면서 AI 기술력을 고도화하고 플랫폼 개발에도 기여한다는 계획이다. 

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다.”라고 밝혔다.

한편 본 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털(https://aiopen.etri.re.kr/)에 공개되어 누구나 쉽게 이용할 수 있다.


0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. 공인중개사협회 법정단체 전환…국회 본회의 통과 한국공인중개사협회를 법정단체로 전환하는 내용을 담은 「공인중개사법 일부개정법률안」이 29일 오후 4시 27분, 제431회 국회(임시회) 제2차 본회의를 통과했다.이번 법안 통과로 한국공인중개사협회는 1999년 임의단체로 전환된 이후 27년간 정부와 국회를 상대로 지속적으로 요구해 온 핵심 숙원 과제를 마침내 해결하게 됐다.개정안은 지.
  2. 충우회, 20년 ‘나라사랑’ 실천…2026년 정기총회서 새 도약 다짐 충우회(회장 이규현)가 오는 1월 28일 낮 12시, 충남 서산시 베니키아호텔에서 ‘2026년 정기총회’를 열고 향후 사업 방향과 새로운 도약을 다짐한다.이번 정기총회는 지난 20년간 이어온 충우회의 나라사랑 실천과 사회공헌 활동을 되돌아보고, 2026년도 사업 계획의 기틀을 마련하는 자리로 마련됐다.충우회는 단순한 친목 단체를 넘어 ...
  3. 제천 새마을금고 이전·증축 공사, 인도 점령 논란…제천시 “불법 확인 시 과태료 부과” 충북 제천시 청전동에서 진행 중인 동제천 MG새마을금고 이전·증축 공사 현장이 인도를 점거한 채 대형 크레인 차량을 동원해 공사를 진행하면서 시민들의 보행권을 침해하고 있다는 지적이 제기되고 있다.현장을 확인한 결과, 크레인 차량과 각종 작업 장비가 보도블록 위 인도를 사실상 점령해 보행자들이 통행할 수 없는 상태였으며...
  4. [풀뿌리정치를 말하다] 전북의 이름으로, 기록으로 남긴 도전 [전북특별자치도 취재팀] 김관영 전북특별자치도지사가 자신의 정치·행정 여정을 담은 저서 『김관영의 도전』 출판기념회를 2월 1일 오후 전주대학교 학생회관 슈퍼스타홀에서 열었다. 오후 2시부터 5시까지 이어진 이날 행사는 출판기념회라는 형식 속에서도 이례적으로 차분했고, 정치적 수사보다 ‘기록’과 ‘성찰’...
  5. 사진·영상 신고 무력화? 비산먼지 현장 외면한 제천시 판단 도마 위 충북 제천시 청전동 아파트철거 현장에서 비산먼지가 발생했다는 신고가 접수됐지만, 제천시가 “출장 당시 살수 조치가 이뤄지고 있었다”는 이유로 행정처분을 하지 않으면서 행정의 소극적 대응을 둘러싼 논란이 일고 있다.본지는 앞서 해당 철거 현장에서 살수 조치 없이 철거 공사가 강행되며 다량의 비산먼지가 발생하고 있다.
  6. 울주군보건소, 임신부부 백일해 무료 예방접종 지원 울산 울주군이 신생아에게 치명적인 감염병인 백일해 예방을 위해 다음달부터 지역 임산부와 배우자를 대상으로 ‘백일해(Tdap) 무료 예방접종’을 지원한다고 30일 밝혔다. 백일해는 백일해균에 의해 감염되는 호흡기 질환으로, 전염성이 매우 강한 것이 특징이다. 특히 백일해 기초접종을 마치지 않은 생후 2개월 이전 영아의 경우 감...
  7. 제천 제4산단 조성사업, 도 승인 신청…본격 추진 단계 돌입 제천시와 충북개발공사가 추진 중인 ‘제천 제4 산업단지 조성사업’이 산업단지계획 승인 신청을 마치며 본격적인 추진 단계에 들어섰다.제천시는 30일 충청북도에 제천 제4 산업단지 산업단지계획 승인을 신청했다고 밝혔다. 산업단지계획 승인 신청은 산업단지 조성을 위한 핵심 행정절차로, 향후 사업 추진의 속도와 방향을 좌우.
역사왜곡
모바일 버전 바로가기