기사 메일전송
ETRI, 사람처럼 문서 이해하는 AI 기술 개발
  • 김만석
  • 등록 2021-09-07 09:43:25

기사수정



국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다. 이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API ’2종을 개발했다고 밝혔다. 

ETRI는 인공지능 SW를 이용해 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있는 기술을 개발했다. 

먼저 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. 

예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면,‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

본 기술은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 

그 결과 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또한, 패러프레이즈(Paraphrase) 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 

앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다. 

예를 들어 ‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만, ‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다. 

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다. 

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다. 

현재는 한글 문서 대상으로만 서비스를 제공하지만, 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다. 

덕분에 사내 규정, 메뉴얼, 온라인 공고 등 다양한 문서와 분야에 적용될 전망이다.

연구진은 오피스 문서 서식이 다양하고 정형화되지 않아 인공지능 기술을 적용하기 어려웠지만, 견고성이 높은 데이터를 구축하고 무엇이 문제인지 판단하는 알고리즘 성능을 높이면서 본 성과를 낼 수 있었다고 밝혔다.

향후에는 GPT-3에 대응하여 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개하면서 AI 기술력을 고도화하고 플랫폼 개발에도 기여한다는 계획이다. 

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다.”라고 밝혔다.

한편 본 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털(https://aiopen.etri.re.kr/)에 공개되어 누구나 쉽게 이용할 수 있다.


0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. 가을 밤 밤은 가을의 상징처럼 다가오는 열매다. 가시 돋친 송이 속에 숨어 있다가 단단한 껍질을 벗기면, 고소하고도 은근한 단맛을 품은 알맹이가 드러난다. 구워 먹거나 삶아 먹을 때의 따뜻한 향은 오래된 풍경처럼 사람들의 기억 속에 남아 있다. 한국의 밤은 특히 알이 크고 질이 좋아 ‘한국밤’이라 불린다. 충청남도 공주와 부여, 전라도 순.
  2. 김정은·김여정, 中 전승절 행사서 서방 명품 착용 포착 중국 전승절 열병식 참석을 위해 방중한 김정은 북한 국무위원장과 여동생 김여정 노동당 부부장이 고가의 서방 명품을 착용한 모습이 포착돼 논란이 일고 있다.미국의 북한 전문매체 NK뉴스는 4일 러시아 크렘린궁이 공개한 사진을 분석한 결과, 김 위원장이 블라디미르 푸틴 러시아 대통령과 포옹할 당시 착용한 손목시계가 스위스 명품 ..
  3. 고양국제박람회재단, 스타필드 고양서 '플라워 팝업스토어' 개최 재단법인 고양국제박람회재단은 스타필드 고양과 함께 7일까지 스타필드 고양 1층 고메스트리트 앞에서 ‘플라워 팝업스토어' 행사를 진행한다고 5일 밝혔다.행사 기간 동안 고양시 화훼 농가들은 식물을 어울리는 화분에 심고 피규어나 도자기 픽 등을 곁들여 플랜테리어 활용에 적합하도록 상품을 구성해 판매한다.이번 행사는 최근 M...
  4. 포르투갈 리스본 명물 ‘푸니쿨라’ 선로 이탈…한국인 2명 사망·1명 중상 포르투갈 수도 리스본에서 관광 전차가 탈선하는 사고가 발생해 한국인 관광객 2명이 숨지고 1명이 크게 다쳤다.외교부는 5일 “한국 시간으로 오늘 새벽 한국인 남성 1명과 여성 1명이 사망한 것으로 확인됐다”며 “부상을 입은 여성 1명은 현지 병원에서 수술을 받고 중환자실에서 치료 중”이라고 밝혔다.외교부 당국자는 “현지 공관이 ...
  5. 잡초 무성한 레드카펫…정체성 잃은 '제천국제음악영화제' 충북 제천시가 청풍호반을 떠나 제천비행장에서 제21회 제천국제음악영화제(JIMFF)를 개최했지만, ‘정체성 상실’과 ‘준비 부족’ 논란이 잇따르고 있다.시는 기존 청풍호반 특설무대의 한계(3천석)를 넘어 비행장에 5천 명 이상 수용 가능한 초대형 돔(Dome)을 설치하며 “지역사회와 융합하는 영화제”를 내세웠지만, 정작 개막식 관람객은...
  6. 유명 1세대 유튜버 ‘대도서관’ 나동현씨, 자택서 숨진 채 발견… 향년 46세 유명 게임 전문 유튜버 ‘대도서관’으로 활동해온 나동현(47) 씨가 9월 6일 서울 광진구 자택에서 숨진 채 발견됐다. 경찰은 약속에 나타나지 않고 연락이 닿지 않는다는 지인의 신고를 받고 출동해 나씨를 발견했으며, 현장에서는 유서나 타살 정황은 확인되지 않았다. 경찰은 지병에 의한 자연사 가능성을 열어두고 있으며, 부검을 통해 정...
  7. 전남경찰청, AI 음악으로 고속도로 안전운전 문화 확산 [뉴스21통신 박민창기자] 전라남도경찰청이 운전자들의 교통안전 의식을 높이고 사고 예방을 위한 이색 홍보에 나섰다.경찰청은 한국도로공사 광주전남본부와 협업해 9월부터 전남 지역 18개 고속도로 휴게소에서 교통안전 메시지를 담은 AI 음악을 송출하는 홍보활동을 진행 중이라고 밝혔다.이번 캠페인은 인공지능 기술을 활용해 제작된 ...
역사왜곡
모바일 버전 바로가기