이름, 주소 등 일정 형식 없는 개인정보도 자동 감지해 일괄 비식별화 및 원본 데이터 삭제

문서 AI 기업 이파피루스(대표 김정희)는 민감정보 비식별화 모듈 블랙마커(BlackMarker)의 성능을 업그레이드, 대표 제품인 PDF 스트리밍 뷰어 ‘스트림닥스(StreamDocs)’와 PDF 변환 솔루션 ‘피디에프 게이트웨이(PDF Gateway)’의 부가기능으로 제공한다고 18일 밝혔다.
이파피루스 자체 개발 모듈인 ‘블랙마커’는 PDF 문서에 포함된 민감정보를 찾아내고 마스킹(Masking) 처리한 후 원본 데이터를 삭제해 정보 유출 위험을 원천 차단한다.
이번 업그레이드를 통해 기존의 전화번호, 주민등록번호, 이메일과 같이 일정한 형식을 갖춘 정형화된 데이터는 물론 인명이나 주소와 같은 비정형 개인정보도 자동으로 감지해 일괄 비식별 처리할 수 있게 됐다.
이러한 성능 향상의 비결은 방대한 인명과 지명 데이터베이스를 기반으로 업그레이드한 비식별화 모델 덕분이다. 새로워진 블랙마커의 비식별화 모델은 규칙 기반 모델과 사전 기반 모델로 구성돼 있다. 문서를 업로드하면 텍스트 전처리 과정을 거친 후 두 모델이 각각 문서 내에 포함된 정형·비정형 개인정보를 인식해 비식별화한다.
블랙마커는 마스킹 처리된 부분에 원하는 텍스트나 특수문자가 표시되도록 설정하는 커스텀 기능을 지원한다. 서버 기반 자동 배치 처리 방식을 적용해 대량의 문서도 빠르고 안정적으로 비식별화한다.
이파피루스 김정아 부사장은 “AI를 활용한 비식별화 솔루션의 경우 기존 방식보다는 정확도가 높지만 고가의 GPU 서버 환경을 요구하기 때문에 고객 입장에서는 도입 비용 부담이 크다. 이파피루스 블랙마커는 메인보드에 내장된 일반적인 수준의 GPU를 그대로 사용하면서도 AI 비식별화 수준의 정확도를 구현, 비용 절감과 정보 보호 강화를 동시에 실현할 수 있다”고 말했다.
PDF 뷰어 스트림닥스에서 블랙마커 기능을 사용하면 문서를 업로드한 후 뷰어 내에서 직접 텍스트를 검색하거나, 영역을 지정해 마스킹 처리하거나, 이름 및 주소, 전화번호와 주민번호 등을 일괄 비식별화할 수 있다. 보안 처리된 문서는 파일 다운로드 없이 웹 브라우저에서 바로 열람할 수 있는 링크를 통해 공유할 수 있어 더욱 안전하고 편리하다.
PDF 변환 솔루션 피디에프 게이트웨이에서 사용할 경우 한글, MS오피스, 기타 다양한 포맷의 문서를 PDF 문서로 변환하면서 동시에 민감정보를 비식별화할 수 있다. API 커스텀을 통해 기관명이나 명사, 정규식 등 특정 데이터를 자동으로 마스킹 처리하는 것도 가능하다.
한편 이파피루스는 미국과 일본, 유럽 등 해외 자회사와의 협력을 통해 전자문서 솔루션 신기능 개발 및 성능 업그레이드를 지속적으로 진행하고 있다.
★정보보안 대표 미디어 데일리시큐 /Dailysecu, Korea's leading security media!★