텍스트 마이닝으로 경찰청 범죄기록 통계분석
유동인구 범죄율 상관성 입증ㆍ우범지역 공개
순찰 배치에 적극 활용...'안심맵' 통해 일반 공개

20일 이화여자고등학교 100주년 기념관에서 ‘R&D 기반 디지털 성범죄 피해방지 컨퍼런스’가 열렸다.(이재형 기자) 2019.6.20/그린포스트코리아
20일 이화여자고등학교 100주년 기념관에서 ‘R&D 기반 디지털 성범죄 피해방지 컨퍼런스’가 열렸다.(이재형 기자) 2019.6.20/그린포스트코리아

[그린포스트코리아 이재형 기자] 정부 주최 R&D 기반 디지털 성범죄 방지 컨퍼런스에서 경찰청이 빅데이터 기반 도촬 범죄지도 시스템을 공개했다. 시간, 장소 등 통계지표를 분석해 과학적인 치안 서비스를 제공한다.  

디지털 성범죄에 대응할 첨단 ICT 전략을 모색하는 ‘R&D 기반 디지털 성범죄 피해방지 컨퍼런스’가 20일 이화여자고등학교 100주년 기념관에서 열렸다. 디지털 성범죄에 대응하는 첨단 기술과 법‧제도적 방향성에 대해 논의하는 소통의 장이 열렸다.  

이날 행사는 1부에서 2019년 상반기 디지털 성범죄 피해방지 아이디어 및 R&D 기획 공모전 시상식, 2부 전문가 발표 및 패널 토론 순서로 진행됐다. 유영민 과학기술정보통신부 장관, 진선미 여성가족부 장관, 민갑룡 경찰청장 등 유관기관 인사들이 참석해 공모전 수상자들에게 감사와 축하의 메시지를 보냈다.   

2부에서는 경찰청과 한국전자통신연구원이 주제발표를 하고 빅데이터와 AI 기술로 구축한 디지털 성범죄 대응 전략을 공개했다. 

임흥규 경찰청 프로파일러가 경찰청-KT 빅데이터 시스템 '지오프로스'에 대해 설명하고 있다.(이재형 기자) 2019.6.20/그린포스트코리아
임흠규 경찰청 프로파일러가 경찰청-KT 빅데이터 시스템 '지오프로스'에 대해 설명하고 있다.(이재형 기자) 2019.6.20/그린포스트코리아

◇ 빅데이터 활용한 지하철 디지털 성범죄 예방 시스템

경찰청은 이날 유동인구가 많은 지하철 역을 중심으로 몰래카메라 범죄 우범 지역을 정리한 데이터베이스 ‘지오프로스(GeoPros)’을 공개했다.

지오프로스는 경찰청 프로파일러와 KT 데이터 전문가가 합작해 만든 빅데이터 범죄지도 시스템이다. 작년 과학기술정보통신부와 한국정보화진흥원이 추진한 ‘빅데이터 플래그십’의 공모사업이기도 하다.

양 기관은 ‘유동인구가 많을수록 몰카 범죄율이 높을 것이다’라는 가설을 세웠다. 이후 유동인구가 많은 지하철 역에서 발생한 범죄 기록을 기반으로 △내‧외부 범죄 데이터 수집 및 정제 △빅데이터 분석 및 Data Mart 구축 △데이터를 시각화한 GIS 플랫폼 구축 등 3단계로 지오프로스 개발을 진행했다. 

먼저 경찰청에 축적된 2017~2018년의 범죄 기록을 텍스트 마이닝(Text Minning)을 통해 데이터베이스로 만들었다. 텍스트 마이닝은 문서, 영상 등 비정형 데이터들을 문자데이터로 정형화하여 정보화 및 통계처리가 가능한 데이터 형식으로 바꾸는 것을 말한다.

이후 범죄 기록을 피해자 직업, 지역, 계절, 요일, 시간, 역 배후지 등의 지표로 정리하고 빅데이터 통계분석을 통해 어떤 변수가 도촬 범죄율의 주요 변수인지 도출했다.

분석 결과에 따르면 피해자 직업은 회사원이 30%로 가장 많았고 다음으로 무직(8%), 학생(7%), 미성년자(3%), 외국인(3%) 순이었다. 다만 통계처리가 불가능한 N/A(직업 기록 없음) 데이터가 48%에 달해 실제 피해자 직업 비중은 분석내용과 차이가 클 수 있다.

또 범행 도구는 98%가 휴대폰을 사용했으며 범행 보조 도구는 88%가 쓰지 않았던 것으로 분석됐다. 특히 9%는 무음 어플리케이션을 사용해 도촬 시 카메라 촬영음을 은폐했던 것으로 나타났다.

지오프로스 분석결과 유동인구가 증가하는 출퇴근 시간대에 범죄율이 뚜렷하게 높아졌다. 유동인구가 4만명인 아침 7시, 5만명인 오후 6시에 범죄 건수도 200건, 300건으로 치솟았다. 유동인구가 1만명인 오전 10시에는 50건으로 제일 낮았다. 단, 예외적으로 밤 9~11시에는 3만명 이하의 낮은 유동인구에도 불구하고 범죄건수가 200건 이상으로 높았다.   

지역별로는 상업 인프라나 사무실이 밀집한 지역에 인근한 지하철역에서 현격하게 범죄율이 높았다. 지하철 역수는 상업지역에 263개, 주거지역에 244개, 오피스지역 30개 순이었으며 범죄건수는 상업지역 2153개, 주거지역 685개, 오피스지역 302개 순이었다. 역 개수 당 범죄건수 비율은 상업지역 8.18, 주거지역 2.8, 오피스지역 10으로 주거지역에서 현격히 낮은 것으로 확인됐다.

경찰청과 KT는 분석 내용을 바탕으로 시각화를 진행해 몰래카메라 우범지역을 한눈에 확인할 수 있는 플랫폼으로 만들었다. 위험도를 5단계로 정의하고 지도에 색깔이 다른 픽토그램으로 표시했다. 

경찰청은 지오프로스를 내‧외부에 공개해 앞으로 보다 과학적인 치안서비스를 제공한다는 방침이다. 일선 경찰관들이 순찰시 참고해 보다 효율적으로 경찰력을 운용할 수 있도록 지원할 계획이다. 현재 인터넷 사이트 ‘안심맵’에 지오프로스 구축 자료를 공개하고 있어 일반인들도 이용할 수 있다.

임흠규 프로파일러는 “분석 결과 유난히 새로운 내용이 도출되진 않았다. 그러나 어렴풋한 상식을 과학적 통계분석을 통해 확인한 의의가 있다고 생각한다”며 “앞으로도 경찰청은 시민들이 보다 안심할 수 있는 치안 서비스를 제공하기 위해 ICT 기술을 적극 활용하겠다”고 말했다. 

silentrock91@greenpost.kr

저작권자 © 그린포스트코리아 무단전재 및 재배포 금지