자연어 기반 인공지능 활용 산업분류 자동화 대회

〔중부매일 이병인 기자〕통계청(청장 류근관)은 데이터의 잠재적 가치를 제고하기 위해 통계 데이터의 새로운 활용 분야인 '통계데이터 인공지능 활용대회'를 개최한다고 밝혔다.

이번 활용대회는 통계청이 보유한 사업체 관련 자연어(투입물, 산출물, 생산활동 등) 데이터에 인공지능(AI) 기술을 적용하여 사업체를 산업분류별로 자동 분류하는 것으로

참가자는 자연어 기술 처리 및 인공지능 기반 산업분류 알고리즘을 작성하여 산업분류를 예측하게 된다.

통계자료의 정확성과 국가 간 비교성 확보를 위해 국제표준 분류를 기초로 산업, 직업, 질병, 사인 등 7종의 한국표준분류를 비롯하여 총 35종의 통계분류 체계를 작성, 운용하고 있다.

이 중에서, 한국표준산업분류는 경제분야 통계 작성의 기준으로 '22년 현재 국가통계 670여종에 적용되고, 150여개 법령에서 준용되고 있다.

한편, 통계청은 신속하고 정확한 통계분류를 통해 국가통계의 정확성과 효율성을 높이고자 '인공지능 기반 통계분류 자동화 시스템 구축 (통계개발원)'을 추진 중이다.

류근관 통계청장은 "통계데이터를 인공지능 기술 등 다양한 분야에 활용하는 전기가 되기를 기대한다"며 "우리 사회에 데이터 활용 문화가 정착되고, 데이터의 실질적 가치를 제고하는 계기가 될 것"이라고 밝혔다.

통계데이터 인공지능 활용대회는 인공지능 및 기계학습에 관심 있는 개인 혹은 팀(3명 이하)은 누구나 참가할 수 있다.

자연어 학습에 필요한 데이터(100만 건)는 코로나19 확산 방지와 참가자의 접근성 및 편의성을 높이기 위해 통계데이터센터 홈페이지를 통해 비대면 방식으로 제공한다.

참가 신청 기간은 3월 7일부터 3월 21일까지이며, 참가자는 최종 분석 결과물을 4월 13일까지 제출해야 한다.

키워드

#통계청
저작권자 © 중부매일 - 충청권 대표 뉴스 플랫폼 무단전재 및 재배포 금지