[기고] 정광규 충북도교육정보원장

얼마 전 TV에서는 우리나라 업체가 필리핀에 수출한 쓰레기를 되가져오는 황당한 뉴스가 나오고, 인터넷에는 인도네시아의 해안가로 밀려온 죽은 고래를 해부해 뱃속에서 꺼낸 다량의 플라스틱 제품 사진이 올라와 있다. 고래는 먹이와 플라스틱을 구분하지 못하고 마구 먹어치우다가 아까운 생명까지 잃은 것으로 보이고 필리핀 쓰레기 불법 수출 문제는 재활용 산업 용재를 제대로 분류하여 보내지 않고 플라스틱, 비닐, 빈 캔, 종이 등등을 뒤죽박죽 섞여 있는 그대로 보내어 벌어진 일로 보인다.

우리는 흔히 인터넷을 정보의 바다라고 한다. 그러나 정확히 말하면 이는 적절치 않은 말이다. 아마도 적절한 말은 데이터의 바다라고 해야 할 것이다. 왜냐하면 인터넷에 떠도는 자료들은 마치 필리핀에 수출한 분류되지 않은 재활용 용재와 같아서 쓰레기와 다름없는 경우가 있다. 인터넷에 떠도는 자료 중의 일부는 검증되지 않은 것, 최신의 자료가 아닌 것, 의도적으로 가짜 뉴스로 만든 것 등등일 경우가 많기 때문이다. 그래서 인터넷에 떠도는 자료를 검증없이 무작정 사용했다가는 고래와 같이 목숨을 잃는 어려움을 겪을 수도 있다.

4차 산업혁명 시대를 말하는 단어 중 하나가 빅데이터이다. 빅데이터는 방대한 양의 자료를 뜻한다. 인공지능과 컴퓨터 통신의 발달은 우리 주변에 좋든 싫든 엄청난 양의 데이터를 인터넷이나 SNS에 만들어 낸다. 데이터의 바다인 것이다. 여기에 대비 없이 뛰어들었다가는 원인도 모르고 빠져 죽을 수도 있다. 데이터가 넘치는 4차 산업 시대에 살아남는 방법은 무엇일까?

어떤 사실들의 집합을 데이터(자료)라하고 이를 분류하여 쓸모 있게 분류하여 새로운 사실을 알게 되면 이를 정보라 한다. 자료가 정보가 되기 위해서는 자료에 대한 데이터가 잘 정리되어 있어야 하는데 이를 메타데이터라 한다. 데이터의 데이터라는 뜻으로 데이터들의 분류 기준들이라고 생각하면 된다. 빅데이터들은 적절한 메타데이터라는 체에 의해 분류될 수 있어야 유용한 정보로 재탄생할 수 있다. 예를 들자면 편의점에 물건을 사러오는 사람들을 데이터로 처리할 때 손님에게 오는 순서로 번호를 붙이면서 메타데이터를 함께 입력한다. 메타데이터로는 날짜, 시간, 성별, 나이(대략 몇십대 등으로), 구매 물품명, 수량, 금액 등등을 우선적으로 생각해 볼 수 있다. 이때 각각의 손님은 아무런 정보도 없는 자료에 불과하지만 이러한 자료가 수 만명에 이르면 빅데이터가 되고 이를 메타데이터를 활용하여 날짜를 이용한 계절별 구매 물품의 변화라든지, 시간별 손님의 수, 하루 또는 월별 매출의 양, 남녀 선호 물품의 종류, 편의점을 많이 오는 손님의 성별 등 수많은 새로운 정보들을 여기에서 얻을 수 있다. 이 정보들은 편의점의 성공적 운영을 위한 좋은 밑바탕이 된다.

정광규 충북교육정보원장.<br>
정광규 충북교육정보원장

빅데이터! 아무리 많은 자료도 메타데이터라는 체로 분류할 수 없으면 쓰레기더미와 다를 게 없다. 정보가 곧 돈이 되는 시대에는 빅데이터와 메타데이터를 더 많이 생각하는 사람이 살아남을 수 있다.

저작권자 © 중부매일 - 충청권 대표 뉴스 플랫폼 무단전재 및 재배포 금지