본문 바로가기

Stray Notes

Tag : 새로운 분류 체계

이 포스트에서는 분류 체계의 혁명이라는 관점에서 태그(Tag)를 생각해보기로 한다.

사용자 삽입 이미지
출처: 위키백과

012

최근 많은 웹사이트가 태그를 지원하고 있습니다. 제가 자주 가는 사이트에서 볼 수 있는 태그입니다. 서핑을 즐기시는 분이라면 이런 태그를 많이 보셨을 거예요. 태그가 뭔지 감은 오시리라 생각합니다.

배경
현대를 살고 있는 많은 사람들이 과도한 정보에 숨막혀하고 있습니다. 정보의 홍수라는 말이 이를 대변한다고 하겠습니다. 이런 현상은 비단 정보화사회에 대한 학문적 논의에서만 이루어지는 것은 아닙니다.
한국의 대표적인 정보 검색 서비스인 네이버에서 지식인이나 세계적인 기업으로 발돋움하고 있는 구글(google)은 정보의 바다에서 자신이 필요한 정보를 찾아내기 위한 수단을 제공하고 있습니다. 그런데 인터넷의 발달과 함께 네트워크를 통해 접할 수 있는 정보의 데이터베이스가 비약적으로 커지고 있기 때문에 그 많은 정보에서 자신이 필요한 정보만을 찾아내는 것은 쉽지 않은 과제가 되었습니다.
저는 이 주제와도 관련이 있는 정확도(precision)과 재현율(recall)에 대한 정보를 찾기 위해 20번 이상 클릭을 해야했습니다. 요컨대, 필요한 정보와 그렇지 않은 정보들이 혼재되어있는 상황에서 "어떻게 하면 조금 더 손 쉽고 정확하고 빠르게 찾고자하는 정보에 접근할 수 있느냐"의 문제는 정보 폭발로 집약되는 현대 사회의 핵심적 이슈라고 해도 과언이 아닐 것입니다.

계층적 분류(Hierarchical Categorizing)
이러한 상황에서 Tag라는 것이 등장했습니다. 지금까지는 특정 사이트나 게시판에서 자료 검색은 내용이나 제목 작성자 등을 통해서만 가능했습니다. 이러한 방식은 자료를 분류(categorizing)하는 방식에 있어서 어떠한 자료가 하나의 분류에만 속할 수 있다는 한계를 가지고 있습니다. 폴더를 통한 데이터 분류가 갖는 한계와 같다고 할 수 있죠.
이러한 문제는 데이터를 관리할 때 제가 겪던 아주 심각한 문제였습니다. 음악 파일을 정리한다고 칩시다. 그것들을 분류하는 방식에는 여러가지가 있을 수 있습니다. 해당 곡의 아티스트별, 장르별, 앨범별, 앨범 발매 시기별 등등 다양하죠. 그런데 기존의 폴더라는 방식을 통해서는 동일한 위상에 있는 두가지 분류군에 속하게 하기가 쉽지 않았습니다. 가수 이적 3집 앨범을 예로 들면, 그의 앨범은 락(Rock)이라고 분류할 수도 있지만 동시에 발라드(Ballad)로 분류될 수도 있습니다. 장르의 두 하위 범주에 동시에 포함되고 있는 것입니다. 이럴 때 가능한 분류 방법이라고 해봐야 락이나 발라드 중 하나를 정하거나 같은 파일을 락과 발라드 폴더 두 곳에 모두 넣어놓는 것이 고작이었죠.
이글루스가 태그를 지원하지 않는다는 점은 제가 이글루스에서 이곳 티스토리로 이사한 가장 큰 이유 중의 하나이기도 합니다. 포스팅할 때 그 게시물을 어떤 카테고리에 포함시켜야하는가의 문제는 끊임없이 저를 괴롭혔습니다. 끊임없이 블로그의 카테고리를 합치고 나누고 바꾸다가 결국은 포기하고 말았습니다.

태그에 의한 분류(Tag-using Categorizing)
계층적 분류 방식의 위와 같은 한계들은 태그에 의한 분류 방식으로 상당 부분 해결될 수 있습니다. 태그는 하나의 개체가 여러 분류군에 묶일 수 있다는 장점을 내포하고 있습니다. 계층적 분류와 태그에 의한 분류의 차이를 요약하면 아래 그림과 같습니다.


사용자 삽입 이미지



한계
즉, 폴더나 디렉토리를 이용한 계층적 분류 방식은 데이터를 한가지 속성에 의해 분류해야한다는 한계가 있으며, 태그의 등장은 이러한 한계를 극복, 급증하는 데이터에 대한 체계적인 분류를 가능케 했습니다.이렇듯 태그 방식이 계층적 방식의 한계를 일부 극복해주긴 하였으나, 위의 그림에서 볼 수 있듯이 태그의 양이 많아지면 한 눈에 들어오지 않는다는 약점이 있습니다**. 또한 태그가 입력되지 않은 데이터값에는 태그로 접근할 수 없습니다. 이러한 한계들 때문에 데이터는 태그 뿐 아니라 계층적 분류 방식도 사용하여 분류하는 것이 효율적이라고 할 수 있습니다.

전망
현재 태그는 블로그나 인터넷커뮤니티 등에서 사용되고 있습니다. 앞으로 태그는 인터넷 검색이나 파일 브라우징 등 여러 곳에 사용될 수 있습니다. 인터넷 검색에서는 입력한 키워드와 관련된 태그를 검색 엔진에서 보여주는 방식으로, 파일 브라우징에서는 개별 컴퓨터 혹은 네트워크 상의 파일들에 태그를 달아 검색 시에 태그로 검색할 수 있도록 하는 방식이 있을 수 있습니다***.

* 태그의 등장과 구체적인 예는 위키백과를 참고해주세요
**때문에 최근에는 사용 빈도나 중요도에 따라 태그에 등급을 주는 방법을 많이 택하고 있습니다.
***현재 Mac OSX의 스팟라잇(Spotlight)이나 스마트 폴더(Smart Folder)기능은 태그 방식을 일부 지원하고 있습니다.