2012. 8. 3. 12:02ㆍWorking/IT 용어집
1. 메타데이터(metadata)란 무엇인가?
▶ 메타라는 말은 다른 단어들과 덧붙여 사용할 때 "among", "together", "after"라는 뜻을 가진다. 메타와 데이터가 합쳐져서 메타데이터가 되면 "데이터와 함께 다니는"의 뜻이 된다. 즉, 실제로 저장하고자 하는 데이터(예를 들면, 비디오, 오디오, 텍스트 등)는 아니지만, 이 데이터와 직접적으로 혹은 간접적으로 연관된 정보를 제공하는 데이터를 나타내는 말이다. 일반적으로 메타데이터를 정의할 때 가장 많이 사용되는 표현으로는 다음과 같은 것이 있다.
- 데이터에 대한 데이터
- 정보 자원을 설명하는 요소들의 모임
- 한 개체를 특성화하는 대리 레코드 (surrogate record)
▶ 메타데이터라는 말은 최근에 생성된 말이 아니며, 이미 수십 년 전부터 정보 과학(Information Science) 분야에서 다루어져 왔고, 최근에는 더욱 다양한 분야에서 사용되고 있는 용어이다. 메타데이터의 가장 쉬운 예를 들자면, 도서관의 카드 인덱스 카탈로그를 들 수 있다.(그림 참조) 도서관의 카드 인덱스 카탈로그에는 분류번호, 제목, 저자, 년도, 출판사 등 해당 도서에 대한 정보들이 수록되어 있는데 이 정보들이 바로 도서 데이터에 대한 메타데이터가 되는 것이다. 도서 데이터와 같은 텍스트 위주의 데이터뿐만 아니라 비디오, 오디오와 같이 저장하고자 하는 데이터의 형태가 다양해짐에 따라 메타데이터도 저자나 제목과 같이 간단한 형태가 아닌 저장 포맷, 코딩 기법, 재생 시간 등과 같이 다양해지고 있다.
▶ 메타데이터를 사용하면 위의 카드 인덱스 카탈로그의 예에서와 같이 메타데이터만 검색해도 사용자가 원하는 데이터가 맞는가를 확인할 수 있고, 잘 정리된 메타데이터를 이용하여 쉽고 빠르게 원하는 데이터를 찾아낼 수 있다. 그리고 데이터의 첨가나 삭제에 따라 메타데이터도 첨가, 삭제함으로써 메타데이터의 변경된 정보만을 검색해도 데이터의 상태를 파악할 수 있다. 이와 같이 데이터의 상태와 밀접하게 연관된 메타데이터를 사용함으로써 데이터를 소유하고 있는 측면에서는 관리의 용이성을, 데이터를 사용하고 있는 측면에서는 검색의 용이성을 보장받을 수 있기 때문에 메타데이터의 필요성이 더욱 높아지고 있다.
▶ 매일 많은 분량의 콘텐츠를 생성해내고, 다양한 정보를 확보해야 하는 방송 분야에서도 콘텐츠를 테이프나 디지털 포맷으로 저장할 때 관리의 용이성을 위해 이미 어느 정도 메타데이터를 사용하고 있다. 그러나 방송 프로그램을 디지털화하게 되면 같은 프로그램이라 하더라도 M-JPEG, MPEG-1, MPEG-2와 같이 압축 형식에 따른 하나 이상의 다른 미디어가 생성될 수 있고 복사로 인한 동일한 데이터가 여러 개 생성될 수 있기 때문에 이전의 데이터, 메타데이터처럼 일대일 대응 방식으로는 현 상황에 사용하기에 부적합하다. 또한 서로 다른 메타데이터 포맷으로 인해 다른 콘텐츠 제공자의 메타데이터를 활용하여 해당 데이터를 검색하기란 매우 어렵다. 예를 들면, "왕건"이란 미디어가 있을 때 KBS에서는 "프로그램 제목"이라는 항목으로 저장하고, BBC에서는 미디어의 제목을 "Main Title"이라는 항목으로 저장하여 관리했다면, BBC에서 "왕건" 미디어를 KBS의 아카이브에서 검색하고자 할 때 자신의 "Main Title" 항목을 사용하여 검색하면 해당 미디어를 찾을 수 없다. 따라서 메타데이터의 활용도가 높아질수록 밀접하게 데이터와 메타데이터를 연결시키고, 공통의 메타데이터 집합과 표기 방식을 제정하는 것은 필수적이다.
KBS 사이트에서 발췌