• 이글은 외부 Blog에도 작성된 글입니다 [1] (01/2004).

디지털 미디어의 빠른 성장 및 데이터베이스의 발전에 따라 이전에는 불가능 하거나 비효율적으로 느껴졌던 대용량의 자료도 손쉽게 저장할 수 있는 시대가 오고 있다. 이런 디지털 미디어 저장 및 검색에 관한 수요는 급진적으로 증가되고 있는데. 작년 중순 경 연구 협력 요청으로 방문 견학했던 GPTV(Georgia Public Television) 방송사의 경우250테라 바이트의 디지털 데이터 저장 장치를 구축한 후 지난 수십 년간의 아날로그 방송 테이프 및 관련 자료들을 모두 디지털 라이브러리로 변환 하여 웹상으로 서비스를 제공하고 있다. 하지만 실제 서비스를 제공하는 시점에서 부딪히는 문제는 어떤 메타 데이터를 기준으로 수백 테라 바이트의 자료들을 검색해서 제공하느냐는 것이다. 즉 신호처리 기술은 획기적으로 발전되고 있지만 어떤 심볼을 데이터로부터 추출해서 인간이 쉽게 의미학적으로 접근할 수 있는 도구는 절대 부족한 실정이다. 이는 현재의 인터넷 검색 방식이 아직도 키워드방식을 벗어나지 못하고 있는 것과 동일한 문제이다. Signal-to-Symbol Gap 이라고 흔히 불려지는 문제는 여러 학자들이 도전하고 있는 분야로 관련 논문들을 수집하였다

먼 저 데이터 수집 방식에 대한 참조 문헌으로 마이크로소프트사의 Gordon Bell은 수십 년째 자기와 관련된 모든 자료, 기사, 책, 카드, 편지, 메모, 음악, 논문 등 모든 자료를 모두 디지털로 변환하여 저장하고 있다. 첨부된 논문에는 가장 최근 수행중인 디지털 데이터 수집 과정과 검색 시스템 개발에 관련된 MyLifeBits 라는 프로젝트에 대한 설명이 있다. 두 번째로 본인의 연구그룹에서 제안된 이벤트 기준 경험처리 시스템(Event based Experiential Computing System)에 관한 논문으로 단체 회의에 경우에 대해 어떤 식으로 데이터를 수집하고 이벤트를 추출해서 사용자에게 보여주는 이론 및 과정에 대한 논문을 첨부 하였다.

원글: http://www.itchannel.org/icon/bbs_read.jsp?p_rec_no=0000002001&type=14&depart=1