[일반]

[도서관이야기]미래를 예측하는 기술 빅데이터와 도서관 서비스


[도서관이야기]

미래를 예측하는 기술 빅데이터와 도서관 서비스

사회와 비즈니스 전 영역에 걸쳐 빅데이터가 활용되는 4차 산업혁명 시대.
전문가들은 빅데이터가 인터넷 이후 사회에 가장 큰 영향을 미칠 것으로 보고 있다. 도서관도 예외는 아니다. 빅데이터를 통해 이용자 및 지역 환경을 분석해 도서관의 효율성을 증가시키는 움직임이 활발하다.

데이터에서 숨겨진 가치를 찾다.
데이터는 디지털 환경에서 만들어지는 수치, 문자, 사진, 영상 등 모든 종류를 아우르는 대규모 데이터를 말한다. 엄밀하게는 데이터를 수집하고 저장해 그 안에 숨겨진 가치있는 패턴을 찾아내고, 이를 기반으로 미래를 예측하는 기술을 의미한다. 세계 유수의 기업들이 데이터 분석을 통해 생산성을 향상하고 새로운 비즈니스 모델을 모색하고 있으며, 기업뿐 아니라 경제, 문화 등 전 영역에서 활용 중이다.
빅데이터의 공통된 특징은 3V로 설명할 수 있다. 3V는 데이터 용량 (Volume), 데이터 속도(Velocity), 데이터의 다양성(Variety)을 나타내며, 이 세 가지 요소로 인해 빅데이터는 기존의 데이터베이스와 차별화된다. 먼저 데이터 크기(Volume)는 빅데이터의 가장 큰 특징인 물리적 양을 나타내며, 데이터 속도(Velocity)는 데이터의 고도화된 실시간 처리를 뜻한다. 마지막 다양성(Variety)은 다양한 형태의 데이터로 사진, 오디오, 비디오, 소셜 미디어 데이터 등 비정형 데이터도 포함된다.
세계적인 컨설팅 기관인 매켄지(Mckinsey)는 빅데이터를 두고 "기존 데이터베이스 관리 도구의 데이터 수집, 저장, 관리, 분석 역량을 넘어서는 규모로 앞으로도 계속 변화할 것”이라고 진단했다. 이처럼 빅데이터 분석을 통한 공공 부문 또는 비즈니스 마케팅의 성공 사례와 더불어 빅데이터를 이용한 소셜 네트워크 분석, 빅데이터의 근원을 찾고자 하는 연구까지 다양한 분야에서 활용하고 있다.

도서관에서 부는 빅데이터 바람
도서고나에서도 빅데이터를 활용하는 움직임이 활발하다. 이용자 분석을 비롯해, 이용자의 자료별 관심 부문, 페이지 분석, 유입 경로 분석 등은 물론, 사서의 의사 결정 지원 서비스(수서 추천 기능, 스마트 대시보드, GIS 현황판, 태그 클라우드), 이용자 도서 추천 서비스(맞춤형 추천, 프로파일링) 등에 활용한다.
실제 대전 가양도서관에서는 도서관에서 생산되는 데이터를 분석해 도서관을 가장 많이 찾는 이용자가 30~40대 기혼자임을 파악하고, 해당 이용자들이 선호하는 대출 분야는 자녀를 위한 어린이 도서라는 결과를 도출했따. 이후 어린이 도서 구입비를 늘려 효율적으로 장서를 구성하였고, 분석 결과를 토대로 독서문화 프로그램을 진행하여 이용자들로부터 큰 호응을 얻었다.



이처럼 빅데이터는 도서관 정보 자원 개발에 큰 영향을 미친다. 그중 이용자의 정보 요구는 알지만 구체적으로 어떤 주제를 어느 수준에 맞춰 정보 자원을 구비해야 하는가는 도서관의 가장 큰 숙제다. 이때 빅데이터 기술은 이용자가 필요한 주제별, 이용자벼르 사안별 정보 서비스 자료의 비치 및 제공에 대한 방향을 제시하고 신속하게 대응하는 데 중요한 지침이 된다. 또 공공돗더관 회원 분석, 장서 활용도 평가, 도서관 비교·분석 등을 통해 사서의 의사 결정 지원 시스템으로도 활용할 수 있다.

해외 도서관 빅데이터 활용 사례
빅데이터를 활용해 도서관에 지리 정보 시스템을 적용한 사례도 있다. 미국의 피어스 카운터 도서관(Pierce County Library), 오마하 공공도서관(Omaha Public Library), 덴버 공공도서관(Denver Public Library), 라스베이거스 클라크 카운티 도서관 지구(Las Vegas-Clark County Library District) 등 많은 도서관이 시빅 테크놀로지(CIVIC Technologies)의 웹 솔루션인 커뮤니티 커넥트(Community Connect)를 활용하고 있다. 커뮤니티 커넥트를 통해 해당 지역의 인구 통계 데이터를 분석함으로써 지역주민들의 관심사, 이용 요구, 이용자에게 적합한 서비스 등을 제공한다. 즉 이 웹 솔루션을 통해 도서관 장서 개발, 이용자 요구 분석, 신규 도서관 건립 위치 결정, 도서관 사서 인력 배치, 신규 프로그램 및 서비스 개발 등을 지원하고 있다.
미국 피츠버그에 위치한 카네기도서관(Carnegie Library)은 도서관 이용자에게 더 나은 서비스를 제공 하기 위해 '폴리시 맵(PolicyMap)'을 사용하고 있다. 해당 프로그램에 도서관 이용자의 데이터 또는 프로그램 정보를 업로드함으로써 연령별 특성, 교육 수준, 교통 접근성, 학교 성적, 직업, 가족 구성 등을 파악한다. 데이터 해석에 집중하여 도서관 이용자가 어디에 살고 있는지 시각화하고 그 지역의 인구학적 변화를 살펴보는 것이다.

한편, 유럽 디지털도서관 프로젝트 유로피아나(Europeana)에서는 모바일과 PC 이용의 로그 분석을 통해 도서관 이용자의 패턴을 분석한다. 이용자가 자주 사용하는 콘텐츠와 서비스, 주로 이용하는 시간, 이용자의 국적, 모바일 이용자와 PC 이용자의 비율, 이용 콘텐츠 비교, 유입 경로(검색엔진), 방문 이유, 이용 빈도 등은 물론 요일별, 시간대별, 체류 시간, 페이지뷰 등을 파악한다. 이를 통해 도서관 서비스 및 콘텐츠와 인프라를 강화하고 주민 지향의 도서관 정책을 수립할 수 있는 객관화된 정량적 데이터를 확보했다.
또 빅데이터는 서비스 대상 이용자에 따른 맞춤형 정보 서비스 계획에도 유용하다. 예컨대 이용자가 원하는 정보와 서비스 방향을 근거로 빅데이터를 활용하는 것이다. 싱가포르 국립도서관(National Library Board, NLB)에서는 빅데이터 기술을 활용하여, 많은 장서와 정보를 손쉽게 검색하여 이용자가 원활하게 이용할 수 있도록 도서 및 정보 자원 추천 서비스를 제공하고 있다. 또한 도서관 빅데이터 분석 결과를 바탕으로 데이터 기반의 도서관 운영 전략에 활용한다. 이러한 운영 방식은 생산성 높은 의사 결정, 더 나은 도서관 서비스 개발, 이용자 만족도가 향상될 것으로 예상하고 있다.

이용자 맞춤 프로그램 개발 앞당겨
이처러 도서관은 시대적 또는 사회적 요구에 따라 빅데이터를 활용한다. 이용자들이 도서관 서비스를 어떻게 이용하는지를 분석해주는 빅데이터 서비스의 경우, 이름과 나이, 주소, 이메일, 전화번호, 운전면허, 웹사이트와의 상호작용 등의 데이터를 분석하고, 이용자의 가정 수준(소득, 자녀 수, 거주 기간, 소비 습관, 취미, 미디어 사용 환경 등) 정보를 지도 형태로 제공해준다. 도서관 이용자의 행동을 추적함으로써 그들의 취향과 성향에 맞는 마케팅을 제공하고, 개개인이 원하는 프로그램에 따라 맞춤 서비스를 제공하는 것이다. 도서관에서 활용할 수 있는 대표적인 시스템으로는 오렌지 보이 사바나(OrangeBoy's Savannah), 게일의 온디맨트 분석(Gale's Analytics on Demand), OCLC의 지혜(OCLC's Wise)가 있다. 실제 퀸 앤스 카운터 도서관(Queen Anne's County Library, QACL)은 2017년 초, 3개년 도서관 전략 계획을 구축하였으며, 그 과정에서 성공 요소를 측정하기 위해 오렌지보이 사바나와 협력하여 해당 지역의 인구 특성과 지역적 특성 등의 자료를 수집·분석하여 전략적 계획을 수립하였다.
그런가 하면 많은 기관들이 도서관이 학업 성취도와 졸업률에 어떤 영향을 미치는지 알기 위해 전자도서관 자원 사용과 방문자 수 등을 추적하기도 한다. 대표적인 예는 영국 'Library Impact Data Project'로 대학생의 도서관 이용 실태와 학업 성취도의 상관관계를 통계적으로 입증한 사례다. 영국 정보시스템 위원회(Joint Information System Committee, JISC)의 지원 하에 영국 허더스필드대학이 6개월에 걸쳐 수행한 프 로젝트로, 영국 8개 대학 3만 3,074명을 대상으로 실시했다. 전자 자원 이용률, 도서 대출률, 도서관 방문 통계 분석을 통해 도서관 이용과 학력의 관계를 조사 하였고, 연구 결과 정보 자원 이용과 학위에 어떤 관계가 있는지 의미 있는 결과를 도출한 바 있다.



또 다른 사례로 머서대학(Mercer University)은 도서관이 학생들의 성공에 어떤 영향을 미치는지 이해하기 위해, 학생들의 전자 자원 사용을 추적하고 도서관 이용법을 분석하였다. 머서대학 도서관장 스콧 길리스 (Scott Gilies)는 빅데이터를 활용해 관리자들은 도서관의 가치를 명확히 하고 투자를 정당화하며, 학생들에게 지원하는 영역을 선별하는 데 도움을 준다고 언급했다. 단 학생들의 사생활을 보호하기 위해 머서대학의 사서들은 개별 학생의 검색 기록이 아닌 종합적인 사용 정보만을 보고한다.

빅데이터 활용에서 제기되는 문제

그러나 빅데이터의 생산성이나 활용성에 비롯되는 사회적 문제도 적지 않다. 도서관 정보 서비스에서 중점적으로 논의되어야 할 문제를 간략하게 살펴보면, 먼저 빅데이터 분석이 특정 시점, 사회적 맥락 속에서 수집된 각종 데이터를 바탕으로 이루어지기 때문에 분석 과정에서 주관성을 내포할 가능성이 있다. 그러므로 빅데이터 분석 결과의 객관성·정확성에 대한 판단에 문제가 생길 수 있다는 것을 염두에 두어야 한다.
다음으로 소셜 데이터의 경우 분석 방법이나 분석자의 잘못된 해석으로 데이터의 가치나 신뢰성에 문제가 생길 수 있다는 점이다. 또 빅데이터를 수집할 수 있는 사람이 한정적이기 때문에 발생하는 빅데이터의 제한적 접근성이 새로운 형태의 디지털 정보 격차를 만들 수 있다.
그 외에도 빅데이터 분석에서 사용되는 각종 테스트, 이미지 파일 등에 대한 소유권이나 지적 재산권에 대한 문제가 발생할 수 있으며, 빅데이터 분석에서 소셜 미디어뿐 아니라 CCTV 데이터 등이 이용되므로 빅데이터 보안 문제가 발생할 가능성도 배제할 수 없다. 빅데이터의 이용자 정보 분석은 개인 정보를 바탕으로 하며, 이는 제3자가 도서관 이용자 정보를 이용하고 접근할 수 있다는 것을 의미한다.
다양한 데이터셋을 활용하여 의사 결정을 추진하고, 도서관에서 수행한 작업을 체계적으로 분석하는 것은 매우 중요한 일이지만, 개인의 프라이버시를 보호하기 위해 세심한 주의를 기울여야 할 필요가 있다. 즉 도서관은 빅데이터 서비스 도입 시 발생할 수 있는 문제점을 감안하여 신중하게 접근해야 할 것이다.


/출처 : 도서관이야기 제13권 5호 통권 127호

자료조사및 번역 노지윤 건국대학교 지식콘텐츠 연구소 선임연구원

댓글 0건
작은도서관 회원 및 SNS계정을 통해 댓글을 남기실 수 있습니다.
0자 / 140자