아카이브 기록에서 일상으로

아카이브는 고전적 정의에서 자유로워졌다. 더 이상 아카이브는 집단기억의 저장소가 아니다. 디지털 기술은 아카이브를 집단의 기억에서 ‘우리의 기억’으로 바꾸어놓았다. 국가가 곧 아카이비스트였던 디지털 시대 이전과 달리 개인이 그리고 기업이 기억의 기록자가 되는 시대에 진입한 것이다.

디지털 아카이브의 달라진 속성 : 결과에서 과정으로, 국가에서 개인으로

디지털 기술은 아카이브의 전통적 속성을 뒤집어놓았다. 먼저 기록의 목적이 달라졌다. 디지털 이전 시대 아카이브는 엘리트 집단 혹은 국가기구의 특정한 목적과 의도를 달성하기 위해 물리적 유산을 수집, 보관, 선택했다. 조선왕조실록은 조선 왕실 통치행위의 기록과 전달을, 국립중앙박물관의 대한 한민족의 역사 보전을 구성의 목적으로 삼았다. 구성의 주체는 소수의 집단으로 제한됐다.

아카이브의 구성 목적은 곧 이데올로기였다. 사고에 저장된 조선왕조실록이라는 아카이브는 조선의 통치 철학을 대변했고, 당대의 사관을 분류와 기록 등을 통해 맥략적으로 드러낸다. 국립중앙박물관은 서울 용산 이전 이후 동아시아 전시관을 분리시킴으로써 국가주의 이데올로기를 또렷하게 선전하고 있다(선승혜, 2007). 그래서 목적은 수집의 범위를 한계 지으면서 동시에 전시를 통해 그것의 가치를 표현하게 된다. 디지털 이전의 모든 아카이브는 목적이 곧 아카이브의 존재 증명이며 동시에 결과이기도 하다.

디지털 기술은 결과로서 고전적 아카이브를 거부하고 해체한다. 오히려 구성의 가능성에 문호를 열어둔다. 목적을 전제로 한 수집 행위가 희석되는 대신, 수집된 정보의 구성 혹은 재구성에 더 방점이 둔다. 물리적 아카이브가 목적 이외의 형태로 전환되기 어려운 결과형 아카이브라면 디지털 아카이브는 기획과 상상력에 따라 얼마든지 재구성, 재배열될 수 있는 과정형 아카이브가 된다.

검색은 아카이브의 출입구

디지털 기술은 개인이 일상의 아카이브를 구축하도록 돕는다. 여기에 검색이라는 기술적 장치가 개입한다. 일반적으로 검색은 그 자체가 아카이브의 출입구다. 검색은 그 하부에 방대한 데이터의 총체를 누적하고 있으며 사용자의 기획과 판단에 따라 수시로 아카이브를 일시에 구축했다 해체한다.

검색은 통상 두 가지의 중요한 절차를 거친다. 웹이라는 공간에 등록된 수억개 사이트에서 자료를 인덱싱한다. 그리고 사용자의 검색 쿼리 따라 수억개의 디지털 아카이브를 생성하고 배열한다.

인덱싱은 데이터의 수집(크롤링)과 조직화, 서열화(랭킹)로 구분할 수 있다. 디지털 이전 시대 수집과 저장, 분류를 단일 국가 기관이 통합적, 권위적으로 도맡았다면, 검색은 각 단계를 비인간이 수행한다.

또한 디지털 기술은 아카이브의 이 같은 구축 절차를 하나하나 분절시킨다. 의도의 주체를 다원화하고 수집을 자동화하며 보관의 무제한성을 강화한다. 뿐만 아니라 필터링으로 상징되는 선택의 범위를 다양화함으로써 유동적인 아카이브의 구성이 가능토록 했다. 전시는 랭킹 알고리즘이 대신한다. 수집에 관여하던 아카이비스트의 기획된 상상력은 디지털 시대로 오면서 보다 폭넓은 주체가 참여가 가능하도록 허락하고 있다.

이 과정에 새로운 아카이빙의 주체가 개입한다. 검색 사업자라는 기업이다. 엄격하게는 추적하면 기업이 설계한 알고리즘이 아카이비스트로 관여하게 된다. 웹에 게시된 모든 자료를 수집하고 조직적으로 저장하며, 전시하기 위해 의미를 부여하고 배열의 순서를 정리하는데 이 모든 작업이 알고리즘에 의해 수행된다. 이러한 기능을 제공하고 행위하는 가상 공간을 우리는 플랫폼이라고 할 수 있다.

검색 플랫폼은 가상의 물리적 공간에 비트로 분화된 데이터들이 체계적으로 쌓여갈 수 있도록 지원한다. 대신 이들은 개인 아카이브에 누적된 비트를 자유롭게 접근할 수 있으며 그들의 자본 축적 구조에 맞게 사용권을 갖게 된다. 가상의 공간과 사용권이 교환되는 구조인 셈이다. 다시 말하지만 이들 검색 플랫폼은 사용자들의 데이터에 자유롭게 접근할 권리를 취득하게 되며 향후 새로운 가상세계의 통제권을 획득하게 된다. 비약으로 보이는가.

주목해야 할 속성 : 공동 관리자로서 구글 포토

구글 포토와 검색 그리고 인공지능의 관계를 사례로 들여다보자. 구글 포토는 스마트폰에 저장된 모든 사용자의 사진 데이터를 생성과 동시에 자동 동기화한다. 구글 포토를 설치한 사용자는 자신도 모르게 구글의 클라우드에 사진 아카이브가 자동 생성된다는 사실을 발견하게 된다.

여기엔 ‘디폴트의 논리’가 개입한다. 구글 포토는 ‘동의’라는 이름으로 사용자의 아카이브를 자동으로 백업하는 데이터의 전유를 시도한다. 구글 포토에 저장된 복제된 이미지 기록물은 공개 이전에는 인공지능의 원료로 동원되고, 공개 이후 상태는 검색의 이미지 아카이브(클라우드)로 자동 편입된다.

이렇게 수집된 전세계 수많은 사용자들의 사진 아카이브는 궁극적으로 구글의 지능을 증강시키는데 동원된다. 구글의 이미지 인식 지능(Vision Recognition Algorithm)은 상상 이상의 사진 데이터를 수집함으로써 증대된다. 이른바 딥러닝의 학습 원료로서 개인들의 디지털 아카이브가 전유되는 결과를 가져오게 되는 것이다. 이를 통해 구글의 인공지능은 한층 정교해지고 상업적 가치를 더하게 된다.

구글 검색의 증대된 지능은 사용자들이 보고, 발견할 수 있는 모든 선택권들을 통제하게 된다. 그것이 맞춤형, 개인화라는 레토릭과 결합돼있지만 구글의 상업적 지배를 공고히 하는 논리에 궁극적으로 복속될 수밖에 없다.

검색 및 클라우드와 결합된 일상 아카이브의 흡수 규모는 지능의 진화 속도에서 차별을 발생시킨다. 얼마나 더 많은 데이터와 아카이브를 누적하느냐에 따라서 인공지능 알고리즘의 정밀도는 변화하게 되는 것이다. 글로벌 단위에서 수억명의 일상 아카이브를 흡수할 수 있는 구글과 국내 수천만명의 아카이브 접근이 가능한 네이버는 그래서 상업적 주도권에서 격차가 나타나게 될 수밖에 없는 것이다. 이를 ‘아카이브 자본주의’라고 부를 수 있을 것이다. 더 많은 아카이브를 흡수하고 누적할수록 지능의 진화속도가 더 빨라지고 시장 경쟁력에서 우위를 선점하는 결과를 낳는다는 점에서 그렇다.

데이터의 성격과 가치 그리고 아카이브

우리는 이제 디지털 아카이브를 이제 정치적으로 접근할 수 있는 관점을 가지게 됐다. 파스퀴넬리(Pasquinelli, 2016)가 설명하듯, 데이터베이스는 권력의 형태를 수학적으로 묘사한 것에 불과할 수도 있다. 인공지능과 같은 튜링 기계는 아카이브라는 데이터베이스에 축적된 정보를 통해 사회 패턴을 미분한 뒤 기록하고 지능화한다. 물론 기록과 기계 지능의 진화는 동시에 발생한다. 그것이 디지털 아카이브의 권력을 생산해내는 작동 기제다.

일상의 기록 즉 우리의 디지털화한 기억은 통제와 감시의 원료가 된다. 인공지능을 비롯한 머신러닝 알고리즘이 더 완벽한 통제를 위해 개선되고 향상되는데 기여한다. 심지어 머신러닝 알고리즘은 일상 아카이브의 학습 자료를 통해 ‘자율 관료제‘(Autonomous Bureaucracy)를 구축해 간다. 검색과 일상 아카이브의 결합이 만들어낼 현재 그리고 내일의 풍경인 셈이다.

참고 문헌

● 선승혜 (2007). 동아시아에서 전시와 이데올로기의 관계에 대하여. 현대미술학 논문집, (11), 137-165.
● Pasquinelli, M.(2016). The Spike: On the Growth and Form of Pattern Police. Nervous Systems