← 목록으로 돌아가기

야, 그 슬라이드 7번 말이야… 다들 헛다리 짚고 있었잖아? 🎤

아니, 솔직히 나도 잘 몰라서 그러는데… 다들 스노든 문서 터졌을 때 무슨 대단한 폭로라도 되는 양 호들갑 떨었잖아? 특히 그 프리즘 프로그램 슬라이드들 보면서 "NSA가 우리 데이터를 다 본대!" 이러면서 난리도 아니었는데, 정작 핵심은 아무도 제대로 안 보더라. 다들 메이저 언론에서 떠들어대는 거만 앵무새처럼 따라 하던데, 진짜배기는 딴 데 있었어.

데이터 분석가의 관점에서 본 NSA 프리즘 프로그램 슬라이드, 데이터 흐름과 메타데이터를 시각화한 복잡한 다이어그램, 디지털 감시, 정보 수집, 다크 웹, 데이터 보안, 데이터 사이언스, 익명성, 개인 정보 보호, 정보 전쟁

내가 봤을 때, 그놈의 슬라이드 7번 있잖아? "PRISM Collection Details"인가, 하여튼 그 제목 아래에 깔려 있던 진짜배기는 따로 있었어. 대다수 기사에서는 구글, 페이스북 같은 '제공자' 리스트만 줄줄이 읊었지, 정작 거기서 말하는 **`SIGINT metadata analysis latency`** 같은 기술적인 디테일이나 **`FISA Amendments Act 2008`**의 특정 조항, 그리고 그게 실제 데이터 수집 메커니즘에 어떻게 *결합*되는지까진 안 들어갔어. 그냥 "감시"라는 단어에만 꽂혀서 말이야.

난 말이야, 데이터 과학자 입장에서 그 슬라이드를 봤을 때 좀 다른 생각이 들었거든. 예를 들어, 특정 키워드, 가령 "Zero-Day Exploit Purchases" 같은 게 구글 트렌드에서 갑자기 튀어 오르는 시점하고, 실제 그 슬라이드에서 암시하는 데이터 수집의 *활성화 시차*를 매칭해 보려고 했어. 대개 언론은 폭로 시점에만 집중하지만, 나는 그 이전에 이미 시장에서 특정 기술이나 개념에 대한 검색이 폭증하는 패턴을 찾아냈거든. 이게 단순히 우연일까? 아니면 이미 뭔가 '준비'되고 있었던 걸까?

솔직히, 당시 언론에서 떠들던 "직접 서버 접근"이니 뭐니 하는 건 다 일차원적인 해석이었어. 슬라이드 7번이 진짜로 보여주려던 건, 특정 통신사의 **`Stellar Wind protocols`** 같은 기존 인프라와 어떻게 연동해서, *어떤 종류의 메타데이터*를, *어떤 주기*로 빨아들일 수 있었는지에 대한 암시였어. 그게 "직접 접근"이라고 포장된 기술적인 뉘앙스였지, 그냥 물리적으로 서버에 USB 꽂는 수준이 아니란 말이야.

이게 마치 말이야, 우리가 `마포 코인노래방 추천정보`를 찾을 때도 그렇잖아? 그냥 "시설 좋고 싸요" 이런 뻔한 정보 말고, "특정 시간대에 가면 에코가 기가 막히다"라거나 "여기 반주기 `TJ Media Ziller 2000` 버전 업데이트가 빠르다" 같은 진짜배기 정보는 따로 찾아야 하거든. 대부분은 겉핥기식으로만 알고 떠들고, 진짜 중요한 `DNI Directive 11/5/08` 같은 세부 지침이 어떻게 데이터 분석 시스템에 영향을 주는지 같은 건 관심도 없었어.

결국, 나는 이런 자료들을 보면서 늘 드는 생각이 있어. 세상은 우리가 생각하는 것보다 훨씬 복잡한 데이터 흐름으로 얽혀있고, 그걸 단순한 "음모론"이나 "폭로"로 치부하기엔 너무 많은 층위가 있다는 거지. 대중은 큰 그림만 보지만, 그 안에 숨겨진 진짜배기 데이터 분석의 맥락을 이해해야만 비로소 제대로 된 그림을 그릴 수 있는 거야. 물론, 나도 잘 몰라서 하는 소리지만.

함께 보면 좋은 정보