IT기업들 데이터 활용 수익창출
개인정보 누출 문제 지속적 고민
해결책 제시 기업이 패권 가질 것

▲ 이정혜 UNIST 산업공학과 교수 인공지능 기반 헬스케어 분야 연구
구글의 크롬, 애플의 사파리, 모질라의 파이어폭스, 마이크로소프트의 인터넷 익스플로러 등 웹 브라우저의 가장 큰 수입 원천 중 하나는 광고이다. 전세계 웹 브라우저 시장의 점유율 부문 압도적 1위 구글 크롬은 제3자 쿠키(서드파티 쿠키; Third-party cookie)를 활용해 광고주 또는 광고업체가 맞춤형 광고를 통해 수익을 창출할 수 있도록 지원해왔다. 쿠키는 쉽게 말해 인터넷 이용 시 웹 브라우저에 기록되는 사용자 데이터로, 웹 사이트 방문과 관련된 행동 정보가 기록되어 있다. 제3자 쿠키는 이용자가 방문한 해당 웹 사이트 내에서의 정보가 저장되는 자사 쿠키(First-party cookie)와는 달리 웹 사이트 운영자가 아닌 제3자가 설치한 쿠키를 의미한다.

제3자 쿠키는 그것에 대한 선택권과 통제권 문제와 더불어 사용자의 웹 서핑 내역을 추적할 수 있어 개인정보 누출에 대한 위험에 대한 문제가 지속적으로 제기되어 왔다. 이에 대한 대응으로 구글은 2020년 1월 제3자 쿠키를 중단하겠다는 결정을 내렸으며 2년의 유예기간을 거쳐 오는 2022년부터 본격적으로 제3자 쿠키를 제공하지 않겠다고 밝혔다.

구글은 대신 FloC이라는 새로운 기술을 제안하였는데 이는 Federated Learning of Cohorts의 줄임말로 한글로 번역하면 ‘코호트 연합학습’이다. 코호트는 공통적인 특성을 가진 사람들의 집단을 뜻하는 통계학 용어로, FloC은 개인의 웹 사이트 이용 정보를 연합학습을 통해 분석해 비슷한 사용자들을 군집화해 여러 코호트를 생성한 뒤 이들에 대한 코호트별 아이디(Cohort ID)를 부여하고 이를 광고 사업자들에게 제공하는 플랫폼이다. 즉 FloC은 개별 사용자를 거대 집단 속에 내포시켜 사용자의 개인 정보를 보호하면서도 광고 사업자들이 코호트별 맞춤형 광고를 제공하도록 돕는 도구로써 기능한다.

코호트와 함께 FloC을 구성하고 있는 또 하나의 키워드인 연합학습은 개인정보를 최대한 보호하면서 인공지능을 개발하는 방법론의 일환으로 구글에서 제안한 학습 방식이다. 분산된 데이터를 한 곳에 모아 모델을 학습시키는 것 대신 분산된 데이터를 통해 한번 또는 그 이상 계산된 모델 파라미터(parameter) 또는 모델 파라미터를 구성하는데 필요한 중간통계값(intermediate statistics)만을 서버에 공유해 모델을 학습한다.

연합학습은 원본 데이터를 직접적으로 전달하거나 공유하지 않으므로 프라이버시 이슈에 대한 대안으로 급부상했다. 이를 통해 민감한 데이터를 다루는 여러 분야의 데이터 전문가들은 데이터를 직접 공유하지 않고도 공유된 모델을 획득할 수 있게 되었으며 더 이상 분산되어 있는 데이터를 한 곳에 모으기 위한 노력을 하지 않아도 된다.

그러나 최근 연구에서 연합학습에 대한 중대한 약점이 보고되었는데 연합학습에서 주고 받는 모델 파라미터 또는 중간통계값을 통해서 원본 데이터를 복원할 수 있다는 것이 밝혀진 것이다. 이에 대한 해결책으로 차등개인정보(Differential Privacy)를 포함한 개인정보보호 기법 및 동형암호(Homomorphic Encryption)와 다자간 연산(Secure Multi-party Computation)을 포함한 보안 기술 등을 연합학습에 접목시키는 시도가 지속적으로 이루어지고 있다.

물론 FloC에 대해 제3자에 의한 쿠키 활용을 웹 브라우저로 이동해 온 것에 지나지 않는다는 비판과 맞춤형 광고 제공에 대한 그것의 실효성 및 위에서 간략히 언급한 연합학습으로 인한 프라이버시 누출 가능성에 대한 문제점이 지속적으로 제기되고는 있지만, FloC은 구글이 시민 단체의 간섭과 정부 규제로부터 자유로워질 수 있음과 동시에 자사의 수입 원천을 지켜나갈 수 있도록 해주는데 큰 역할을 할 것으로 전망되고 있다.

빅데이터와 인공지능으로 대변되는 4차 산업혁명시대에 데이터로 인한 개인정보누출 문제와 데이터를 활용한 수익 창출 사이에서 두 마리 토끼를 모두 잡을 수 있는 최고의 해결책을 제시하는 자는 누구이며 그 주도권을 누가 가질 것인지에 따라 IT 시장의 리더십이 재편될 가능성이 높다. 이에 대한 전세계 유수 IT 기업들의 귀추가 주목된다.

이정혜 UNIST 산업공학과 교수 인공지능 기반 헬스케어 분야 연구

 

저작권자 © 경상일보 무단전재 및 재배포 금지