검색 엔진 개인 정보 보호
Search engine privacy검색 엔진 프라이버시는 검색 엔진에 의해 수집되는 사용자 데이터를 다루는 인터넷 프라이버시의 하위 집합이다. 두 가지 유형의 프라이버시는 모두 정보 프라이버시의 산하에 속한다. 검색 엔진에 관한 프라이버시 우려는 검색엔진이 개별 검색 질의, 검색 내역, IP 주소, 사용자 쿠키를 기록할 수 있는 기능 등 여러 형태를 취할 수 있으며, 일반적으로 사용자 프로파일링을 실시할 수 있다. 검색엔진에 의한 사용자의 개인 식별 정보(PII) 수집을 「추적」이라고 한다.[1]
이것은 종종 검색 엔진들이 특정 사용자에게 더 나은 결과를 제공하고 사용자에게 더 나은 검색 경험을 제공하기 위해 사용자의 데이터를 수집한다고 주장하기 때문에 논란이 되고 있다. 하지만, 검색 엔진은 또한 광고주들에게 이익을 위해 그들의 데이터를 판매함으로써 사용자들의 사생활을 남용하고 손상시킬 수 있다.[1] 규제가 없는 경우 사용자는 검색 엔진 경험에 더 중요한 것, 즉 결과의 목적적합성, 속도 또는 개인 정보 등을 결정하고 그에 따라 검색 엔진을 선택해야 한다.[2]
사용자 프라이버시를 보호하기 위한 법적 프레임워크는 그리 견고하지 않다.[3] 가장 인기 있는 검색엔진은 개인정보를 수집하지만, 사생활에 초점을 맞춘 다른 검색엔진은 최근 들어 부쩍 늘었다. AOL이나 야후 같은 회사들과 함께 발생한 검색 엔진 사용자 사생활 침해는 잘 알려져 있다. 사생활 보호에 관심이 있는 개인에게는 사용자의 위치 및 개인정보를[4] 익명으로 만드는 토르와 같은 소프트웨어를 사용하거나 프라이버시 중심의 검색엔진을 사용하는 등 이용 가능한 옵션이 있다.
개인 정보 보호 정책
검색 엔진은 일반적으로 개인 정보 보호 정책을 발표하여 사용자에게 자신의 데이터가 수집될 수 있는 데이터와 해당 데이터가 어떤 용도로 사용될 수 있는지 알려준다. 이러한 정책들이 검색 엔진에 의한 투명성을 위한 시도일 수 있지만, 많은 사람들은 검색[5] 엔진에 의해 기록되고 보관될 수 있는 비밀번호나 저장된 파일과 같은 개인 정보의 양을 결코 읽지 않으며 따라서 얼마나 많은 정보를 쿠키로부터 수집하는지 알지 못한다.[6][7] 이것은 얼마나 많은 개인정보 보호정책이 구조화되었는지에 대한 통지와 동의의 현상과 관련이 있다.
통지 및 동의 정책은 기본적으로 사용자에게 개인 정보 보호 정책을 보여주고 동의하기 위해 클릭하도록 하는 사이트로 구성된다. 사용자가 자유롭게 진행 여부를 결정하고 웹사이트를 이용할 수 있도록 하기 위해서다. 그러나 이 결정은 선택 비용이 매우 높을 수 있기 때문에 실제로 그렇게 자유롭게 내려지지 않을 수도 있다.[8] 개인 정보 보호 정책을 사용자들 앞에 놓고 그들이 빨리 받아들이도록 하는 또 다른 큰 문제는 사용자가 읽기 어려운 경우라도 그들이 종종 매우 이해하기 어렵다는 것이다.[7] 덕덕고와 같은 프라이버시 마인드 검색 엔진은 개인 정보 보호 정책에 구글이나 야후와 같은 검색 엔진보다 훨씬 적은 데이터를 수집하고 어떤 데이터도 수집하지 않을 수 있다고 명시하고 있다.[9] 2008년 현재 검색 엔진은 개인 정보 보호 정책에서 정부 소환장을 준수한다고 명시하고 있지만 제3자에게 사용자 데이터를 판매하는 사업은 아니었다.[8]
구글과 야후
1998년 설립된 구글은 가장 널리 사용되는 검색 엔진으로 매달 수십억건씩 검색 질의를 받고 있다.[8] 구글은 모든 검색어를 검색 날짜와 시간, 브라우저와 운영체제, 사용자의 IP 주소, 구글 쿠키, 검색 엔진과 검색 질의를 보여주는 URL과 함께 데이터베이스에 기록한다.[10] 구글의 개인정보 보호정책은 사용자 데이터를 다양한 계열사, 자회사, '신뢰받는' 사업 파트너에게 전달한다는 내용을 담고 있다.[8]
1995년에 설립된 야후는 사용자 데이터도 수집한다. 사용자들이 야후!와 같이 매일 사용하는 서비스에 대해서도 개인정보 보호정책을 읽지 않는 것은 잘 알려진 사실이다. 메일과 지메일.[5] 소비자들이 이러한 개인 정보 보호 정책을 지속적으로 읽지 못하는 것은 그들에게 불리할 수 있다. 왜냐하면 그들은 개인 정보 보호 정책의 언어의 차이점을 이해하지는 못하지만, 법정 소송의 판사들은 분명히 그렇게 하기 때문이다.[5] 구글이나 야후 같은 검색엔진이나 이메일 회사가 개인정보 보호정책에서 광고를 하겠다고 선언하기 때문에 이메일 콘텐츠를 기반으로 광고를 타깃으로 하는 관행을 기술적으로 유지할 수 있다는 뜻이다.[5] 소비자들이 구글의 개인정보 보호정책, 특히 지메일, 그 세부사항에 얼마나 신경을 쓰는지 알아보기 위한 연구가 진행됐으며, 사용자들은 구글의 관행이 다소 거슬린다고 생각하지만, 사용자들은 사생활에 대한 프리미엄을 지불함으로써 이에 대응하려 하지 않는 경우가 많다고 판단했다.[5]
덕덕덕고
2008년에 설립된 덕덕고는 사생활에 초점을 맞췄다고 주장한다.[11][12] 덕덕덕고는 다른 검색엔진이 주로 기록·보존하는 IP 주소나 쿠키 등 사용자의 개인정보를 수집하거나 공유하지 않는다.[11] 또한 스팸을 포함하지 않으며, 사용자가 선택한 웹 사이트에서 검색 쿼리를 익명화하고 암호화를 사용함으로써 사용자의 프라이버시를 추가로 보호한다.[11] 마찬가지로 개인 정보 지향 검색 엔진에는 시작 페이지와 연결 끊기가 포함된다.[12]
검색 엔진에서 수집된 데이터 유형
대부분의 검색 엔진은 자신의 개인 정보 보호 정책에 따라 사용자의[1] 개인 정보를 수집할 수 있고 수집할 수 있다. 이 사용자 데이터는 위치 정보에서 쿠키, IP 주소, 검색 쿼리 기록, 클릭 기록 및 온라인 지문에 이르는 모든 것이 될 수 있다.[2][6][13][14] 이 데이터는 종종 큰 데이터베이스에 저장되며, 사용자는 익명성을 제공하기 위해 번호를 할당할 수 있다.
데이터는 장기간 저장할 수 있다. 예를 들어 구글이 사용자들을 대상으로 수집한 데이터는 최대 9개월 동안 보존된다.[15][16] 몇몇 연구들은 이 숫자가 실제로 18개월이라고 말한다.[17] 이 데이터는 사용자에 대한 검색 결과 최적화 및 개인화, 광고 대상화,[8] 사기 및 피싱 공격으로부터 사용자 보호 등 다양한 이유로 사용된다.[2] 이러한 데이터는 사용자가 자신의 계정에 로그인하지 않았거나 쿠키를 사용하여 다른 IP 주소를 사용하는 경우에도 수집할 수 있다.[8]
사용하다
사용자 프로파일링 및 개인화
검색 엔진이 사용자 습관에 대한 정보를 수집한 후 자주 하는 일은 검색 엔진의 프로필을 만드는 것이다. 검색 엔진은 사용자가 제출한 다른 검색 질의에 대해 표시할 링크나 사용자를 대상으로 할 광고를 결정하는 데 도움이 된다.[13] 이 분야에서 흥미로운 발전은 기계학습이라고도 알려진 자동학습의 발명이다. 이를 통해 검색 엔진은 사용자에게 제공되는 결과에 대한 A/B 테스트를 수행하고 사용자의 반응을 측정하여 해당 사용자가 클릭하고자 하는 내용을 보다 정확하게 예측하도록 프로파일링 모델을 세분화할 수 있다.[18]
구글, 넷플릭스, 유튜브, 아마존과 같은 회사들은 모두 점점 더 결과를 개인화 하기 시작했다. 구글 스콜라(Google Scholar)가 관련성이 있다고 판단되는 결과를 내기 위해 사용자의 출판 이력을 어떻게 고려하는지가 대표적인 예다.[1] 개인화는 아마존이 책을 추천할 때나 IMDb가 이전에 수집한 사용자 정보를 이용해 영화를 추천할 때도 일어난다.[18] 개인화가 일어나기 위해서, 사용자는 그들의 계정에 로그인할 필요가 없다.[4]
타겟광고
광고주들이 특정 광고의 이용자를 공략하도록 돕는 인터넷 광고회사 더블클릭은 2008년 구글이 인수해 2018년 6월까지 자회사로 있다가 구글이 더블클릭을 자사 구글 마케팅플랫폼에 리브랜딩·합병했다. 더블클릭은 더블클릭 광고를 싣고 방문한 사이트를 추적할 수 있는 쿠키를 사용자 컴퓨터에 저장해 두는 방식으로 작동했다.[10] 구글이 더블클릭을 인수하는 과정에서 구글이 검색 질의에 대한 데이터를 수집하고 추가로 방문한 웹사이트를 추적하기 때문에 구글이 훨씬 더 포괄적인 사용자 프로필을 만들 수 있다는 개인 정보 보호 문제가 있었다.[10] 이것은 사용자들로 하여금 행동 타겟팅의 사용으로 점점 더 효과적인 광고를 보게 할 수 있다.[17] 더 효과적인 광고와 함께 소비자들로부터 그들이 다른 방법으로 하지 않았을 수 있는 더 많은 구매의 가능성이 생겨난다. 1994년, 광고 판매와 검색 엔진에서의 결과의 관련성 사이의 갈등이 시작되었다. 이는 이미 만들어진 우유당 비용 모델의 방식에 도전장을 던진 클릭당 비용 모델이 개발되면서 촉발되었다. 클릭당 비용 방식은 사용자가 검색한 내용과 직접적인 관련이 있는 반면, 우유당 비용 방식은 사람들이 아무리 많이 상호작용을 하더라도 기업이 광고에 얼마를 지불할 수 있느냐에 따라 직접적인 영향을 받았다.[16][clarification needed]
검색 품질 향상
구글은 광고 타겟팅과 개인화 외에도 검색 품질을 높이기 위해 사용자들을 대상으로 수집한 데이터를 활용한다. 검색 결과 클릭 이력과 조회 로그는 검색 엔진이 개별 사용자를 위해 검색 결과를 최적화하는 데 매우 중요하다.[2] 검색 로그는 구글의 잘 알려진 페이지랭크와 같이 검색 엔진들이 결과를 반환하는 데 사용하는 알고리즘 개발에도 도움을 준다.[2] 구글이 정보의 데이터베이스를 활용해 구글 스펠 체커를 정교하게 다듬는 것이 그 예다.[8]
개인 정보 보호 조직
이용자 프로파일링은 이용자 프라이버시의 심각한 침해라고 믿는 사람들이 많고, 이용자 프라이버시 권리를 옹호하는 데 초점을 맞춘 전자 프라이버시 정보센터(EPIC)나 프라이버시 인터내셔널 등의 조직도 있다.[2][8] 실제로 EPIC는 2007년 사용자 프라이버시를 침해한다는 이유로 구글이 더블클릭을 인수할 수 없어야 한다며 연방무역위원회에 제소했다.[8]
프라이버시에 대한 사용자의 인식
개인정보보호 등급을 검색엔진과 통합해 유통업체의 개인정보 보호에 관한 정보가 주어졌을 때 소비자 행동을 살피는 실험이 이뤄졌다.[19] 연구자들은 '개인정보 검색기'라는 치료 그룹의 검색엔진을 이용했는데, 이 검색엔진은 웹사이트를 스캔하고 자동으로 아이콘을 생성해 소비자가 선호하는 개인정보 보호정책과 비교해 사이트가 소비자에게 제공할 개인정보 보호수준을 보여준다. 실험 결과는 치료 그룹의 피실험자들, 즉 웹사이트의 사생활 수준을 나타내는 검색 엔진을 사용하는 사람들이 그들에게 더 높은 수준의 프라이버시를 주는 웹사이트로부터 제품을 구매한 반면 대조군 그룹 참가자들은 단순히 가장 싼 제품을 선택했다.[19] 연구 참가자들은 또한 구매로부터 남은 돈을 보관할 수 있기 때문에 재정적인 인센티브를 받았다. 이 연구는 참여자들이 자신의 신용카드를 사용해야 했기 때문에, 그들이 원하는 수준의 프라이버시를 제공하지 않는 사이트에서 제품을 구매하는 것을 상당히 싫어한다는 것을 제시하는데, 이것은 소비자들이 그들의 프라이버시를 금전적으로 가치 있게 여긴다는 것을 보여준다.
윤리 논쟁
많은 개인과 학자들은 검색 엔진 사생활에 관한 윤리적 우려를 인식했다.
프로 데이터 수집
검색엔진에 의한 사용자 데이터 수집은 검색엔진이 결과를 개인화할 수 있도록 하기 때문에 긍정적인 관행으로 볼 수 있다.[2] 이는 사용자가 과거 검색 질의, 위치 정보, 클릭과 같은 데이터를 사용하여 프로필을 만들 때 보다 목적적합한 결과를 수신하고 보다 목적적합한 광고가 표시된다는 것을 의미한다. 또한, 검색 엔진은 일반적으로 사용자들에게 무료로 제공되며, 그들의 주요 수입원 중 하나가 광고이기 때문에 여전히 인기를 유지할 수 있다.[2] 광고는 목표할 때 더 효과적일 수 있다.
안티 데이터 수집
이러한 사용자 데이터의 수집은 또한 민간 기업이 자신의 재정적 이익을 위해 과민반응하거나 침입 감시 전술로 볼 수 있다. 검색 엔진은 광고주들이 가장 수용적인 소비자들에게 그들의 광고를 보여주기 위해 기꺼이 프리미엄을 지불하기 때문에 표적 광고를 사용하여 돈을 벌 수 있다. 또한 검색엔진이 사용자들에 대한 대량의 데이터를 수집하고 카탈로그를 만들 때 실수로 유출되거나 침해될 가능성이 있다. 정부는 또한 검색 엔진의 사용자 데이터가 데이터베이스로 있을 때 그들을 소환할 수 있다.[3] 검색 질의 데이터베이스 정보는 또한 이혼이나 고용 분쟁과 같은 민사 소송에서 사용하기 위해 개인 소송 당사자들에 의해 소환될 수 있다.[8]
데이터 및 개인 정보 침해
AOL 검색 데이터 누출
검색 엔진 프라이버시와 관련된 한 가지 큰 논쟁은 2006년의 AOL 검색 데이터 유출이었다. 학술 및 연구를 위해 AOL은 약 65만 명의 고유 사용자가 작성한 약 2000만 건의 검색 질의 목록을 공개했다.[17] 조회 때마다 이름을 붙이는 대신 고유 식별번호를 부여했지만, 주변 위치와 친구·가족 이름 등 검색한 내용을 분석하는 것만으로도 많은 이용자들의 실체를 확인할 수 있었다.[13][17] 이 중 주목할 만한 예가 뉴욕타임스가 '역탐색'[8][17]을 통해 텔마 아놀드를 파악한 방법이다. 사용자들은 또한 때때로 인터넷에 있는 자신에 대한 정보를 보기 위해 스스로 검색하는 "ego 검색"을 하는데, 이것은 아마도 익명의 사용자들을 식별하는 것을 훨씬 더 쉽게 만든다.[8] AOL이 공개한 검색 질의 중 상당수는 '아내 살해 방법', '자살 시도 후 입양이 가능하다'[8] 등 죄질이 나쁘거나 지극히 사적으로 보이는 경우가 많았다. 이 데이터는 이후 사용자 개인 정보 보호 솔루션의 효과를 측정하려는 여러 실험에서 사용되어 왔다.[1][20]
구글과 야후
구글과 야후 모두 2010년 중국 해킹의 대상이었다.[21] 구글이 사이버 보안 엔지니어를 새로 채용하고 사용자 데이터 확보에 집중 투자하는 등 심각하게 대응한 반면 야후는 훨씬 느슨한 접근법을 취했다.[21] 구글은 2010년부터 취약점을 찾기 위해 해커들에게 돈을 지불하기 시작했고, 야후는 2013년까지 그 뒤를 따랐다.[21] Snowden 데이터 유출 사건에서도 야후는 여러 나라의 스파이들을 위한 일반적인 해킹 대상으로 확인되었으며, 야후는 여전히 회사 내에서 변화를 실제로 일으킬 수 있는 자원을 새로 고용한 최고 정보 보안 책임자에게 주지 않았다.[21] 2012년 야후는 기존 구글 직원이었던 마리사 메이어를 신임 CEO로 영입했지만 야후의 보안 인프라에 크게 투자하지 않는 쪽을 택했고, 위반 후 모든 비밀번호를 강제로 재설정하도록 하는 기본적이고 표준적인 보안 조치의 이행을 거부하는 데까지 이르렀다.[21]
야후는 많은 양의 사용자 데이터를 침해한 여러 침해와 해킹의 주체로 알려져 있다. 2016년 말 현재 야후는 2013년과 2014년 동안 최소 15억 개의 사용자 계정이 침해되었다고 발표했다.[21] 2013년 위반은 10억 개 이상의 계정을 침해한 반면 2014년 위반은 약 5억 개의 계정을 포함했다.[21] 위반 시 노출된 데이터에는 전화번호, 이메일 주소, 생년월일 등 개인 식별 가능 정보와 보안 질문(비밀번호 재설정 시 사용) 및 암호화된 비밀번호가 포함되었다.[21] 야후는 이들의 침해가 국가 후원 배우들의 결과라는 성명을 냈고, 2017년 러시아 정보관 2명이 야후 해킹과 사용자 데이터 도용 음모의 일환으로 미 법무부에 기소됐다.[21] 2016년 기준, 2013년과 2014년의 야후 침해가 역대 최대 규모다.[21]
2018년 10월 구글플러스 데이터 침해 사건이 발생해 약 50만 개의 계좌에 잠재적으로 영향을 미쳐 구글플러스 플랫폼이 폐쇄됐다.[22]
정부 소환 자료
정부는 어떤 이유로든 검색엔진에서 사용자 데이터를 소환하기를 원할 수 있으며, 이것이 사용자 사생활에 큰 위협이 되는 이유다.[2] 2006년에는 COPA 방어의 일환으로 이를 원했고, 구글만 이를 거부했다.[8] 아이들의 온라인 프라이버시를 보호하는 것이 명예로운 목표일 수도 있지만, 그것을 달성하기 위해 정부가 그러한 개인 데이터에 접근해야 하는지에 대한 우려가 있다. 다른 때, 그들은 국가 안보를 위해 그것을 원할지도 모른다; 테러리스트의 공격을 막기 위해 검색 질의의 큰 데이터베이스에 접근하는 것은 이것의 일반적인 예다.[3][14]
이유가 무엇이든, 검색 엔진이 사용자 데이터의 데이터베이스를 만들고 유지한다는 사실이 정부가 그것에 접근할 수 있게 만드는 이유임이 분명하다.[2] 검색엔진 사용자 데이터에 대한 정부의 접근과 관련된 또 다른 우려는 "기능 크리프"인데, 이것은 국가 안보를 위해 원래 수집된 데이터가 결국 부채 수집과 같은 다른 목적으로 사용될 수 있는 방법을 말한다.[8] 이것은 많은 정부에게 과민반응을 나타낼 것이다. 최근 검색 엔진 사용자의 사생활 보호를 위한 보호가 개발되기 시작했지만, 정부는 검색 엔진의 데이터 보존을 위해 사용자들의 보호가 약해지고, 사용자들이 소환할 수 있도록 그들의 데이터를 더 많이 이용할 수 있도록 하는 쪽으로 점점 더 나아가고 있다.[8]
프라이버시 향상 방법
검색 엔진 전환
비록 유명하긴 하지만 프라이버시 중심 사용자가 취할 수 있는 다른 방법은 DuckDuckGo와 같은 프라이버시 지향 검색 엔진을 사용하는 것이다. 이 검색 엔진은 사용자 데이터를 수집하거나 추적하지 않음으로써 사용자의 프라이버시를 유지한다.[11] 이것이 단순하게 들릴 수도 있지만, 사용자들은 검색 엔진을 바꾸기로 결정할 때 사생활과 관련 결과 사이의 절충을 고려해야 한다. 검색 엔진에 개인 설정에서 도움이 되는 검색 기록이 없는 경우 검색 질의 결과는 매우 다를 수 있다.
개인 정보 지향 브라우저 사용
모질라는 파이어폭스에서 사용자 프라이버시를 보호하려는 신념으로 알려져 있다. 모질라 파이어폭스 사용자들은 구글이 컴퓨터에 배치한 추적 쿠키를 삭제할 수 있어 구글이 데이터를 그룹화하기 훨씬 더 어려워졌다.[2] 파이어폭스는 또한 "개인 데이터 지우기"[2]라는 버튼이 있어 사용자가 설정을 더 잘 제어할 수 있다. Internet Explorer 사용자들도 이 옵션을 가지고 있다. 구글 크롬이나 사파리 같은 브라우저를 사용할 때, 사용자들은 각각 "익명" 또는 "개인 브라우징" 모드에서 브라우징할 수 있는 옵션도 가지고 있다. 이러한 모드에서 사용자의 검색 기록과 쿠키는 수집되지 않는다.[2]
선택 취소
구글, 야후!, AOL, MSN 검색 엔진은 모두 사용자들이 그들이 사용하는 행동에서 벗어날 수 있게 해준다.[2] 사용자는 언제든지 검색 및 검색 기록을 삭제할 수 있다. Ask.com 검색 엔진은 또한 AskEraser를 가지고 있는데, 이 시스템을 사용할 때, 사용자 데이터를 그들의 서버에서 정리한다.[2] 검색 엔진 로그에서 사용자의 프로필과 데이터 기록을 삭제하는 것은 정부 기관이 소환하기를 원하는 경우 사용자의 프라이버시를 보호하는 데 도움이 된다. 기록이 없으면 정부가 접근할 수 있는 게 없다. 단순히 검색 기록을 삭제한다고 검색 엔진이 가지고 있는 모든 정보가 삭제되는 것은 아니며, 일부 회사는 검색 기록을 삭제할 때 계정과 관련된 데이터를 삭제하지 않는다는 점에 유의해야 한다. 사용자 데이터를 삭제하는 회사의 경우 일반적으로 검색 엔진 사용 방법에 대한 기록을 보관하는 모든 데이터를 삭제하지는 않는다.[23]
소셜 네트워크 솔루션
비에조와 카스텔라로카 연구원이 제안한 혁신적인 솔루션은 사용자 프로필이 왜곡되는 소셜 네트워크 솔루션이다.[15] 그들의 계획에서, 각 사용자는 검색 엔진을 사용하는 사람들의 그룹 또는 네트워크에 속할 것이다. 누군가가 검색 질의를 제출하고 싶을 때마다, 누군가가 질의를 제출할 때까지 그들을 대신해서 제출하는 것이 그룹의 다른 구성원에게 전달된다. 이것은 이상적으로 모든 검색 질의가 네트워크의 모든 구성원들 사이에서 균등하게 분할되도록 할 것이다. 이렇게 하면 검색 엔진은 각 사용자에게 실제로 어떤 쿼리가 속해 있는지 식별할 수 없기 때문에 그룹의 개별 사용자에 대한 유용한 프로필을 만들 수 없다.
상장폐지 및 재주문
구글 스페인 대 AEPD 사건 이후, 사람들은 검색 엔진이 다른 유럽 데이터 보호 규정을 준수하여 검색 결과에서 개인 정보를 삭제하도록 요청할 권리가 있다는 것이 밝혀졌다. 단순히 특정 검색 결과를 제거하는 이 과정을 디리스트링이라고 한다.[24] 검색엔진을 사용하는 사람이 자신들에 대한 정보를 접근하지 않기를 바라는 사람들의 프라이버시를 보호하는 데 효과적이지만, 그렇다고 반드시 검색결과의 상황적 무결성을 보호하는 것은 아니다.[24] 매우 민감하거나 타협적이지 않은 데이터의 경우, 검색 결과의 순서를 바꾸는 것은 사람들이 특정 시점의 특정 데이터가 얼마나 적절한지 순위를 매길 수 있는 또 다른 선택사항이며, 이것은 누군가가 자신의 이름을 검색할 때 주어진 결과를 바꿀 것이다.[24]
익명성 네트워크
프라이버시 마인드를 가진 사용자들을 위한 일종의 DIY 옵션은 익명성 네트워크인 토르와 같은 소프트웨어를 사용하는 것이다. 토르는 사용자 데이터를 암호화하고 수천 개의 릴레이를 통해 쿼리를 라우팅하여 기능한다. 이 프로세스는 IP 주소를 마스킹하는 데 효과적이지만 결과 속도를 늦출 수 있다.[2] 토르가 IP 주소를 가리는 작업을 할 수도 있지만, 모의 공격자 소프트웨어가 토르를 사용하여 익명화해도 여전히 검색 쿼리를 사용자와 일치시킬 수 있다는 연구도 있었다.[25][26]
연결성 및 식별 불가능
사용자들이 검색 질의에서 실제로 익명성을 제공하는 데 다소 비효율적이라는 것이 증명되었지만, 연결 불가능과 구별할 수 없는 것은 검색 엔진 프라이버시에 대한 잘 알려진 해결책이기도 하다.[25] 연결 불가능한 솔루션과 구별 불가능한 솔루션 모두 검색 쿼리를 만든 사용자로부터 익명화를 시도하기 때문에 검색 엔진이 특정 쿼리를 특정 사용자와 명확하게 연결하고 검색에 유용한 프로필을 만드는 것을 불가능하게 만든다. 이것은 몇 가지 다른 방법으로 행해질 수 있다.
연결성 해제
사용자가 자신의 IP 주소와 같은 정보를 검색 엔진에서 숨길 수 있는 또 다른 방법, 즉 연결성이 없는 솔루션이다. 이는 VPN을 사용하여 이 작업을 수행할 수 있기 때문에 사용자에게 더 간단하고 쉬운 것일 수 있지만, VPN은 여전히 검색 엔진으로부터 완전한 개인 정보를 보장하지는 않는다.[25]
구별할 수 없음
한 가지 방법은 사용자가 만드는 모든 실제 검색 쿼리에 대해 여러 개의 서로 다른 검색 쿼리를 생성하는 플러그인 또는 소프트웨어를 사용하는 것이다.[25] 이것은 구별하기 어려운 솔루션으로, 검색엔진이 어떤 쿼리가 소프트웨어인지, 어떤 것이 사용자의 것인지 알 수 없도록 사용자가 하는 실제 검색을 가려냄으로써 기능한다.[25] 그렇다면 검색엔진이 사용자에게 수집한 데이터를 표적 광고 같은 것을 하기 위해 사용하는 것이 더 어렵다.
법적 권리 및 법원 사건
인터넷과 검색엔진은 비교적 최근의 창조물이기 때문에 검색엔진 측면에서 프라이버시 보호를 위한 확실한 법적 프레임워크는 마련되지 않았다. 그러나, 학자들은 검색 엔진 사용자들이 어떤 권리를 가지고 있는지 알리기 위해 일반적으로 사생활에 대한 기존 법률의 영향에 대해 쓴다. 이것은 발전하는 법 분야인 만큼, 개인 정보 검색 엔진과 관련하여 사용자들에게 제공될 것으로 기대되는 소송이 여러 번 있었다.
미국
수정헌법 제4조
수정헌법 제4조는 시민들에게 불합리한 수색과 발작으로부터 보호해 주는 것으로 잘 알려져 있지만, 캣츠 대 미국 (1967년)에서는 이러한 보호조치가 단순히 재산과 사람의 침입에 더하여 개인의 사생활 침해에까지 확대되었다.[3] 개인의 프라이버시는 넓은 용어지만 개인의 온라인 프라이버시를 포함한다고 상상하는 것은 어렵지 않다.
수정헌법 제6조
개정 제6조의 대립 조항은 정부 감시로부터 빅데이터를 보호하는 데 적용된다.[14] 대립조항은 기본적으로 형사사건의 피고인은 증언성명을 제공하는 증인과 대질할 권리가 있다고 명시하고 있다.[14] 구글과 같은 검색엔진 업체가 정부에 고발 정보를 주면 정부에 넘겨줄 자료를 선별하는 과정에 관여한 구글 직원들이다. 대립조항에 따라 맞닥뜨릴 수 있어야 할 특정 직원은 어떤 데이터가 적절한지 결정하고 정부에 요청한 내용을 제공하는 생산자, 데이터의 적절한 수집과 전송을 인증하는 구글 분석가, 기록을 보관하는 관리인이다.[14] 구글 직원들이 시험 사용을 위해 큐레이팅한 데이터는 그 후 추천 진술로 간주된다.[14] 검색엔진 사생활에 대한 대립조항의 전반적인 효용성은 정부가 빅데이터를 어떻게 활용할 수 있는지 확인하고 피고인에게 인적 과오로부터 보호해 주는 것이다.[14]
캣츠 대 미국 사건
이 1967년 사건은 수정헌법 제4조에 따라 사생활에 대한 새로운 해석을 확립하였기 때문에 두드러진다. 특히 사람들은 그에 대해 합리적인 기대를 가지고 있었다.[3] 캣츠 대 미국 사건은 정부가 전자적으로 펜 레지스터를 사용하여 캣츠가 공중전화 부스에서 나눈 대화를 듣고 녹음하는 것이 합헌적인지에 관한 것이었다. 법원은 정부의 행위가 '수색'으로 간주돼 4차 수정조항을 위반한 것이며, 정부에 영장이 필요하다고 판결했다.[3] 사용자에 대해 수집된 검색 엔진 데이터를 생각할 때, 전화 통신이 Katz 대 미국 하에서 분류되는 방식이 그것을 어떻게 처리해야 하는지에 대한 선례가 될 수 있다. 캣츠 대 미국 사건에서 공중전화는 사적인 통신에서 "중요한 역할"을 하는 것으로 여겨졌다.[3] 이 사건은 1967년에 일어났지만, 확실히 오늘날에는 인터넷과 검색 엔진은 사적인 통신에서 이 중요한 역할을 하고 있고, 사람들의 검색 질의와 IP 주소는 공공 부스에서 걸려온 사적인 전화 통화와 유사하다고 생각할 수 있다.[3]
미국 대 밀러 사건
1976년 이 대법원 사건은 제3자가 수집하거나 정보를 제공했을 때 4차 개정안은 적용되지 않는다고 판결했기 때문에 검색 엔진 사생활과 관련이 있다. Jayni Foley는 미국 대 Miller의 판결은 사람들이 제3자에게 정보를 제공할 때 사생활에 대한 기대를 가질 수 없다는 것을 의미한다고 주장한다.[3] 검색 엔진 프라이버시를 생각할 때, 이것은 사람들이 기꺼이 검색 엔진에 검색 질의의 형태로 정보를 제공하고 그들이 깨닫지 못할 수 있는 다양한 다른 데이터 포인트들이 수집되고 있기 때문에 중요하다.
스미스 대 메릴랜드 사건
1979년 대법원의 스미스 대 메릴랜드 사건에서, 대법원은 1976년 미국 대 밀러 사건에서 위험의 가정에 관한 판례를 무효로 했다. 수정헌법 4조가 '검색'의 자격이 없어 누가 어떤 전화번호를 눌렀는지 펜 레지스터를 이용해 감시를 방해하지 않았다는 법원 판단이 나왔다.[3]
미국 대 밀러 사건 및 스미스 대 메릴랜드 사건 모두 인터넷 서비스 제공업체(ISP)가 보관하고 있는 기록으로부터 제4차 개정안에 따라 제공된 개인 정보 보호를 사용자들이 차단하는 데 이용되어 왔다.[3] 이는 법원이 ISP의 서비스만을 사용하여 ISP에 정보를 제공했기 때문에 ISP 고객 데이터에 4차 수정안 보호가 적용되지 않는다고 판결한 미국 대 케네디 사건뿐만 아니라 제6차 서킷 게스트 대 Leis 사례에서도 명확히 설명된다.[3] 마찬가지로, 프라이버시와 위험의 가정에 관한 현재의 법적 구조는 검색엔진을 사용하여 통신하는 데이터와 관련하여 검색엔진 사용자가 프라이버시를 기대할 수 없다는 것을 의미한다고 해석할 수 있다.[3]
전자통신 개인정보보호법
1986년 전자통신 프라이버시법(ECPA)은 의회가 상상하지 못하고 설명할 수 있는 현재의 기술에 대한 고려가 있기 때문에 결코 포괄적이지는 않았지만 새로운 형태의 기술에 직면하여 프라이버시 보호를 위한 법적 구조를 만들기 위한 노력의 일환으로 의회에서 통과되었다. EPCA는 ISP를 규제하는 데 거의 도움이 되지 않으며 주로 정부 기관이 영장 없이 ISP가 저장한 정보를 수집하는 것을 막는다.[3] 인터넷 사용이 보편화되기 전에 제정되었기 때문에 EPCA가 하지 않는 것은 당연히 검색 엔진 프라이버시에 관한 모든 것을 말하는 것이고 사용자들은 검색 질의 측면에서 보호를 받을 수 있다.[3]
곤잘레스 대 구글 사건
이번 2006년 사건의 배경은 정부가 아동 온라인 보호법(COPA)에 대한 방어를 강화하려 했다는 점이다.[8] 아동 포르노와 관련하여 필터링 소프트웨어가 얼마나 효과적인지 알아보기 위해 연구를 하고 있었다.[8] 이를 위해 정부는 구글, AOL, 야후!, 마이크로소프트의 검색 데이터를 소환하여 분석에서 사용하고 사람들이 어린이들에게 잠재적으로 피해를 줄 수 있는 정보를 검색한다는 것을 보여주었다.[3][8] 정부가 원하는 이 검색 데이터에는 사용자에게 나타난 URL과 사용자들의 실제 검색 질의가 모두 포함됐다. 정부가 검색 질의와 URL을 생산하기 위해 소환한 검색엔진 가운데 구글만 정부 요구를 축소하고도 응하지 않았다.[2] 구글 스스로는 이 로그들을 넘겨주는 것이 개인 식별 가능 정보와 사용자 신원을 넘겨주기 위한 것이라고 주장했다.[8] 재판부는 구글이 무작위로 선정한 5만여 개의 URL을 정부에 넘겼지만 검색 질의는 하지 않은 것은 회사에 대한 국민의 불신을 부추겨 사업을 해칠 수 있기 때문이라고 판시했다.[6]
기밀의 법칙
의회가 제정한 엄정한 법률은 아니지만, 비밀유지법은 정보를 공유하는 당사자에게서 신뢰와 프라이버시를 기대하는 당사자가 공유하는 정보를 보호하는 관습법이다.[8] 만약 검색 질의의 내용과 그들이 저장된 로그가 의사에게 공유되는 정보와 같은 방식으로 생각된다면, 그것은 유사하게 기밀인 것과 같은 프라이버시 보호를 제공받아야 한다.[8]
유럽
구글 스페인 대 AEPD 사건
유럽사법재판소는 2014년 구글 스페인 SL 대 아젠시아 에스파뇰라 데 프로테치온 데 다토스 사건에서 자국민이 '잊혀질 권리'를 가졌다고 판결했는데, 이는 검색엔진에 수집된 모든 자료의 삭제를 요구할 권리가 있음을 의미한다.[17][24] 법원은 이번 단일 법원 결정이 '잊혀질 권리'를 직접 정립하지는 않았지만, 기존 법률은 구글과 같은 검색엔진 업체가 제공한 검색 결과에서 사람들이 자신에 대한 일부 정보를 삭제해 달라고 요청할 권리가 있다는 의미로 해석했다.[24] 이번 사건의 배경에는 스페인 시민 마리오 코스테자 곤잘레스가 구글의 검색 결과에서 자신을 지우기 위해 나선 것이 있다.[24] 법원은 마리오 코스테자 곤잘레스에게 유리한 판결에서 검색엔진이 많은 사람들의 사생활 권리에 상당한 영향을 미칠 수 있으며 구글이 개인정보의 보급을 통제했다고 지적했다.[24] 이 법원의 판결은 모든 시민들이 구글에서 언제든지 자신에 대한 정보를 완전히 삭제할 수 있도록 요청할 수 있어야 한다는 것이 아니라, 검색 엔진에서 그렇게 쉽게 접근할 필요가 없는 특정 유형의 정보, 특히 잊혀질 권리를 방해하는 정보가 있다고 주장했다.[24]
일반 데이터 보호 규정(GDPR)
GDPR은 유럽시민들이 유럽연합에 몸담고 있든 상관없이 데이터를 보호하고 개인 정보를 제공하기 위해 마련된 유럽 규제다. 이것은 세계 각국이 그들의 규칙을 따라야 한다는 것을 의미한다. 그래서 그 안에 살고 있는 유럽 시민은 적절한 보호를 받을 수 있다. 이 규정은 2018년 5월에 시행될 수 있게 되었다.
참고 항목
참조
- ^ a b c d e 페칼라, 샤이나 2017년 "21세기 도서관 발견에서의 사생활과 사용자 경험". Information Technology and Librarys36.
- ^ a b c d e f g h i j k l m n o p q 레너드, 토마스 M, 폴 H. 루빈. 2010. "데이터의 방어를 위해: 정보 및 프라이버시 비용". 정책 & 인터넷2(1):1–56.
- ^ a b c d e f g h i j k l m n o p 폴리, 제이니 2007. "구글 검색은 비공개인가? 「온라인 통신 사례의 제4차 개정안에 대한 원론적 해석」. Berkeley Technology Law Journal22(1):447–75.
- ^ a b 리지웨이, 르네 2017년 "자아의 개인화 반대" 에페메라: 조직에서의 이론과 정치 17(2):377–97.
- ^ a b c d e 스트라힐레비츠, 리오르 제이콥, 매튜 B. 쿠글러 2016년 "개인정보 보호 정책 언어가 소비자와 무관한가?" 법률 연구 저널 45(S2).
- ^ a b c 돌린, 론 A. 2010. "검색 쿼리 개인 정보: 익명화의 문제". 헤이스팅스 과학기술 법률 저널2:137–82.
- ^ a b 니센바움, 헬렌 2011년 "온라인 개인 정보 보호에 대한 상황별 접근 방식". 다이달로스, 미국예술과학아카데미 제140호(4):32~48호.
- ^ a b c d e f g h i j k l m n o p q r s t u v 테네, 오메르. 2008. "구글이 아는 것: 사생활과 인터넷 검색 엔진" 유타 법률 검토 2008(4):1433–92.
- ^ "Duckduckgo privacy policy". Retrieved 22 January 2019.
- ^ a b c Church, Peter and Georgina Kon. 2007. "Google at a Data Protection Storm의 핵심" 컴퓨터 법률 & 보안 보고서23(5):461–65.
- ^ a b c d 손, 아프리카 2012년 "Duckduckgo http:///ww.wduckgo.commor http://www.ddg.gg". 기술 서비스 분기별 29(4): 345-347.
- ^ a b 앨런, 제프리, 애슐리 할렌. 2018. "금융혼란 방지를 위한 사생활 및 보안 팁" 아메리칸 저널 오브 패밀리 법률 101-7.
- ^ a b c 위커, 요르그, 스테판 크라머 2017년 "최상의 프라이버시 방어는 좋은 프라이버시 공격이다: 검색 엔진 사용자 프로필 난독화" 데이터 마이닝 및 지식 검색31(5):1419–43.
- ^ a b c d e f g 2015년 차드의 스퀴티에리입니다 "빅데이터 상호교란: 정부 데이터 수집에 대립조항 적용" 버지니아 법률 검토101(7):2011–49.
- ^ a b 비에조, 알렉산드르, 조디 카스텔라로카 2010년. "소셜 네트워크를 사용하여 웹 검색 엔진에서 생성된 사용자 프로파일을 왜곡" 컴퓨터 네트워크 54(9):1343–57.
- ^ a b 에반스, 데이비드 S. n.d. "온라인 광고 산업: 경제, 진화, 프라이버시" 경제 전망 저널23(3):37–60.
- ^ a b c d e f 시루, 클라우디 2016년 "검색 엔진: 윤리적 함의". 경제, 경영 및 금융 시장11(1):162–67.
- ^ a b 반 오탈로, 마르틴 2014. "월든 3.0의 자동 실험 : 프로파일링, 예측, 제어 및 감시의 다음 단계" Surveillance & Society 12(2):255–72.
- ^ a b 차이, 재니스 Y, 서지 에겔만, 로리 크랜로, 알레산드로 아퀴스티. 2011. "온라인 개인 정보 정보가 구매 행동에 미치는 영향: 실험 연구". 정보 시스템 연구22(2):254–68.
- ^ Paies-Estrems, David, Jordi Castella-Rocca, Alexandre Viejo. 2016. "Web Search Engine Side에서 개인 정보 보호 - 사용자 프로파일 생성" Expert Systems with Applications64:523–35.
- ^ a b c d e f g h i j 트라우트만, 로렌스 J, 피터 C. 오르메로드. 2016. "기업 이사 및 임원의 사이버 보안 관리 표준: 야후 데이터 침해". SSRN 전자 저널66(5).
- ^ Newman, Lily Hay (2018-12-10). "A New Google+ Blunder Exposed Data From 52.5 Million Users". Wired. ISSN 1059-1028. Retrieved 2019-05-29.
- ^ Satvat, Kiavash; Forshaw, Matthew; Hao, Feng; Toreini, Ehsan (2014). Garcia-Alfaro, Joaquin; Lioudakis, Georgios; Cuppens-Boulahia, Nora; Foley, Simon; Fitzgerald, William M. (eds.). "On the Privacy of Private Browsing – A Forensic Approach". Data Privacy Management and Autonomous Spontaneous Security. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer. 8247: 380–389. doi:10.1007/978-3-642-54568-9_25. ISBN 978-3-642-54568-9.
- ^ a b c d e f g h 드 마스, 실비아, 패트릭 오캘러헌 2016년 "개인 정보 및 검색 엔진: 망각 또는 컨텍스트화?" Journal of Law and Society 43(2):257–84.
- ^ a b c d e 쁘띠, 알빈 외 2016. "SimAttack: Private Web Search in Fire". 인터넷 서비스 및 애플리케이션 저널 7(2):1–17.
- ^ 페딘티, 사이 테자, 니테 작세나 2014년 "웹 검색 질의 개인 정보 보호: 질의 난독화 및 익명화 네트워크 평가" 컴퓨터 보안 저널22(1:155–99).