이메일 주소 수집

Email-address harvesting

전자 메일 수집 또는 스크랩은 다양한 방법을 사용하여 전자 메일 주소 목록을 가져오는 프로세스입니다.일반적으로 대량 전자 메일 또는 스팸에 사용됩니다.

방법들

가장 간단한 방법은 스팸 발송자가 다른 스팸 발송자로부터 전자 메일 주소 목록을 구입하거나 거래하는 것입니다.

또 다른 일반적인 방법은 "수확 봇" 또는 "수확 봇"으로 알려진 특수 소프트웨어를 사용하는 것입니다. 이 소프트웨어스파이더페이지, Usenet에 게시, 메일링 목록 아카이브, 인터넷 포럼 및 기타 온라인 소스로 공공 데이터에서 이메일 주소를 가져옵니다.

스패머는 디렉토리 수집 공격이라고 불리는 전자 메일주소를 수집하기 위해서 사전 공격의 형태를 사용할 수도 있습니다.이 공격에서는, 특정 도메인의 전자 메일주소에 있는 공통의 유저명을 사용해 전자 메일주소를 추측하는 것으로, 특정의 도메인의 유효한 전자 메일주소를 찾을 수 있습니다.예를 들어, alan@example.com, alana@example.com, alanb@example.com 등 수신자 이메일서버에 의해 전달이 허가된 것은 거부되지 않고 해당 도메인에 대해 이론적으로 유효한 이메일주소 목록에 추가됩니다.

전자 메일 주소 수집의 또 다른 방법은 사용자가 유효한 전자 메일 주소를 제공하는 한 제품 또는 서비스를 무료로 제공하고 사용자로부터 수집한 주소를 스팸 대상으로 사용하는 것입니다.제공되는 일반적인 상품과 서비스는 그날의 농담, 매일의 성경 인용, 뉴스나 주식 경보, 무료 상품, 심지어 등록된 성범죄자 경보 등이다.또 다른 기법은 2007년 말 iDate사에 의해 사용되었는데, iDate사는 Quechup 웹사이트 가입자들을 위한 이메일 수집을 이용하여 희생자의 [1]친구와 연락처를 스팸으로 보냈다.

수확원

스팸 발송자는 여러 원본에서 전자 메일 주소를 수집할 수 있습니다.일반적인 방법은 소유자가 다른 목적으로 게시한 전자 메일 주소를 사용합니다.특히 Google Groups와 같은 아카이브에 있는 게시물은 자주 주소를 제공합니다.스팸봇을 사용하는 경우, 기업 스탭의 디렉토리나 프로사회의 멤버십 리스트등의 주소가 기재된 페이지를 Web상에서 검색하는 것만으로, 수천개의 주소를 얻을 수 있습니다.대부분의 주소는 성과물이 됩니다.스팸 발송자들은 또한 포스터의 주소를 수집하기 위해 토론 메일 목록을 구독했습니다.DNS 및 WHOIS 시스템에서는 모든 인터넷 도메인의 기술 연락처 정보를 공개해야 합니다.스패머는 이러한 자원을 전자 메일주소로 부정하게 트롤하고 있습니다.또, 스패머는, 일반적으로, 기업의 도메인명의 경우, 모든 E-메일 주소가 같은 기본적인 패턴을 따르기 때문에, 주소를 수집하지 않은 종업원의 E-메일 주소를 정확하게 추측할 수 있다고 결론지었습니다.많은 스팸 발송자들은 웹 페이지에서 이메일 주소를 찾기 위해 웹 스파이더라는 프로그램을 사용합니다.usenet 기사 메시지 ID는 종종 이메일 주소처럼 보여 수집되기도 합니다.스팸 발송자들은 또한 실제로 검색에서 발견된 웹사이트를 조사하지 않고 구글 검색 결과에서 직접 이메일 주소를 수집했다.

스팸 바이러스는 피해를 입은 컴퓨터의 디스크 드라이브(및 그 네트워크 인터페이스)에서 전자 메일 주소를 검색하는 기능을 포함할 수 있습니다.이 스캐너는 웹이나 Whois에 공개된 적이 없는 전자 메일 주소를 검색합니다.공유 네트워크 세그먼트에 있는 손상된 컴퓨터는 네트워크 인접 네트워크로 수신된 트래픽에서 전자 메일 주소를 캡처할 수 있습니다.수집된 주소는 바이러스에 의해 생성된 봇넷을 통해 스팸 발송자에게 반환됩니다.또한 때로는 주소가 다른 정보와 함께 추가되고 재무 및 개인 데이터를 추출하기 위해 상호 참조될 수 있습니다.

e-pending이라고 불리는 최근의 논란이 되고 있는 전략은 다이렉트 마케팅 데이터베이스에 이메일 주소를 추가하는 것입니다.다이렉트 마케터는 일반적으로 잡지 구독 및 고객 목록과 같은 출처에서 잠재 고객 목록을 얻습니다.웹 및 기타 리소스를 검색하여 레코드의 이름 및 거리 주소에 해당하는 이메일 주소를 검색함으로써 다이렉트 마케터는 타깃 스팸 메일을 보낼 수 있습니다.그러나 대부분의 스팸 발송자가 "타깃팅"을 하는 것과 마찬가지로 이는 정확하지 않습니다.예를 들어, 사용자는 특정 주소의 주택 담보대출을 요청하는 요청을 받았다고 보고합니다.이 주소는 분명히 우편물 보관소와 사무실 번호를 포함한 영업소 주소입니다.

스패머는, 송신 가능한 주소를 확인하기 위해서, 다양한 수단을 사용하는 경우가 있습니다.예를 들어 HTML로 작성된 스팸 메시지에 숨겨진 웹 버그를 포함하면 수신자의 메일 클라이언트가 수신자의 주소 또는 다른 고유한 키를 스팸 발송자의 웹 [2]사이트로 전송할 수 있습니다.사용자는 메일 프로그램의 이미지 표시 옵션을 해제하거나 전자 메일을 형식이 아닌 일반 텍스트로 읽음으로써 이러한 남용으로부터 보호할 수 있습니다.

마찬가지로 스팸 발송자는 제출된 주소를 스팸 목록에서 제거하는 것을 목적으로 하는 웹 페이지를 작동할 수 있습니다.경우에 따라서는 입력된 주소를 서브스크라이브하여 [3]스팸을 더 많이 수신할 수 있습니다.

사람들이 양식을 작성할 때, 종종 데이터를 전송하기 위해 웹 서비스나 http 포스트를 사용하여 스팸 발송자에게 팔린다.이는 즉시 이루어지며 다양한 스팸 발송 데이터베이스에 전자 메일이 드롭됩니다.스팸 발송기로 인한 수익은 발신원과 공유됩니다.예를 들어, 누군가가 온라인으로 담보대출을 신청한다면, 이 사이트의 소유자는 주소를 팔기 위해 스팸 발송자와 거래를 했을 수 있다.스팸 발송자는 이러한 이메일을 가장 잘 보내는 것으로 간주합니다. 왜냐하면 그것들은 신선하고 사용자가 스팸에 의해 종종 판매되는 제품이나 서비스에 막 가입했기 때문입니다.

합법성

많은 국가에서는 전자 메일 주소의 수집 또는 사용을 제한하는 안티스팸 법이 시행되고 있습니다.

호주에서 이메일 주소 수집 프로그램(주소 수집 소프트웨어)의 작성 또는 사용은 2003년 안티스팸 법률에 따르면 이메일 주소 수집 프로그램을 사용하여 요청되지 않은 상업용 [4][5]이메일을 보내는 경우에만 불법입니다.이 법률은 호주에서 발신된 스팸이 다른 곳으로 전송되고 스팸이 호주 주소로 전송되는 '호주 연결' 전자 메일을 금지하기 위한 것입니다.

뉴질랜드도 2007년 [6]비송신 전자 메시지법에 유사한 제한이 있습니다.미국에서는, 2003년[7] CAN-SPAM법에 의해서, 다음의 방법으로 수신자의 전자 메일 주소를 취득한 수신자에게 상업용 전자 메일을 개시하는 것이 불법이 되고 있습니다.

  • 이름, 문자 또는 숫자를 여러 배열로 결합하여 가능한 전자 메일 주소를 생성하는 자동화된 방법을 사용합니다.
  • 타인이 운영하는 인터넷 사이트 또는 독점 온라인 서비스로부터 전자 메일 주소를 추출하는 자동화 수단을 사용하여 주소 취득 시 해당 사이트 또는 온라인 서비스 사업자가 주소를 제공, 판매 또는 이전하지 않는다는 취지의 통지서를 포함한다.전자 메일 메시지를 시작하거나 다른 사람이 시작할 수 있도록 하기 위해 해당 웹 사이트 또는 온라인 서비스에 의해 다른 당사자에게 유지된다.

또한 웹 사이트 운영자는 합법적으로 수집한 목록을 배포할 수 없습니다.2003년의 CAN-SPAM법은 웹 사이트 및 온라인 서비스 운영자가 해당 웹 사이트 또는 온라인 서비스에 의해 관리되는 주소를 다른 당사자에게 제공, 판매 또는 이전하지 않는다는 통지를 포함해야 합니다.

대책

어드레스 멍잉
주소 멍깅(예: "bob@example.com"을 "bob at example dot com"으로 변경하는 것)은 이메일 주소 수집을 더 어렵게 만드는 일반적인 기술입니다.Google 검색과 같이 비교적 쉽게 극복할 수 있지만 여전히 [8][9]효과적입니다.주소를 검사하고 수동으로 수정해야 하는 사용자에게는 다소 불편합니다.
이미지들
이미지를 사용하여 전자 메일 주소의 일부 또는 전체를 표시하는 것은 매우 효과적인 수집 대책입니다.스팸 발송자에게는 이미지에서 텍스트를 자동으로 추출하는 데 필요한 처리가 경제적으로 가능하지 않습니다.주소를 수동으로 입력하는 사용자에게는 매우 불편합니다.
연락처 폼
전자 메일을 보내지만 수신자의 주소를 밝히지 않는 전자 메일 연락처 양식은 처음부터 전자 메일 주소를 게시하지 않도록 합니다.그러나 이 방법은 사용자가 선호하는 전자 메일 클라이언트에서 작성하지 못하도록 하고 메시지 내용을 일반 텍스트로 제한하며 "보낸" 메일 폴더에 사용자가 말한 내용을 자동으로 기록하도록 하지 않습니다.
자바스크립트 난독화
JavaScript 전자 메일 난독화는 사용자를 위한 클릭 가능한 일반 전자 메일 링크를 생성하며 스파이더로부터 주소를 가려줍니다.Havester에 의해 표시되는 소스 코드에서는 전자 메일 주소가 스크램블화,[8] 부호화 또는 기타 난독화됩니다.대부분의 사용자에게 매우 편리하지만 텍스트 기반 브라우저 및 화면 리더 또는 JavaScript 지원 [10]브라우저를 사용하지 않는 사용자에게는 접근성이 감소합니다.
HTML 난독화
HTML 에서는, E-메일 주소는, 주소내에 숨겨진 요소를 삽입하거나, 순서가 어긋난 부분을 리스트 하거나, CSS 를 사용해 올바른 순서를 복원하거나 하는 등, 여러가지 방법으로 난독화될 가능성이 있습니다.각각은 대부분의 사용자에게 투과적이라는 장점이 있지만 클릭 가능한 전자 메일 링크를 지원하지 않으며 텍스트 기반 브라우저 및 화면 리더에 액세스할 수 있는 것도 없습니다.
캡차
사용자에게 이메일 주소를 제공하기 전에 CAPTCHA를 완료하도록 요구하는 것이 효과적인 수집 대책입니다.인기 있는 솔루션은 reCAPTCHA Mailhide 서비스입니다.(주의: 12.9.18: 메일 숨김은 지원되지 않습니다.)[11]
CAN-SPAM 알림
2003년 CAN-SPAM법에 따라 스팸 발송자를 기소할 수 있도록 하기 위해 웹 사이트 운영자는 "사이트 또는 서비스는 [12]전자 메일 메시지를 시작하거나 다른 사람이 시작할 수 있도록 해당 웹 사이트 또는 온라인 서비스에 의해 유지되는 주소를 다른 당사자에게 제공, 판매 또는 이전하지 않습니다."라는 공지를 게시해야 합니다.
메일 서버 모니터링
전자 메일 서버는 디렉토리 수집 공격에 대처하기 위해 여러 가지 방법을 사용합니다.예를 들어, 단시간에 둘 이상의 무효 수신자 주소를 지정한 리모트 송신자와의 통신을 거부합니다.그러나, 이러한 대책의 대부분은, 합법적인 전자 메일이 중단될 위험이 있습니다.
스파이더 트랩
거미 덫은 이메일을 수집하는 [13]거미와 싸우기 위해 고안된 허니팟인 웹사이트의 일부이다.예의 바른 거미들은 웹사이트의 로봇처럼 영향을 받지 않는다.txt 파일은 거미에게 해당 영역에 접근하지 말라고 경고합니다.이것은 악의적인 거미들이 주의를 기울이지 않는다는 경고입니다.일부 트랩은 트랩에 [14][15][16]액세스하는 즉시 클라이언트의 IP로부터의 액세스를 차단합니다.네트워크 타르트와 같은 다른 것들은 거미에게 쓸모없는 [17]정보를 천천히 끝없이 먹임으로써 악의적인 거미들의 시간과 자원을 낭비하도록 설계되어 있다."bait" 콘텐츠에는 다수의 가짜 주소가 포함되어 있을 수 있습니다.이것은 리스트 포이즈닝이라고 불리는 테크닉입니다만, 일부에서는 이 방법이 [18][19][20][21]유해하다고 생각하기도 합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Arthur, Charls (2007-09-13). "Do social network sites genuinely care about privacy?". theguardian. Retrieved 2007-10-30.
  2. ^ Heather Harreld (5 December 2000). "Embedded HTML 'bugs' pose potential security risk". InfoWorld. Archived from the original on 2006-12-10. Retrieved 2007-01-06.
  3. ^ "Spam Unsubscribe Services". The Spamhaus Project Ltd. 29 September 2005. Retrieved 2007-01-06.
  4. ^ "EFA Analysis of Australian Spam Bills 2003". efa.org.au. Electronic Frontiers Australia. 2003-11-01. Address Harvesting Software and Lists. Archived from the original on 2021-05-04.
  5. ^ "Australia slams the door on spam". 2003-08-18. Archived from the original on 2007-02-03. Retrieved 2021-07-04.
  6. ^ "Unsolicited Electronic Messages Act 2007 No 7, Public Act Subpart 2—Address-harvesting software and harvested-address lists". legislation.govt.nz. Archived from the original on 2021-02-17. Retrieved 2021-07-04.
  7. ^ http://frwebgate.access.gpo.gov/cgi-bin/getdoc.cgi?dbname=108_cong_public_laws&docid=f:publ187.108.pdf[베어 URL PDF]
  8. ^ a b Silvan Mühlemann, 2008년 7월 20일, 이메일 주소를 난독화하는 9가지 방법 비교
  9. ^ Hohlfeld, Oliver; Graf, Thomas; Ciucu, Florin (2012). Longtime Behavior of Harvesting Spam Bots (PDF). ACM Internet Measurement Conference.
  10. ^ Roel Van Gils, A List Apart, 2007년 11월 6일 그레이스 풀 이메일 난독화
  11. ^ 메일 숨기기:무료 스팸 방지
  12. ^ "미국법 제15조 제7704조 - 상업용 전자 메일 사용자를 위한 기타 보호", 섹션 a.4.b.1.에이아이
  13. ^ SEO 용어집: "스파이더 트랩은 거미가 페이지를 요구하고 서버가 페이지를 렌더링하기 위한 데이터를 요구하는 연속 루프 또는 robot.txt를 존중하지 않는 거미를 식별(및 금지)하도록 설계된 의도적인 스킴 중 하나입니다."
  14. ^ [1] 클라이언트의 접근을 금지하는 Spider Trap.
  15. ^ Thomas Zeithaml, Spider Trap: 구조
  16. ^ 랄프 D. 클로스, 나쁜 봇을 봇트랩에 가두다
  17. ^ 나쁜 로봇, 거미 및 웹 크롤러를 멀리하는 방법
  18. ^ 스팸 대책의 Ralf D. Kloth는 불량 봇을 잡습니다.스팸 봇의 주소 데이터베이스를 망가뜨리기 위해 긴 가짜 주소 목록을 가진 웹 페이지를 생성하는 것은 권장되지 않습니다.스팸머가 이러한 주소를 사용하는 것은 네트워크 링크에 추가 트래픽 부하가 걸리고 스팸 발송자가 해당 주소를 사용하는 것은 무해하기 때문입니다.d파티 서버"
  19. ^ Harvester Killer: 가짜 이메일을 생성하고 거미를 무한 루프에 가둬둡니다.
  20. ^ : CS1 maint: 제목으로 아카이브된 복사(링크) 5,000개의 가짜 이메일 주소를 생성하여 클라이언트의 접근을 차단하는 Spider Trap"Archived copy". Archived from the original on 2011-07-06. Retrieved 2011-02-12.{{cite web}}.
  21. ^ robotcop.org: "웹마스터는 잘못된 행동을 하는 거미들을 트랩하거나, 수집한 이메일 주소의 데이터베이스를 중독시키거나, 단순히 차단함으로써 거미들에 대응할 수 있습니다."