웹 분석

Web analytics

분석은 웹 사용[1]이해하고 최적화하기 위한 웹 데이터의 측정, 수집, 분석 및 보고입니다.웹 분석은 웹 트래픽을 측정하는 프로세스일 뿐만 아니라 비즈니스 및 시장 조사를 위한 도구로서도 사용할 수 있으며 웹 사이트의 효율성을 평가하고 개선할 수 있습니다.웹 분석 애플리케이션은 또한 기업이 기존 인쇄 광고 또는 방송 광고 캠페인의 결과를 측정하는 데 도움이 됩니다.새로운 광고 캠페인을 시작한 후 웹 사이트에 대한 트래픽이 어떻게 변화하는지 추정하기 위해 사용할 수 있습니다.웹 분석은 웹 사이트 방문자 수와 페이지 보기 수에 대한 정보를 제공하거나 사용자 행동 프로파일을 [2]만듭니다.그것은 트래픽과 인기 동향을 측정하는데 도움이 되며, 이는 시장 조사에 유용하다.

웹 분석 과정의 기본 단계를 포함한다.

웹 분석 프로세스의 기본 단계

대부분의 웹 분석 프로세스는 다음과 같은 4가지 필수 단계 또는 [3]단계로 구성됩니다.

  • 데이터 수집:이 단계는 기본적인 데이터를 수집하는 단계입니다.일반적으로 이러한 데이터는 여러 가지 사항입니다.이 단계의 목적은 데이터를 수집하는 것입니다.
  • 정보로의 데이터 처리:이 단계에서는 카운트를 취득하여 비율을 설정합니다.다만, 아직 카운트가 있는 경우도 있습니다.이 단계의 목적은 데이터를 취합하여 정보, 특히 측정 기준에 적합하게 만드는 것입니다.
  • KPI 작성: 이 단계에서는 비율(및 카운트)을 사용하고 주요 성과 지표(KPI)라고 하는 비즈니스 전략을 주입하는 데 중점을 둡니다.대부분의 경우 KPI는 변환 측면을 다루지만 항상 그렇지는 않습니다.조직에 따라 다릅니다.
  • 온라인 전략 수립:이 단계는 조직 또는 비즈니스의 온라인 목표, 목표 및 표준에 관한 것입니다.이러한 전략은 대개 돈을 벌거나, 돈을 절약하거나, 시장 점유율을 높이는 것과 관련이 있다.

웹사이트의 최적화를 위해 분석가들에 의해 개발된 또 다른 필수 기능은 실험이다.

  • 실험 및 테스트: A/B 테스트는 웹 개발온라인 환경에서 두 가지 변형을 사용한 제어된 실험입니다.

A/B 테스트의 목적은 통계적으로 테스트된 대상 결과의 효과를 증가시키거나 최대화하는 웹 페이지의 변경을 식별하고 제안하는 것입니다.

각 스테이지가 그 전후의 스테이지에 영향을 주거나 영향을 줄 수 있습니다(즉, 드라이브).따라서 수집 가능한 데이터가 온라인 전략에 영향을 미칠 수 있습니다.또, 온라인 전략이 수집된 데이터에 영향을 주는 경우도 있습니다.

웹 분석 기술

웹 분석에는 오프사이트온사이트 웹 분석의 최소 두 가지 범주가 있습니다.

  • 오프사이트 웹 분석이란 웹 사이트를 소유하고 있는지, 관리하고 있는지에 관계없이 웹 측정 및 분석을 말합니다.여기에는 웹 사이트의 잠재적인 사용자(기회), 음성 공유(가시성) 및 인터넷 전체에서 발생하는 화제(댓글)의 측정이 포함됩니다.
  • 가지 중 더 일반적인 현장 웹 분석은 방문자의 행동을 특정사이트에서 한 번 측정합니다.여기에는 드라이버와 변환이 포함됩니다.예를 들어 온라인 구매와 관련된 다른 랜딩 페이지의 정도 등입니다.온 사이트 웹 분석은 상업적 맥락에서 특정 웹 사이트의 성능을 측정합니다.이 데이터는 일반적으로 퍼포먼스의 주요 퍼포먼스 지표와 비교되며 웹 사이트 또는 마케팅 캠페인의 시청자 반응을 개선하는 데 사용됩니다.Google Analytics 및 Adobe Analytics는 가장 널리 사용되는 현장 웹 분석 서비스이지만, 열 지도 세션 재생을 비롯한 추가 정보 계층을 제공하는 새로운 툴이 등장하고 있습니다.

지금까지 웹 분석은 현장 방문자 측정을 참조하기 위해 사용되어 왔습니다.그러나 이러한 의미는 모호해졌습니다.그 주된 이유는 벤더가 두 카테고리에 걸친 툴을 생산하고 있기 때문입니다.많은 벤더가 온사이트분석 소프트웨어와 서비스를 제공하고 있습니다.데이터 수집에는 크게 두 가지 기술적 방법이 있습니다.첫 번째 기존 방법인 서버 로그 파일 분석에서는 웹 서버가 브라우저별로 파일 요청을 기록하는 로그 파일을 읽습니다.두 번째 방법인 페이지 태그 지정은 웹 브라우저에 의해 웹 페이지가 렌더링될 때마다 또는 원하는 경우 마우스 클릭이 발생할 때 웹 페이지에 내장된 JavaScript를 사용하여 타사 분석 전용 서버에 이미지를 요청합니다.둘 다 웹 트래픽 보고서를 생성하기 위해 처리할 수 있는 데이터를 수집합니다.

웹 분석 데이터 소스

웹 분석의 기본 목표는 웹 트래픽 및 사용 패턴과 관련된 데이터를 수집하고 분석하는 것입니다.데이터는 주로 다음 네 가지 [4]출처에서 나옵니다.

  1. 직접 HTTP 요청 데이터: HTTP 요청 메시지(HTTP 요청 헤더)에서 직접 가져옵니다.
  2. HTTP 요청과 관련된 네트워크 수준 및 서버 생성 데이터: HTTP 요청의 일부가 아니지만 요청 전송에 성공하기 위해 필요합니다(예: 요청자의 IP 주소).
  3. HTTP 요청과 함께 전송되는 응용 프로그램 수준 데이터: 응용 프로그램 수준 프로그램(예: JavaScript, PHP 및 ASP)에 의해 생성 및 처리됩니다.넷) 세션 및 추천을 포함합니다.일반적으로 이러한 정보는 공개 웹 분석 서비스가 아닌 내부 로그를 통해 캡처됩니다.
  4. 외부 데이터: 위에서 설명한 웹 사이트 동작 데이터를 증가시키고 웹 사용량을 해석하는 데 도움이 되는 온 사이트 데이터와 결합할 수 있습니다.예를 들어, IP 주소는 일반적으로 지리적 지역 및 인터넷 서비스 공급자, 전자 메일 열기 및 클릭률, 다이렉트 메일 캠페인 데이터, 판매, 리드 이력 또는 필요에 따라 기타 데이터 유형과 관련지어집니다.

웹 서버 로그 파일 분석

웹 서버는 트랜잭션의 일부를 로그 파일에 기록합니다.이 로그 파일들이 웹사이트의 인기에 관한 데이터를 제공하는 프로그램에 의해 읽혀질 수 있다는 것을 곧 깨달았다.그래서 웹 로그 분석 소프트웨어가 생겨났다.

1990년대 초반 웹사이트 통계는 주로 웹 서버에 대한 클라이언트 요청(또는 히트) 수를 세는 것으로 구성되었습니다.이것은 각 웹사이트가 하나의 HTML 파일로 구성되어 있는 경우가 많기 때문에 처음에는 합리적인 방법이었다.그러나 HTML의 이미지와 여러 HTML 파일에 걸쳐 있는 웹 사이트가 등장함에 따라 이 숫자는 유용하지 않게 되었습니다.최초의 진정한 상용 로그 분석기는 1994년에 [5]IPRO에 의해 출시되었습니다.

웹 서버에서의 인간 활동량을 보다 정확하게 측정하기 위해 두 가지 측정 단위가 1990년대 중반에 도입되었습니다.페이지 뷰와 방문(또는 세션)입니다.페이지 는 그래픽이 아닌 웹 서버에 대해 이루어지는 요청으로 정의되며, 방문은 일정 시간(통상 30분)의 비활성 후 만료되는 고유 식별 클라이언트로부터의 일련의 요청으로 정의됩니다.

1990년대 후반 검색엔진 거미와 로봇이 등장하면서 웹 프록시대기업과 ISP를 위한 IP 주소가 동적으로 할당되면서 웹사이트의 고유한 방문자를 식별하기가 더욱 어려워졌다.로그 분석기는 쿠키별 방문을 추적하고 알려진 스파이더의 요청을 [citation needed]무시함으로써 응답했습니다.

캐시의 광범위한 사용으로 인해 로그 파일 분석에도 문제가 발생했습니다.사용자가 페이지를 다시 방문할 경우, 두 번째 요청은 종종 브라우저 캐시에서 검색되므로 웹 서버가 요청을 수신하지 않습니다.이것은 사이트를 통과하는 사람의 경로가 손실된다는 것을 의미합니다.웹 서버를 설정하면 캐싱이 중단될 수 있지만, 이로 인해 방문자의 성능이 저하되고 서버의 [6]부하가 커질 수 있습니다.

페이지 태그 부착

캐싱이 존재하는 경우 로그 파일 분석의 정확성에 대한 우려와 아웃소싱 서비스로 웹 분석을 수행하고자 하는 욕구가 두 번째 데이터 수집 방법, 페이지 태그 부착 또는 " 비콘"을 만들었습니다.

1990년대 중반에는 웹 카운터가 자주 등장했습니다.이것들은 웹 페이지에 포함된 이미지입니다.웹 페이지에 대한 요청 횟수를 나타내는 이미지입니다.이 페이지는 해당 페이지에 대한 방문 횟수를 예측한 것입니다.1990년대 후반, 이 개념은 눈에 보이는 이미지 대신 보이지 않는 작은 이미지를 포함하도록 진화하였고, JavaScript를 사용하여 이미지와 함께 페이지와 방문자에 대한 특정 정보를 요구하였다.이 정보는 웹 분석 회사에서 원격으로 처리하여 광범위한 통계를 생성할 수 있습니다.

웹 분석 서비스는 또한 사용자에게 쿠키를 할당하는 과정을 관리하며, 방문 시 및 이후 방문 시 쿠키를 고유하게 식별할 수 있습니다.쿠키 허용률은 웹 사이트마다 크게 다르며 수집 및 보고되는 데이터의 품질에 영향을 미칠 수 있습니다.

타사 데이터 수집 서버(또는 사내 데이터 수집 서버)를 사용하여 웹 사이트 데이터를 수집하려면 수집 서버의 IP 주소를 확인하기 위해 사용자의 컴퓨터에서 추가 DNS 조회가 필요합니다.DNS 검색의 완료가 지연되거나 실패하면 데이터가 수집되지 않을 수 있습니다.

Ajax 기반 솔루션의 인기가 높아짐에 따라 보이지 않는 이미지를 사용하는 대신 렌더링된 페이지에서 서버로 콜백하는 방법이 있습니다.이 경우 웹 브라우저에 페이지가 렌더링되면 자바스크립트 코드 일부가 서버에 다시 호출하여 클라이언트에 대한 정보를 전달하고 웹 분석 회사가 이를 집계할 수 있습니다.

로그 파일 분석과 페이지 태그 지정

로그 파일 분석 프로그램과 페이지 태그 지정 솔루션 모두 웹 분석을 수행하고자 하는 기업이 쉽게 사용할 수 있습니다.경우에 따라서는 동일한 웹 분석 회사가 두 가지 접근 방식을 모두 제공할 수 있습니다.그 후, 기업이 어떤 방법을 선택할지에 대한 의문이 생깁니다.[7]접근법에는 장점과 단점이 있습니다.

로그 파일 분석의 이점

페이지 태그 부착에 비해 로그 파일 분석의 주요 장점은 다음과 같습니다.

  • 일반적으로 웹 서버는 이미 로그 파일을 생성하므로 원시 데이터를 이미 사용할 수 있습니다.웹 사이트를 변경할 필요가 없습니다.
  • 데이터는 회사의 서버에 저장되며 독점 형식이 아닌 표준 형식으로 제공됩니다.이를 통해 기업은 나중에 프로그램을 전환하거나 여러 프로그램을 사용하거나 새로운 프로그램으로 이력 데이터를 쉽게 분석할 수 있습니다.
  • 로그 파일에는 일반적으로 JavaScript 태그를 사용하는 분석 도구에서 제외되는 검색 엔진 스파이더로부터의 방문 정보가 포함되어 있습니다(페이지에서 JavaScript를 실행하지 않는 검색 엔진도 있습니다).이러한 정보를 인간 활동의 일부로 보고해서는 안 되지만 검색 엔진 최적화에 유용한 정보입니다.
  • 로그 파일에는 추가 DNS 검색이나 TCP 느린 시작이 필요하지 않습니다.따라서 페이지 로드 속도가 느려지거나 페이지 보기가 카운트되지 않을 수 있는 외부 서버 호출은 없습니다.
  • 웹 서버는 PDF 문서 및 스크립트에 의해 생성된 콘텐츠를 제공하는 등 수행하는 모든 트랜잭션을 안정적으로 기록하고 방문자의 브라우저에 의존하지 않습니다.

페이지 태그 부착의 이점

로그 파일 분석에 대한 페이지 태그 지정의 주요 장점은 다음과 같습니다.

  • 카운트는 웹 클라이언트가 태그스크립트를 실행하고 있는 것을 전제로 한 페이지를 여는 것으로 유효하게 됩니다.서버로부터의 요구는 없습니다.페이지가 캐시된 경우 서버 기반 로그 분석에 의해 계산되지 않습니다.캐시된 페이지는 모든 페이지 뷰의 3분의 1까지 차지할 수 있으며, 이는 [citation needed]많은 사이트 메트릭에 부정적인 영향을 미칠 수 있습니다.
  • 데이터는 페이지의 컴포넌트("태그")를 통해 수집되며, 보통 JavaScript로 작성됩니다.일반적으로 서버측 스크립트 언어(예: PHP)와 함께 사용하여 조작하고 데이터베이스에 저장합니다.
  • 스크립트는 방문자의 화면 크기 및 구매한 상품의 가격 등 쿼리에서 전송되지 않고 웹 클라이언트 또는 사용자에 대한 추가 정보에 액세스할 수 있습니다.
  • 페이지 태그는 플래시 무비 내에서의 상호작용, 부분 폼 완성, 마우스 이벤트(onClick, onMouseOver, onFocus, onBlur 등) 등 웹 서버에 대한 요청을 수반하지 않는 이벤트를 보고할 수 있습니다.
  • 페이지 태그 지정 서비스는 방문자에게 쿠키를 할당하는 프로세스를 관리합니다.로그 파일 분석에서는 서버가 이를 수행하도록 구성해야 합니다.
  • 페이지 태그 지정은 웹 서버에 액세스할 수 없는 회사에서 사용할 수 있습니다.
  • 최근 웹 [8]분석에서는 페이지 태그 부착이 표준이 되었습니다.

경제적 요인

로그 파일 분석은 거의 항상 사내에서 수행됩니다.페이지 태그는 사내에서 수행할 수 있지만 서드파티 서비스로 제공되는 경우가 많습니다.이 두 모델의 경제적 차이는 기업이 어떤 모델을 구매할지 결정하는 데에도 고려사항이 될 수 있습니다.

  • 로그 파일 분석에는 일반적으로 일회성 소프트웨어 구입이 수반되지만 일부 벤더는 추가 [citation needed]정보 처리에 추가 비용이 드는 최대 연간 페이지 뷰를 도입하고 있습니다.상용 서비스 외에도 여러 오픈 소스 로그 파일 분석 도구를 무료로 사용할 수 있습니다.
  • 로그 파일 분석의 경우 데이터를 저장하고 아카이브해야 합니다.데이터는 종종 빠르게 커집니다.이를 위한 하드웨어 비용은 최소이지만 IT 부문의 오버헤드는 상당할 수 있습니다.
  • 로그 파일 분석 소프트웨어는 업데이트 및 보안 패치를 포함하여 유지관리해야 합니다.
  • 복잡한 페이지 태그 부착 벤더는 수집되는 월간 페이지 뷰 수 등 볼륨에 따라 매월 요금을 청구합니다.

어떤 솔루션을 구현하는 것이 더 저렴한지는 기업 내 기술 전문지식의 양, 선택한 벤더, 웹사이트에서 볼 수 있는 활동량, 필요한 정보의 깊이와 유형, 통계를 필요로 하는 개별 웹사이트의 수에 따라 달라집니다.

벤더 솔루션이나 데이터 수집 방법에 관계없이 웹 방문자 분석 및 해석 비용도 포함해야 합니다.즉, 원시 데이터를 실행 가능한 정보로 전환하는 데 드는 비용입니다.서드파티 컨설턴트의 채용, 경험이 풍부한 Web 분석가의 채용, 또는 사내에서의 적절한 트레이닝을 생각할 수 있습니다.그런 다음 비용 편익 분석을 수행할 수 있습니다.예를 들어 웹 방문자 데이터를 분석하면 어떤 수익 증가 또는 비용 절감 효과를 얻을 수 있습니까?

하이브리드 방식

일부 기업에서는 로그 파일과 페이지 태그를 통해 데이터를 수집하고 두 가지 유형을 모두 분석할 수 있는 솔루션을 개발합니다.하이브리드 방법을 사용함으로써 두 방법 모두 자체보다 더 정확한 통계를 생성하는 것을 목표로 한다.초기 하이브리드 솔루션은 1998년 Rufus Evison에 [citation needed]의해 생산되었습니다.

방문자의 지리 위치

IP 지리 위치 정보를 사용하여 방문자의 위치를 추적할 수 있습니다.IP 지리 위치 데이터베이스 또는 API를 사용하여 방문자를 도시,[9] 지역 또는 국가 수준으로 지리 위치시킬 수 있습니다.

IP 인텔리전스(Internet Protocol(IP) 인텔리전스는 인터넷을 매핑하고 지리적 위치(국가, 지역, 주, 시, 우편 번호), 연결 유형, 인터넷 서비스 공급자(ISP), 프록시 정보 등의 매개 변수별로 IP 주소를 분류하는 기술입니다.IP 인텔리전스의 제1세대는 지오타겟팅 또는 지오로케이션 테크놀로지라고 불렸습니다.이 정보는 온라인 광고, 행동 타겟팅, 콘텐츠 현지화(또는 웹사이트 현지화), 디지털 권리 관리, 퍼스낼라이제이션, 온라인 부정행위 검출, 현지화 검색, 확장 분석, 글로벌트래픽 관리, 컨텐츠 배포 등의 애플리케이션에서 온라인으로 시청자를 세분화하기 위해 사용됩니다.

분석 클릭

왼쪽의 참조 페이지와 두께와 폭이 다른 화살표와 직사각형을 클릭하여 이동량을 상징합니다.

Clickstream이라고하는 클릭 분석은 클릭에 특히 주의를 기울이는 웹 분석의 특별한 유형입니다.

일반적으로 클릭 분석은 온 사이트 분석에 초점을 맞춥니다.웹 사이트의 편집자는 클릭 분석을 사용하여 해당 사이트의 사용자가 클릭하는 위치에 대한 특정 사이트의 성능을 결정합니다.

또한 클릭 분석은 원하는 정보의 유형에 따라 실시간 또는 "비실시간"으로 발생할 수 있습니다.일반적으로 트래픽이 많은 뉴스 미디어 사이트의 1면 편집자는 콘텐츠를 최적화하기 위해 실시간으로 페이지를 모니터링하고자 합니다.편집자, 설계자 또는 기타 유형의 이해관계자는 더 넓은 기간 동안 클릭을 분석하여 작가, 디자인 요소 또는 광고 등의 성과를 평가할 수 있습니다.

클릭에 대한 데이터는 적어도 두 가지 방법으로 수집할 수 있습니다.이상적으로는 클릭 발생 시 "로그"되며, 이 방법에서는 이벤트 발생 시 관련 정보를 픽업하는 기능이 필요합니다.또는 페이지 보기가 클릭의 결과라고 가정하고 해당 페이지 보기로 이어진 모의 클릭을 기록할 수 있습니다.

고객 라이프 사이클 분석

고객 라이프 사이클 분석은 라이프 사이클 [citation needed]마케팅의 범위에 포함되는 방문자 중심의 측정 방법입니다.페이지 뷰, 클릭 및 기타 이벤트(API 호출, 서드파티 서비스 액세스 등)는 모두 개별 데이터 포인트로 저장되지 않고 개별 방문자에게 연결됩니다.고객 라이프 사이클 분석에서는 모든 데이터 포인트를 방문자의 행동과 웹사이트 [citation needed]최적화에 대한 통찰력을 제공할 수 있는 마케팅 흐름에 연결하려고 합니다.

기타 방법

다른 데이터 수집 방법이 사용될 수 있습니다.패킷 스니핑은 웹 서버와 외부 세계를 통과하는 네트워크 트래픽을 스니핑하여 데이터를 수집합니다.패킷 스니핑에는 웹 페이지 또는 웹 서버가 변경되지 않습니다.웹 분석 기능을 웹 서버 소프트웨어에 통합하는 것도 가능합니다.[10]두 방법 모두 다른 방법보다 더 나은 실시간 데이터를 제공한다고 주장합니다.

온사이트 웹 분석 지표

업계 단체들은 한동안 유용하고 결정적인 정의에 대해 합의하려고 노력해 왔기 때문에 웹 분석에는 세계적으로 합의된 정의가 없습니다.이 분야에서 의견을 모은 주체는 IAB(Interactive Advertising Bureau), JICWEBS(영국과 아일랜드의 웹 표준을 위한 공동 산업 위원회), DAA(Digital Analytics Association, 많은 경우 WAA(Web Analytics Association)입니다.alytics 툴을 다른 툴로 변환하기 때문에, 이러한 규칙에 근거해, 다음의 리스트가 유용한 시작점이 될 수 있습니다.

  • 바운스 레이트 - 해당 페이지에서 다른 상호 작용(클릭)이 없는 단일 페이지 방문 비율입니다.즉, 특정 세션에서 한 번 클릭하는 것을 바운스라고 합니다.
  • 클릭 경로 - 방문 또는 세션 내 페이지 보기의 시간순서입니다.
  • 히트 - 웹 서버로부터의 파일 요청입니다.로그 분석에서만 사용할 수 있습니다.한 웹사이트가 받은 조회수는 그 인기를 과시하기 위해 자주 인용되지만, 이 수치는 매우 오해의 소지가 있고, 인기를 극적으로 과대평가한다.하나의 웹 페이지는 일반적으로 여러 개의 개별 파일(대개 수십 개)로 구성되어 있으며, 각 파일은 페이지가 다운로드될 때 히트수로 계산되므로 실제로 웹 사이트의 인기보다 웹 사이트의 개별 페이지 복잡성을 더 많이 반영합니다.방문수 또는 페이지뷰의 합계를 통해 보다 현실적이고 정확한 인기 평가를 할 수 있습니다.
  • 페이지 보기 - 웹 분석 도구 설정에서 페이지로 정의된 파일 또는 경우에 따라 마우스 클릭과 같은 이벤트에 대한 요청입니다.페이지 태그에서 실행 중인 스크립트의 발생.로그 분석에서는 페이지 표시에 필요한 모든 자원(이미지, .js 및 .css 파일)도 웹 서버에서 요구되므로 단일 페이지 뷰에서 여러 히트를 생성할 수 있습니다.
  • 방문자/고유 방문자/고유 사용자 - 정의된 기간(, 주 또는 월 등) 내에 페이지 뷰 또는 조회 수를 생성하는 고유 식별 클라이언트입니다.고유하게 식별되는 클라이언트는 보통 머신(예를 들어 작업 중인 데스크톱 컴퓨터)과 브라우저(그 머신의 Firefox)의 조합입니다.식별은 보통 사이트 페이지 코드에 의해 컴퓨터에 배치된 영구 쿠키를 통해 이루어집니다.로그 파일 분석에서 사용되는 오래된 방법은 컴퓨터의 IP 주소와 브라우저가 웹 서버에 제공하는 사용자 에이전트(브라우저) 정보의 고유한 조합입니다.'방문자'는 방문 시 컴퓨터 앞에 앉아 있는 사람과 같지 않다는 것을 이해하는 것이 중요합니다. 왜냐하면 개인은 다른 컴퓨터를 사용하거나 같은 컴퓨터 상에서 다른 브라우저를 사용할 수 있기 때문에 각각의 상황에서 다른 방문자로 인식되기 때문입니다.방문자가 플래시 LSO(Local Shared Objects)에 의해 고유하게 식별되는 경우는 점점 더 드물고, 이는 개인 정보 보호 적용의 영향을 덜 받습니다.
  • 방문/세션 - 방문 또는 세션은 일련의 페이지 요청으로 정의됩니다.태그(태그)의 경우 고유하게 식별된 동일한 클라이언트로부터의 이미지 요청입니다.고유 클라이언트는 일반적으로 브라우저 쿠키에 배치된 IP 주소 또는 고유 ID로 식별됩니다.일정 시간(분) 동안 요청이 기록되지 않은 경우 방문은 종료된 것으로 간주됩니다.30분 제한("타임아웃")은 많은 분석 도구에서 사용되지만 일부 도구(예: Google Analytics)에서는 다른 분 단위로 변경할 수 있습니다.분석 데이터 수집기와 분석 도구는 방문자가 페이지 뷰 간에 다른 사이트를 방문했는지 여부를 확인할 수 있는 신뢰할 수 있는 방법이 없습니다. 이벤트(페이지 뷰, 클릭, 기록되는 모든 것)가 서로 30분 이내이면 방문은 한 번의 방문으로 간주됩니다.방문은 한 페이지 보기 또는 수천 개의 보기로 구성될 수 있습니다.페이지 로드 간격에 방문자가 페이지를 계속 보고 있음을 나타내는 경우 고유한 방문 세션을 연장할 수도 있습니다.
  • 활성 시간/계약 시간 - 방문자가 실제로 웹 페이지의 컨텐츠와 대화하는 데 소비하는 평균 시간입니다. 마우스 이동, 클릭, 호버 및 스크롤을 기준으로 합니다.세션 기간 및 페이지 뷰 기간/시간 페이지와 달리 이 메트릭은 최종 페이지 뷰에서 작업 기간을 정확하게 측정할 수 있지만 많은 분석 도구나 데이터 수집 방법에서는 사용할 수 없습니다.
  • 평균 세션당 페이지 깊이/페이지 뷰 수 - 페이지 깊이는 평균 방문의 대략적인 "크기"로, 페이지 뷰의 총수를 방문 총수로 나누어 계산합니다.
  • 평균 페이지 보기 기간 - 방문자가 사이트의 평균 페이지에서 보내는 평균 시간입니다.
  • 클릭 - "사이트의 한 페이지에서 다른 페이지로 하이퍼링크를 수행하는 사용자의 단일 인스턴스를 참조합니다."
  • 이벤트 - 웹 사이트에서 발생하는 개별 액션 또는 액션 클래스입니다.페이지 보기는 이벤트 유형입니다.이벤트는 클릭, 양식 제출, 키 누르기 이벤트 및 기타 클라이언트 측 사용자 작업도 캡슐화합니다.
  • 종료율/% 종료 - 웹 사이트가 아닌 개별 페이지에 적용되는 통계입니다.해당 페이지가 방문의 마지막 페이지인 페이지를 보는 방문 비율입니다.
  • First visit/first session - (일부 툴에서는 'Absolute Unique Visiter'라고도 함)이론적으로 이전에 방문하지 않은 고유 식별된 클라이언트의 방문입니다.고유하게 식별된 클라이언트가 이전에 사이트에 방문한 적이 있는지 여부를 알 수 있는 유일한 방법은 영구 쿠키가 있는지 또는 이전 방문에서 받은 디지털 핑거 프린트를 사용하는 이기 때문에 사이트의 쿠키가 이전 방문 이후에 삭제된 경우 First Visit 라벨은 신뢰할 수 없습니다.
  • Frequency/Session per unique - Frequency는 방문자가 특정 기간에 웹사이트에 방문하는 빈도를 측정합니다.총 세션 수(또는 방문 수)를 월 또는 년 등 지정된 기간 동안의 고유 방문자 수로 나누어 계산합니다.때때로 그것은 "충성"이라는 용어와 함께 사용된다.
  • 인상 - 가장 일반적인 인상 정의는 표시된 페이지에 표시되는 광고의 인스턴스입니다.광고는 실제로 화면에 표시되는 영역 아래에 표시되는 페이지에 표시될 수 있으므로 대부분의 인상 척도가 반드시 광고를 볼 수 있음을 의미하지는 않습니다.
  • 신규 방문자 - 이전에 방문하지 않은 방문자.이 정의는 어느 정도의 혼란을 일으키며(아래의 일반적인 혼동 참조), 때로는 첫 방문 분석으로 대체된다.
  • 페이지 표시 시간/페이지 표시 시간/페이지 표시 기간 - 단일 페이지(또는 블로그, 광고 배너)가 화면에 표시되는 시간으로, 해당 페이지의 요청 시간과 다음 기록 요청 시간 사이의 계산된 차이로 측정됩니다.다음 번 기록된 요청이 없는 경우 해당 페이지 인스턴스의 표시 시간은 보고서에 포함되지 않습니다.
  • 재방문자 - 이전에 한 번 이상 방문한 방문자.마지막 방문과 현재 방문 사이의 기간은 방문자 접수라고 하며 일 단위로 측정됩니다.
  • Return visitor - 보고기간 중 사이트 방문과 보고기간 전에 방문했던 고유 방문자.개인은 보고기간 동안 한 번만 계산됩니다.
  • 세션 기간/방문 기간 - 방문자가 방문할 때마다 사이트에서 보내는 평균 시간입니다.이 값은 모든 세션의 총 지속시간을 세션의 총수로 나눈 값으로 계산됩니다.분석 프로그램이 최종 페이지 [citation needed]뷰의 길이를 측정할 수 없기 때문에 이 메트릭은 복잡해질 수 있습니다.
  • Single page visit/singleton - 한 페이지만 볼 수 있는 방문('바운스'가 아님).
  • 사이트 오버레이는 통계(클릭) 또는 핫스팟을 실제 위치에 따라 웹 페이지의 시각적 스냅샷에 중첩하는 보고서 기술입니다.
  • 클릭률이란 페이지, 이메일 또는 광고를 보는 총 사용자 수에 대한 특정 링크를 클릭하는 사용자의 비율입니다.일반적으로 특정 웹 사이트에 대한 온라인 광고 캠페인의 성공 여부 및 이메일 캠페인의 효과를 측정하는 데 사용됩니다.

오프사이트 웹 분석

오프사이트 웹 분석은 오픈 데이터 분석, 소셜 미디어 탐색, 웹 속성의 음성 공유를 기반으로 합니다.일반적으로 소셜 미디어 또는 다른 웹 사이트에서 이 사이트에 태그된 키워드를 식별하여 사이트를 마케팅하는 방법을 이해하는 데 사용됩니다.

웹 분석의 일반적인 혼란 원인

호텔 문제

호텔 문제는 일반적으로 웹 분석 사용자가 가장 먼저 접하는 문제입니다.문제는 한 달 동안 매일의 고유 방문자 수가 그 달의 고유 방문자 수와 합계가 같지 않다는 것이다.이는 경험이 없는 사용자가 사용하는 분석 소프트웨어에서 문제가 되는 것으로 보입니다.실제로는 메트릭 정의의 단순한 속성입니다.

그 상황을 상상하는 방법은 호텔을 상상하는 것이다.그 호텔에는 두 개의 방(A호와 B호)이 있다.

1일째 2일째 03일째
A실 존. 존. 마크. 2개의 고유 사용자
B실 마크. 안네야. 안네야. 2개의 고유 사용자
2 2 2 ?

표에 나타나 있듯이, 호텔에는 3일 동안 매일 두 명의 독특한 사용자가 있습니다.따라서 요일에 대한 총합은 6이다.

이 기간 동안 각 방에는 두 명의 고유한 사용자가 있었습니다.따라서 방의 총합은 4이다.

사실 이 기간 동안 호텔에 온 방문객은 3명뿐입니다.문제는 객실에서 2박을 한 사람은 하루에 한 번 세면 두 번 세어지지만, 그 기간의 합계를 보면 한 번 세어진다.웹 분석용 소프트웨어는 선택한 기간 동안 이 값을 정확하게 합산하기 때문에 사용자가 합계를 비교하려고 할 때 문제가 발생합니다.

Analytics Poisoning

인터넷이 성숙함에 따라 자동화된 봇 트래픽의 확산은 웹 [citation needed]분석의 신뢰성에 점점 더 큰 문제가 되고 있습니다.봇은 인터넷을 통과할 때 유기 사용자와 유사한 방식으로 웹 문서를 렌더링하므로 웹 분석에서 트래픽 계산에 사용하는 것과 동일한 코드를 우연히 트리거할 수 있습니다.이와 함께 웹 분석 이벤트의 부수적인 트리거는 데이터의 해석 가능성과 해당 데이터에 대한 추론에 영향을 미칩니다.IPM은 Google Analytics와 경쟁사가 공통의 봇 도입 [11]전략에 의해 어떻게 쉽게 트리거되는지에 대한 개념 증명을 제공했습니다.

웹 분석 방법

쿠키에 문제가 생기

지금까지 페이지 태그 부착 분석 솔루션 공급업체는 웹 사이트의 도메인이 아닌 공급업체의 도메인에서 전송된 타사 쿠키를 사용해 왔습니다.타사 쿠키는 항상 공급업체의 서버에 의해 처리되기 때문에 회사 사이트 내에서 관련 없는 여러 도메인을 통과하는 방문자를 처리할 수 있습니다.

그러나 타사 쿠키를 사용하면 원칙적으로 여러 회사의 사이트에서 개별 사용자를 추적할 수 있으므로 분석 공급업체는 사용자가 개인 정보를 제공한 사이트에서의 활동과 사용자가 익명으로 생각되는 다른 사이트에서의 활동을 조합할 수 있습니다.웹 분석 업체들은 이를 부인하고 있지만 배너 광고를 제공하는 업체들과 같은 다른 업체들은 그렇게 하고 있습니다.따라서 쿠키에 대한 개인 정보 보호 문제로 인해 소수의 사용자가 타사 쿠키를 차단하거나 삭제하게 되었습니다.2005년 일부 보고서에 따르면 인터넷 사용자의 약 28%가 서드파티 쿠키를 차단했으며 22%는 적어도 [12]한 달에 한 번 서드파티 쿠키를 삭제했다.페이지 태그 부착 솔루션의 대부분의 공급업체는 적어도 퍼스트 파티 쿠키(클라이언트 하위 도메인에서 할당된 쿠키)를 사용할 수 있는 옵션을 제공하도록 이전했습니다.

또 다른 문제는 쿠키 삭제입니다.웹 분석에서 고유한 방문자를 식별하는 데 쿠키가 사용되는 경우 통계는 고유한 방문자 ID를 유지하는 영구 쿠키에 종속됩니다.사용자는 쿠키를 삭제할 때 보통 퍼스트 파티와 서드 파티 쿠키를 모두 삭제합니다.사이트와의 상호 작용 사이에 이 작업을 수행할 경우 사용자는 다음 상호 작용 지점에 처음 방문자로 나타납니다.지속적이고 고유한 방문자 ID가 없으면 변환, 클릭 스트림 분석 및 시간 경과에 따른 고유 방문자의 활동에 따라 달라지는 기타 메트릭이 정확할 수 없습니다.

IP 주소가 항상 사용자에게 고유한 것은 아니며 대규모 그룹 또는 프록시에 의해 공유될 수 있기 때문에 쿠키가 사용됩니다.경우에 따라서는 쿠키를 사용할 수 없는 경우 방문자를 보다 정확하게 식별하기 위해 IP 주소가 사용자 에이전트와 결합됩니다.그러나 프록시 서버의 배후에 있는 사용자가 동일한 사용자 에이전트를 가지고 있는 경우가 많기 때문에 이 문제는 부분적으로만 해결됩니다.사용자를 일의로 식별하는 다른 방법은 기술적으로 어려운 것으로 추적 가능한 사용자를 제한하거나 의심스러운 것으로 간주될 수 있습니다.쿠키는 [13]스파이웨어로 간주되는 기술을 사용하지 않고 최소 공통 분모에 도달합니다.

보안 분석(측정기)방법

서드파티제의 정보 수집에는, 네트워크의 제한이나 시큐러티가 적용되는 것에 주의해 주세요.국가, 서비스 공급자 및 개인 네트워크는 사이트 방문 데이터가 제3자에게 전송되는 것을 방지할 수 있습니다.위에서 설명한 모든 방법(및 샘플링과 같이 여기에 언급되지 않은 일부 방법)은 조작(인플레이션과 디플레이션 모두)에 취약하다는 주요 문제를 안고 있습니다.즉, 이러한 방법은 (합리적인 보안 모델에서) 부정확하고 안전하지 않음을 의미합니다.이 문제는 여러 [14][15][16][17]논문에서 다루어졌지만, 지금까지 이 문서에서 제안된 솔루션은 이론적인 것으로 남아 있습니다.이는 아마도 엔지니어링 커뮤니티의 관심이 부족하거나 현재 상황이 대형 웹사이트 소유자에게 제공하는 금전적인 이익 때문일 수 있습니다.상세한 것에 대하여는, 상기의 문서를 참조해 주세요.

「 」를 참조해 주세요.

레퍼런스

  1. ^ WAA 표준 위원회"웹 분석 정의"Washington DC: Web Analytics Association (2008).
  2. ^ Nielsen, Janne (2021-04-27). "Using mixed methods to study the historical use of web beacons in web tracking". International Journal of Digital Humanities. 2 (1–3): 65–88. doi:10.1007/s42803-021-00033-4. ISSN 2524-7832. S2CID 233416836.
  3. ^ Jansen, B. J. (2009년)웹 분석을 통한 사용자-웹 상호 작용 이해정보개념, 검색, 서비스에 관한 종합강의, 1(1), 1-102.
  4. ^ Zheng, G. & Peltsverger S. (2015) Web Analytics 개요, 책:정보과학기술 백과사전, 제3판, 출판사: IGI Global, 편집자:메흐디 호스로푸어
  5. ^ Brian Clifton과 Omega Digital Media Ltd의 웹 트래픽 데이터 소스벤더 비교
  6. ^ 마케팅 관리: 알랭 졸리베르, 피에르-루이 두부아, 한스 뮐바허, 로랑 플로레스, 피에르-루이 졸리베르 두부아, 2012년 페이지 359에 의한 가치 창조 프로세스.
  7. ^ 온라인 비즈니스 성장을 위한 정확성 향상 - 웹 분석 정확도 백서
  8. ^ "로그 파일 분석과 페이지 태그 재방문": McGill University Web Analytics 블로그 기사(CMIS 530) 2011년 7월 6일 Wayback Machine에서 아카이브
  9. ^ IPInfoDB (2009-07-10). "IP geolocation database". IPInfoDB. Retrieved 2009-07-19.
  10. ^ Hu, Xiaohua; Cercone, Nick (1 July 2004). "A Data Warehouse/Online Analytic Processing Framework for Web Usage Mining and Business Intelligence Reporting". International Journal of Intelligent Systems. 19 (7): 585–606. doi:10.1002/int.v19:7.
  11. ^ "Analytics Poisoning: A Short Review - IPM Corporation". 5 December 2020. Retrieved July 29, 2022.
  12. ^ McGann, Rob (14 March 2005). "Study: Consumers Delete Cookies at Surprising Rate". Retrieved 3 April 2014.
  13. ^ "Home News Access the Guide Tools Education Shopping Internet Cookies- Spyware or Neutral Technology?". CNET. February 2, 2005. Retrieved 24 April 2017.
  14. ^ Naor, M.; Pinkas, B. (1998). "Secure and efficient metering". Advances in Cryptology — EUROCRYPT'98. Lecture Notes in Computer Science. Vol. 1403. p. 576. doi:10.1007/BFb0054155. ISBN 978-3-540-64518-4.
  15. ^ Naor, M.; Pinkas, B. (1998). "Secure accounting and auditing on the Web". Computer Networks and ISDN Systems. 30 (1–7): 541–550. doi:10.1016/S0169-7552(98)00116-0.
  16. ^ Franklin, M. K.; Malkhi, D. (1997). "Auditable metering with lightweight security". Financial Cryptography. Lecture Notes in Computer Science. Vol. 1318. pp. 151. CiteSeerX 10.1.1.46.7786. doi:10.1007/3-540-63594-7_75. ISBN 978-3-540-63594-9.
  17. ^ Johnson, R.; Staddon, J. (2007). "Deflation-secure web metering". International Journal of Information and Computer Security. 1: 39. CiteSeerX 10.1.1.116.3451. doi:10.1504/IJICS.2007.012244.

서지학

  • Clifton, Brian (2010) Advanced Web Metrics with Google Analytics, 제2판, Sybex (페이퍼백)
  • Kaushik, Avinash(2009) Web Analytics 2.0 - 온라인 어카운터빌리티의 예술과 고객 중심의 과학.사이벡스, 와일리
  • Mortensen, Dennis R. (2009) 야후!Web Analytics.시벡스
  • Farris, P., Bendle, N.T, P.Feifer, P.E. Reibstein, D.J. (2009) 주요 마케팅 지표 모든 관리자가 알아야 할 50가지 이상의 지표, 런던 프렌티스 홀.
  • Plaza, B(2009) Google Analytics를 통한 웹 트래픽 소스 효과 모니터링:시계열에 대한 실험입니다.ASLIB Proceedings, 61(5): 474~482.
  • Arikan, Akin (2008)멀티채널 마케팅온라인 및 오프라인 성공을 위한 메트릭 및 방법.시벡스
  • Tullis, Tom & Albert, Bill (2008) 사용자 경험 측정.사용성 지표 수집, 분석 및 제시벌링턴엘세비어 모건 카우프만입니다
  • Kaushik, Avinash(2007) 웹 분석:하루 1시간, 사이벡스, 와일리
  • Bradley N(2007) 마케팅 리서치.툴과 테크닉.옥스퍼드 대학 출판부, 옥스퍼드
  • Sostre, Pedro 및 LeClaire, Jennifer(2007)의 Web Analytics for Dummies.와일리.
  • Burby, Jason 및 Atchison, Shane(2007) 실행 가능한 웹 분석:데이터를 사용하여 현명한 비즈니스 의사 결정
  • Davis, J. (2006) '마케팅 지표:효과적인 어카운터블 마케팅 플랜 작성 방법' John Wiley & Sons (아시아)
  • Peterson Eric T(2005)의 Web 사이트 측정 해커.오라일리 전자책
  • Peterson Eric T (2004) Web Analytics 상세:고객의 웹 사이트가 비즈니스에 미치는 영향을 이해하기 위한 마케터 가이드.Celilo 그룹 미디어
  • Lenskold, J. (2003) '마케팅 ROI: 수익을 위한 전략 계획, 측정 및 최적화 방법' 런던: McGrow Hill Contemporary
  • Sterne, J. (2002) Web 메트릭스, Proven Methods for Measuring Web Site Success, 런던: John Wiley & Sons.
  • Srinivasan, J. (2001) E커머스 메트릭스, 모델 및 예시, 런던: 프렌티스 홀.
  • Jeng, J. G. 및 Peltsverger, S. (2015) Web Analytics 개요, 책:정보과학기술 백과사전, 제3판, 출판사: IGI Global, 편집자:메흐디 호스로푸어