블로그 스크래핑
Blog scraping블로그 스크래핑은 다수의 블로그를 통해 스캔하는 과정으로, 대개 자동화 소프트웨어의 사용을 통해 콘텐츠를 검색하고 복사하는 과정이다.소프트웨어와 소프트웨어를 운영하는 개인을 블로그 스크레이퍼라고 부르기도 한다.
블로그 스크래핑은 스크래핑 과정을 시작하는 개인이 소유하지 않은 블로그 또는 블로그 콘텐츠를 복사하는 것이다.저작권을 완화하는 면허가 없거나 국가가 공정한 사용법이나 사적인 사용법을 가지고 있지 않은 한, 그 자료가 저작권을 침해하는 것으로 간주된다.스크랩된 콘텐츠는 스팸 블로그나 스플래그에 자주 사용되는데, 이런 곳을 스크래퍼 사이트라고 한다.
문제들
저작권이 있는 자료를 수집하는 블로그 스크레이퍼는 사례, 자료 사용량, 국가에 따라 법률 위반으로 볼 수 있다.블로그 스크래핑은 블로그를 소유한 개인이나 기업에게 문제를 일으킬 수 있다.블로그 스크래핑은 특히 기업주나 기업 블로거들에게 걱정스럽다.스크래퍼는 독립 블로그나 비즈니스 블로그에서 전체 게시물을 복사할 수 있다.복제된 내용에는 저자의 태그와 저자의 사이트로 되돌아가는 링크가 포함될 것이다(저자의 태그에 해당 링크가 나타나는 경우).그러나 대부분의 블로그 스크레이퍼는 키워드와 관련된 내용 중 일부만 자신의 스플로그 주제와 관련이 있다.이를 통해 스크래퍼 사이트의 키워드 관련성을 높인다.둘째, 전체 게시물을 스크랩하지 않음으로써, 어떤 아웃바운드 링크도 제거되고, 이것은 그들의 검색 엔진 순위가 감소되지 않음을 의미한다.
또한 스크랩된 콘텐츠는 문자 그대로 모든 종류의 스플래그 또는 RSS가 공급한 스팸 사이트에 나타날 수 있다.이는 의심하지 않는 개인이 원본 작성자와 그의 청중에게 불쾌감을 줄 수 있는 포르노나 유사한 형태의 콘텐츠를 홍보하는 사이트에 그들의 창조적이거나 저작권이 있는 자료를 발견할 수 있다는 것을 의미한다.이것은 원작자의 평판을 해칠 수도 있다.
참조