강력한 협업 필터링

Robust collaborative filtering

강력한 협업 필터링 또는 공격에 강한 협업 필터링은 권장 품질을 유지하면서 조작 노력에 대해 협업 필터링을 더욱 강력하게 하는 것을 목표로 하는 알고리즘 또는 기술을 말합니다.일반적으로 이러한 조작 작업은 프로파일 주입 공격이라고도 불리는 실링 공격을 나타냅니다.협업 필터링은 유사한 사용자를 찾아 등급을 조사함으로써 항목에 대한 사용자의 등급을 예측합니다.또한 온라인 시스템에서 사용자 프로파일의 거의 무기한 복사본을 작성할 수 있기 때문에 가짜 프로파일의 여러 복사본이 시스템에 도입되면 협업 필터링이 취약해집니다.모델 베이스와 메모리 베이스의 콜라보레이션필터링의 견고성을 향상시키기 위해서, 몇개의 다른 어프로치가 제안되고 있습니다.그러나 강력한 협업 필터링 기술은 여전히 활발한 연구 분야이며, 이러한 기술의 주요 적용 분야는 아직 정해지지 않았습니다.

서론

협업 필터링의 가장 큰 과제 중 하나는 실링 공격입니다.즉, 악의적인 사용자 또는 경쟁자는 시스템에 특정 수의 가짜 프로파일을 의도적으로 주입할 수 있으며(일반적으로 1~5%) 권장 품질에 영향을 미치거나 자신의 장점을 대신하여 예측 등급을 편향시킬 수 있습니다.주요 실링 공격 전략으로는 랜덤 공격, 평균 공격, 밴드왜건 공격 및 세그먼트 중심 공격이 있습니다.

랜덤 공격은 항목의 서브셋에 랜덤 등급을 부여하는 프로파일을 삽입합니다.평균 공격은 각 [1]항목의 평균 등급을 나타냅니다.밴드왜건 및 세그먼트 중심 공격은 새롭고 정교한 공격 모델입니다.밴드왜건 공격 프로파일은 아이템의 서브셋에 랜덤등급을 부여하고 매우 인기 있는 아이템에 최대등급을 부여하여 이들 가짜 프로파일에 네이버가 많을 가능성을 높입니다.세그먼트 집중 공격은 밴드왜건 공격 모델과 유사하지만 자주 [2]평가되는 것이 아니라 대상 사용자 그룹이 높게 평가할 것으로 예상되는 항목에 최대 등급을 부여한다.

일반적으로 항목 기반 협업 필터링은 사용자 기반 협업 필터링보다 더 강력한 것으로 알려져 있습니다.그러나 항목 기반 협업 필터링은 여전히 밴드왜건 및 세그먼트 공격에 완전히 영향을 받지 않습니다.

강력한 협업 필터링은 일반적으로 다음과 같이 작동합니다.

  1. 스팸 사용자 탐지 모델 구축
  2. 일반 협업 필터링 시스템의 워크플로우를 따르되 비 스팸 사용자의 등급 데이터만 사용하십시오.

사용자 관계

다양한 크기의 밴드왜건 공격 하에서의 코사인 거리 분포

이것은 메모리 베이스의 콜라보레이션 필터링을 보다 견고하게 하기 위해서 Gao등이 제안한 검출 방법입니다.[3] 사용자 유사성을 측정하기 위해 협업 필터링에 사용되는 일반적인 메트릭으로는 Pearson 상관 계수, 관심사 유사성 및 코사인 거리가 있습니다.(정의에 대해서는 메모리 기반 CF를 참조해 주세요).권장자 시스템은 스팸 사용자가 시스템에 존재하는 경우 이들 메트릭의 분포가 다르다는 사실을 이용하여 공격을 검출할 수 있습니다.실링 공격은 단일 가짜 프로파일뿐만 아니라 다수의 유사한 가짜 프로파일을 주입하기 때문에 이러한 스팸 사용자는 일반 사용자보다 비정상적으로 높은 유사성을 갖게 됩니다.

전체 시스템이 이렇게 작동합니다.평가 매트릭스를 지정하면 사용자 관계 메트릭에서 밀도 기반 클러스터링 알고리즘을 실행하여 스팸 사용자를 탐지하고 스팸 사용자에게 0, 일반 사용자에게 1의 가중치를 부여합니다.즉, 시스템은 예측을 계산할 때 일반 사용자의 평가만 고려합니다.나머지 알고리즘은 일반 항목 기반 협업 필터링과 동일하게 작동합니다.

MovieLens 데이터에 대한 실험 결과에 따르면, 이 강력한 CF 접근 방식은 일반 항목 기반 CF에 비해 정확성을 유지하지만 더 안정적입니다.스팸 유저 프로파일이 주입되었을 때, 통상의 CF의 시프트는 30~40%로 예측됩니다만, 이 견고한 어프로치의 시프트는 약 5~10%에 불과합니다.

레퍼런스

  1. ^ Bhaskar Mehta, Thomas Hofmann 및 Wolfgang Nejdl, 견고한 협업 필터링, RecSys '07 Proceedings of the 2007 ACM Conference on Recommender Systems, 49-56
  2. ^ Bamshad Mobasher, Robin Burke, Chad Williams 및 Runa Baumik, 공동 추천에 대한 세그먼트 중심 공격의 분석검출, 웹 마이닝 및 웹 사용 분석의 진보, 2005, 96-118
  3. ^ Min Gao, Bin Ling, Quan Yuan, Chingyu Xiong 및 Linda Yang, 추천자 시스템의 사용자 관계에 기초한 강력한 협업 필터링 접근법, 엔지니어링의 수학적 문제, vol. 2014, 문서 번호 162521