전통문화대전망 - 전통 미덕 - 추천 시스템의 주요 추천 방법
추천 시스템의 주요 추천 방법
콘텐츠 기반 추천(Content-based Recommendation)은 정보 필터링 기술의 지속 발전으로, 프로젝트에 대한 사용자의 평가에 의존하지 않고 프로젝트의 콘텐츠 정보를 기반으로 추천을 제공합니다. 콘텐츠 설명의 예에서 사용자 관심 정보를 얻기 위해 기계 학습 방법을 사용할 필요성이 더 커졌습니다. 콘텐츠 기반 추천 시스템에서는 사용자 평가 객체의 특성을 바탕으로 관련 특징의 속성으로 아이템이나 객체를 정의하며, 시스템은 사용자의 관심분야를 학습하고 사용자 프로필과 예측할 아이템의 일치 정도를 검사합니다. 사용자의 프로필 모델은 사용되는 학습 방법에 따라 달라집니다. 일반적으로 사용되는 방법에는 의사결정 트리, 신경망 및 벡터 기반 표현 방법이 포함됩니다. 콘텐츠 기반 사용자 프로필에는 사용자의 과거 데이터가 필요하며 사용자 프로필 모델은 사용자의 기본 설정이 변경됨에 따라 변경될 수 있습니다.
콘텐츠 기반 추천 방식의 장점은 1) 다른 사용자의 데이터가 필요하지 않으며 콜드 스타트 문제와 희소 문제가 없습니다. 2) 특별한 관심분야와 취미를 가진 사용자에게 추천을 할 수 있습니다. 3) 새로운 프로젝트나 인기가 없는 프로젝트를 추천할 수 있으며, 새로운 프로젝트에는 문제가 없습니다. 4) 추천 아이템의 콘텐츠 특성을 나열하여 해당 아이템이 추천되는 이유를 설명할 수 있습니다. 5) 상당히 성숙한 분류 학습 기술 등 비교적 좋은 기술이 있습니다.
단점은 콘텐츠를 의미있는 특징으로 쉽게 추출해야 하고, 특징 콘텐츠가 잘 구성되어야 하며, 사용자의 취향을 콘텐츠 특징의 형태로 표현해야 하며, 다른 사용자의 취향은 이를 표현할 수 없다는 점이다. 상황을 명확하게 판단하십시오. 협업 필터링 추천 기술은 추천 시스템에 사용되는 가장 초기이자 가장 성공적인 기술 중 하나입니다. 일반적으로 Nearest Neighbor 기술을 사용하는데, 사용자의 과거 선호도 정보를 이용하여 사용자 간의 거리를 계산한 다음, 대상 사용자의 가장 가까운 이웃 사용자의 제품 평가에 대한 가중 평가 값을 사용하여 특정 제품에 대한 대상 사용자의 선호도를 예측합니다. 그러면 시스템은 이를 사용하여 특정 제품에 대한 대상 사용자의 선호도를 예측합니다. 협업 필터링의 가장 큰 장점은 추천 개체에 대한 특별한 요구 사항이 없으며 음악, 영화 등 구조화되지 않은 복잡한 개체를 처리할 수 있다는 점입니다.
협업 필터링은 사용자가 정말 관심 있는 콘텐츠를 찾는 좋은 방법은 먼저 이 사용자와 비슷한 관심사를 가진 다른 사용자를 찾은 다음 그들이 관심 있는 콘텐츠를 추천하는 것이라는 가정에 기반합니다. 이 사용자에게. 기본 아이디어는 이해하기 매우 쉽습니다. 일상 생활에서 우리는 종종 좋은 친구의 추천을 사용하여 선택을 합니다. 협업 필터링은 이 아이디어를 전자상거래 추천 시스템에 적용하고 특정 콘텐츠에 대한 다른 사용자의 평가를 기반으로 대상 사용자에게 추천을 제공합니다.
협업 필터링을 기반으로 한 추천 시스템은 사용자 관점에서 상응하는 추천을 한다고 할 수 있으며, 즉 사용자가 얻은 추천은 구매 패턴이나 시스템에서 암묵적으로 얻어지는 것입니다. 사용자는 설문조사 양식을 작성하는 등 자신의 관심사에 맞는 추천 정보를 찾기 위해 열심히 노력해야 합니다.
콘텐츠 기반 필터링 방법에 비해 협업 필터링은 다음과 같은 장점이 있습니다. 1) 미술품, 음악 등 기계가 자동으로 콘텐츠 분석을 수행하기 어려운 정보를 필터링할 수 있습니다. 2) 다른 사람의 경험을 공유하고, 불완전하고 부정확한 내용 분석을 피하고, 복잡하고 표현하기 어려운 개념(정보 품질, 개인 취향 등)을 기반으로 필터링할 수 있습니다. 3) 새로운 정보를 추천하는 능력. 내용이 전혀 다른 정보가 발견될 수 있으며, 사용자는 추천 정보의 내용을 미리 예측할 수 없습니다. 이는 협업 필터링과 콘텐츠 기반 필터링의 큰 차이점이기도 합니다. 콘텐츠 기반 필터링은 사용자가 이미 익숙한 콘텐츠를 추천하는 반면, 협업 필터링은 사용자가 아직 발견하지 못한 잠재적인 관심과 선호도를 발견할 수 있습니다. 4) 유사한 다른 사용자의 피드백 정보를 효과적으로 활용하여 사용자 피드백의 양을 줄이고 개인화 학습 속도를 높일 수 있습니다.
협동 필터링은 대표적인 추천 기술로 활용도가 높지만, 여전히 해결해야 할 문제가 많다. 가장 일반적인 문제는 희소성과 확장성입니다. 연관 규칙 기반 추천은 구매한 제품을 규칙 헤더로, 규칙 본문을 추천 객체로 하는 연관 규칙을 기반으로 합니다. 연관 규칙 마이닝은 판매 과정에서 다양한 제품의 상관 관계를 발견할 수 있으며 소매 업계에 성공적으로 적용되었습니다. 관리 규칙은 제품을 구매한 거래의 비율이 어느 정도인지 거래 데이터베이스에 집계하는 것입니다. 예를 들어, 우유를 살 때 많은 사람들이 동시에 빵을 살 것입니다.
알고리즘의 첫 번째 단계인 연관 규칙 발견은 가장 중요하고 시간이 많이 걸리는 작업이지만, 이는 알고리즘의 병목 현상이지만 오프라인에서도 수행할 수 있습니다. 둘째, 상품명의 동의어 문제 역시 연관규칙의 어려움이다. 다양한 추천 방법에는 장단점이 있기 때문에 실제로는 하이브리드 추천(Hybrid Recommendation)을 많이 사용합니다. 가장 많이 연구되고 적용되는 방법은 콘텐츠 추천과 협업 필터링 추천의 조합이다.
가장 간단한 방법은 콘텐츠 기반 방법과 협업 필터링 추천 방법을 사용하여 추천 예측 결과를 생성한 다음 특정 방법을 사용하여 결과를 결합하는 것입니다. 이론상으로는 다양한 추천 조합 방법이 있지만 특정 문제에서 모두 효과적인 것은 아닙니다. 조합 추천의 가장 중요한 원칙 중 하나는 조합을 통해 각 추천 기술의 약점을 피하거나 보완하는 것입니다.
조합 방법에 관해서 일부 연구자들은 7가지 조합 아이디어를 제안했습니다. 1) 가중치: 여러 추천 기술의 결과에 가중치를 부여합니다. 2) 전환: 문제 배경과 실제 상황 또는 요구 사항을 기반으로 다양한 추천 기술을 전환하고 사용하기로 결정합니다. 3) 혼합: 여러 추천 기술을 동시에 사용하여 여러 추천 결과를 제공하여 사용자에게 참조를 제공합니다. 4) 특징 조합: 서로 다른 추천 데이터 소스의 특징을 결합하는 것은 다른 추천 알고리즘에서 사용됩니다. 5) 캐스케이드(Cascade): 첫 번째 추천 기술을 사용하여 대략적인 추천 결과를 생성하고, 두 번째 추천 기술은 이 추천 결과를 기반으로 더욱 정확한 추천을 제공합니다. 6) 특징 증대: 한 기술은 추가적인 특징 정보를 생성하고 이를 다른 추천 기술의 특징 입력에 삽입합니다. 7) 메타 수준: 하나의 추천 방법으로 생성된 모델을 다른 추천 방법의 입력으로 사용합니다.