오늘은 추천 시스템의 Matrix Factorization(MF)을 리뷰해보고자 한다. 리뷰에 앞서 협업 필터링의 두 가지 방식에 대해 짚고 넘어가자. 협업 필터링의 두 가지 방식 Memory-based Approach Memory-based Approach는 추천할 때마다 Raw 데이터를 활용하고 계산해서 이를 추천에 사용하는 방식이다. 기본적인 협업필터링 알고리즘은 모두 메모리 기반 알고리즘이라고 보면 되고, 이는 계산량이 많기 때문에 현실에서 빅데이터를 사용한 모델에는 적합한 방법은 아니다. Model-based Approach 우리가 오늘 살펴보고자 하는 Model-based Approach는 Raw 데이터로 미리 학습한 모델을 만들어두고, 추천 시에 학습한 모델을 사용하여 예측하는 방식이다. M..
이번 학기 추천시스템 강의를 듣게 되었는데, 수업 이전에 간단히 내용을 리마인드 하고자 글을 쓴다. 추천 시스템의 주요 유형 콘텐츠 기반 필터링 아이템의 콘텐츠에 집중하여 사용자가 선호하는 아이템의 특성을 분석한 후 유사한 특성을 가진 다른 아이템을 추천하는 방식이다. 작동 원리사용자가 선호한 아이템의 속성을 분석한다.사용자의 이전 행동이나 명시적 평가를 통해 선호도를 파악한 후, 그와 유사한 속성을 가진 다른 아이템을 추천한다.장점아이템 속성만으로 신규 아이템에 대한 추천이 가능하여, Cold Start 문제에서 상대적 이점을 가진다.사용자의 명시적 선호도를 기반으로 직관적인 추천이 가능하다.단점사용자가 선호하는 아이템의 범위에 갇혀 새로운 경험을 제공하는데 한계가 존재한다. (추천 다양성이 낮아짐)아..
최근 Recsys 분야의 추천은 전통적인 CF(협업 필터링), MF(행렬 분해) 알고리즘을 넘어 딥러닝으로 확장되고 있는 추세이다. 최근 많은 기업에서 GNN(Graph Neural Network) 알고리즘을 사용하고 있으며, 사용자의 선호도를 그래프 구조로 파악하고자 하는 연구의 흐름을 보이고 있다. 본인도 RecSys 관련 프로젝트를 하나 기획하고 있는데, 관계나 상호작용과 같은 추상적인 개념을 다루기에 적합한 GNN 알고리즘을 사용해볼 계획이기에 정리해보고자 한다. GNN(Graph Neural Network) 정리에 앞서 해당 알고리즘은 이름에서 볼 수 있듯 Graph 자료구조를 활용하는데, 우선적으로 Graph에 대한 정리를 한번 제대로 하고 가는 것이 이해에 도움이 될 듯하여 Graph 자료구..
RecSys 공부를 하며 가장 먼저 선행되어야 할 공부는 개인적으로 알고리즘 공부라고 생각된다. 몇억개의 로그 데이터를 다루고 분석함에 있어서 빈틈 없는 알고리즘 구조를 익혀야 한다고 생각한다.. 그 중 가장 기본이 되는 Apriori 알고리즘을 공부하고자 하는데, 그 전에 선행되어야 하는 Association Rule에 대해 간략히 정리해보고자 한다. Association Rule 대학교 데이터 분석 수업시간에 마트에서 기저귀를 사는 사람들은 맥주도 함께 사간다는 예시를 들은 경험이 있다. 연관 규칙(Association Rule)은 이 예시와 같다. 즉, 이렇게 어떤 사건이 얼마나 자주 발생하고 서로 얼마나 연관되어 있는지를 나타내는 것이 Association Rule이라고 보면 된다. 연관 규칙(A..