피큐레잇은 기억하고자 하는 경로 정보를 계층화된 북마크로 저장을 하도록 유도하며, 이 데이터를 이용하여 해당 고객이 무슨 컨텐츠에 관심이 있는지를 분석한다. 이 분석을 바탕으로 사용자에게 적합한 컨텐츠를 추천하는 서비스를 운영하고 있다.
피큐레잇이 보유하고 있는 계층화된 북마크 데이터는 사용자가 직접 정리한 인간 지능이 들어간 데이터로, 기존의 데이터와는 다른 고도화된 분석과 추천에 특화된 데이터이다. 이를 바탕으로 분석 알고리즘을 진행하기 앞서, 계층화된 컨텐츠의 메타정보를 자동으로 추출한는 방식을 다음과 같이 정의하고자 한다.
컨텐츠 조회 이력 수집
컨텐츠 조회이력 수집 단계에서는, 사용자가 애플리케이션 통해 자신이저장하고자 하는 컨텐츠 자원을 계층구조로 저장하는 것을 의미한다.
인간지능 지수 평가
여기서 정의한 인간지능 지수란 유저가 앱을 통해 데이터를 등록/정의할 때, 유저가 기여한 수치를 의미한다. 서비스마다 지수에 관련된 수치는 상이하다. 인공지능 지수의 경우 서비스 플랫폼에 따라 다르게 정의할 수 있다.
결과계층 구조화(그림 설명)
계층 구조화는 기존 계층과 인공지능 지수를 고려하여 결과계층을 만드는 과정이다. 인간지능 지수가 높은 계층을 바탕으로 우선순위를 결정하며 여기에 순위가 같은 계층의 순서는 기존의 계층구조의 수직구조를 따른다.
가중치 설정
가중치 설정은 선택한 수학적 모델에 따라서 결정을 할 수 있다. 예를 들어 지수 이동 평균(exponentially weighted average)을 바탕으로 가중치를 설정할 경우 $\beta$의 값을 바탕으로 각 계층 구조의 가중치가 결정된다. 각 계층 구조의 가중치는 $\beta^{n-1}(1-\beta)\theta_n$가 된다.
결과 계층을 고려한 벡터 추출
각 계층의 자연어를 임베딩 방식을 이용해서 각 계층에 대한 임베딩 벡터를 구한다. 벡터화한 각 계층의 벡터를 통해 최종 벡터($v$)를 구한다. $v=\alpha_{1}v_{1}+\alpha_{2}v_{2}+...+\alpha_{n}v_{n}$