어느 비전공자의 개발일지

Java 유사도 종류 본문

백엔드 개발자/Java[Spring]

Java 유사도 종류

vndn629 2023. 5. 15. 16:51

 

 

유사도 : 문장이 유사한지 측정해야 할 때 사용한다. ( 텍스트 유사도 )에서 사용되는 것
- 자카드 유사도,유클리디언 유사도(유클리디안 거리),멘하탄 유사도(멘하탄 거리), 코사인 유사도

1) 자카드 유사도 ( 예 : 이진형 데이터에 적합한 유사도 척도  , 희소한 이진형 데이터에 적합)
: 교집합 / 합집합 = ( ) 
ex) 교집합 개수 6 / 합집합개수 24 = 0.25

2) 코사인 유사도 (예 : 상품 추천 시스템)
: 두개의 벡터값에서 코사인 각도를 구하는 방법. -1~1 사이의 값을 가지고 1에 가까울수록 유사

3) 유클리디안 유사도
: L2 거리(L2 Distance)라고도 불린다.
: 가장 기본적인 거리를 측정하는 유사도 공식
: n차원 공간에서 두 점 사이의 최단 거리를 구하는 접근 방법

4) 맨하탄 유사도(예 : 매우만족,만족,불만족 선택시)
: 흔히 L1 거리(L1 Distance)라고도 불린다.

반응형