001 통계데이터센터 AI 활용대회
·
PROJECT
text similarity 측정을 위한 라이브러리 pip install tersorflow #텐서플로우 pip install sklearn #사이킷런 유사성 측정 방법 유클리디안 거리 변수값들의 차이를 제곱하여 합산한 거리, 다차원 공간에서 직선 최단 거리 import numpy as np #numpy사용 H = np.array([170, 65, 54, 1]) K = np.array([180, 67, 49, 0]) D = {H - K} D = D**2 D = np.sqrt(np.sum(D)) print(D) from sklearn.metrics.pairwise import euclidean_distances #sklearn사용1 # 정규화 tfidf_normalized = tfidf_matrix/np...