배민 VOC 분석을 위한 토픽 모델링 공부 진행 중입니다:) 토픽 모델링 기법 중 가장 유명하고 많이 쓰이는 LDA에 관해 알아보겠습니다. *본 노트는 고려대학교 산업경영공학부 DSMA 연구실의 LDA 관련 유튜브 영상을 참고했음을 밝힙니다. LDA 문서 생성 프로세스(Document Generation Process) 지난 포스트에서 토픽 모델링은 문서 생성 프로세스에 대한 가정이 존재한다고 말씀드렸습니다. LDA의 문서 생성 프로세스를 요약하자면 다음과 같습니다. 모든 문서들(Documents)은 여러 개의 토픽들을 가지고 있습니다. 각 토픽은 단어들의 분포입니다. 예를 들어, 아래 노란색 토픽의 경우 gene, dna, genetic 등의 단어들로 이루어져 있고, 각 단어마다 발생빈도는 다릅니다..