워드클라우드 추출 기준은 어떻게 되나요?

워드클라우드는 오픈서베이 고유 알고리즘을 활용해 공통 응답 수가 많은 단어를 자동 도출한 시각화 데이터입니다. 이번 글에서는 워드클라우드의 구체적인 추출 기준에 대해 알아봅니다.

1주 전에 업데이트함

워드클라우드는 언급 빈도의 평균과 표준 편차를 활용한 고유 알고리즘을 통해 각 단어가 자주 언급된 순서대로 최대 5개 구간으로 나눠 글자의 크기와 색깔을 다르게 나타냅니다.

최소 2음절 이상의 단어만 워드클라우드 노출 대상으로 취급하며, 언급된 빈도가 높을수록 글자가 크고 빈도가 낮을수록 작게 나타냅니다. 글자의 크기에 따라 구분하기 쉽도록 언급 수 구간별로 텍스트 컬러를 다르게 표시합니다.

워드클라우드가 생성되지 않는다면?

주관식 응답을 받았다고 하더라도 중복 언급 빈도가 3회 이상인 단어가 5개 이상 되지 않은 경우나, 응답 수 자체가 적은 경우는 워드클라우드가 생성되지 않습니다.

또한, 워드클라우드가 너무 복잡해지지 않도록 언급률이 전체의 3%에 미치지 못하는 응답은 노출 대상에서 제외됩니다.

답변이 도움되었나요?