교차분석의 비교 분석 기능은 특정 집단의 응답 경향이 전체 또는 다른 집단과 통계적으로 유의미한 차이를 보이는지 검정하고, 그 결과를 시각적으로 제공합니다.
통계적 유의성을 바탕으로 데이터 간 차이를 정교하게 파악하고, 유의미한 차이가 있는 부분만 자동으로 하이라이트하여 숫자를 다 보지 않고도 집단 간 차이를 빠르게 파악할 수 있습니다.
전체와 비교
‘전체와 비교’는 각 집단의 응답 비율이 전체 집단의 평균과 통계적으로 유의미하게 차이가 나는지를 검정하고, 그 결과를 컬러코딩을 통해 시각화하는 기능입니다.
붉은색: 전체 평균보다 통계적으로 유의미하게 높은 값
푸른색: 전체 평균보다 통계적으로 유의미하게 낮은 값
이 기능은 전체 평균이라는 하나의 기준점 대비 유의미한 차이를 보이는 집단을 파악하고, 우선순위를 세우는 데 활용할 수 있습니다.
🔍 예시로 이해하는 전체와 비교
◾분석 목적
평소 검색을 목적으로 사용하는 서비스가 연령대별로 얼마나 다른지 확인하려고 합니다. 만 15세 ~ 64세 남녀를 대상으로 ‘궁금한 것을 찾아보기 위해 가장 자주 이용하는 서비스’를 질문했습니다.
◾설정 및 결과 확인 방법
교차분석 탭에서 비교 모드를 ‘전체와 비교’로 설정합니다.
열(분석 기준)에 10세 단위로 구분된 ‘라이프스타일 나이’ 변수를, 행(분석 대상)에는 ‘검색 목적으로 가장 자주 이용하는 서비스’ 변수를 넣습니다.
설문에 응답한 전체 연령(15~64세)의 평균 대비, 통계적으로 유의미하게 높거나 낮은 셀에 컬러코딩이 적용됩니다.
예를 들어, 15~24세에서 인스타그램을 검색 목적으로 가장 자주 이용한다고 응답한 비율(24.5%)이 전체 연령 평균(17.3%) 대비 유의미하게 높아 붉은색 컬러코딩이 적용된 것을 확인할 수 있습니다.
이처럼 연령, 성별, 지역, 구매 경험 등의 기준으로 응답 집단을 세분화해 분석하면, 전체 집단에 비해 도드라지는 특정 집단만의 특징을 발견하고, 전략적 의사결정에 활용할 수 있습니다.
집단 간 비교
‘집단 간 비교’는 하나의 분석 기준 내에서 선택한 기준 집단과 다른 집단 간의 응답을 비교하고, 통계적으로 유의미한 차이가 있는 경우 시각적으로 구분하는 기능입니다.
기준 집단(예: A)보다 유의미하게 낮은 경우: 기준 집단(예: A)의셀에 알파벳(예: B, C) 표시
기준 집단(예: A)보다 유의미하게 높은 경우: 타 집단(예: B, C)의 셀에 붉은색 표시
이 기능은 기준 집단을 중심으로 상대적인 반응 차이를 명확하게 파악할 수 있어, 세그먼트별 차이 비교, 서비스/제품이나 컨셉, 네이밍에 대한 평가 비교 등에 유용하게 활용됩니다.
🔍 예시로 이해하는 집단 간 비교
◾분석 목적
국가별로 생성형 AI(ChatGPT/Gemini)를 사용하는 목적에 어떤 차이가 있는지 비교하고자 합니다. 한국, 미국, 일본의 응답자를 대상으로 질문했습니다.
◾설정 및 결과 확인 방법
교차분석 탭에서 비교 모드를 ‘집단 간 비교’로 설정합니다.
열(분석 기준)에는 ‘국가’ 변수를, 행(분석 대상)에는 ‘생성형 AI 사용 목적’ 변수를 넣습니다.
한국, 미국, 일본 각 국가에 A, B, C 컬럼 구분자가 생기고, 국가간 차이를 한 번씩 비교하여(A-B, A-C, B-C) 통계적으로 유의미하게 낮은 알파벳을 각 셀 아래에 표기합니다.
예를 들어, 생성형 AI를 ‘정보 스크랩/요약’ 목적으로 사용하는 비율은 한국이 36.2%로, 나머지 두 나라(미국 - 22.6%, 일본 - 21.1%) 대비 높습니다.
한국 컬럼의 구분자 A를 클릭하면 한국 대비 통계적으로 유의미하게 높은 국가 셀에 붉은색으로 컬러코딩이 적용됩니다.
예를 들어, 생성형 AI를 학습 및 자기계발 목적으로 사용하는 비율은 미국(44.1%)에서 한국(35.3%) 대비 유의미하게 높습니다.
📌 함께 알아두면 좋은 내용
비교 분석은 교차분석 탭에서 설정한 신뢰수준(예: 80%)에 따라 자동으로 통계적 유의성 검정을 수행합니다.
통계 검정은 응답 비율과 표준 오차를 고려한 방식으로 이루어지며, 집단별 응답 수가 30건 미만일 경우에는 검정 결과의 신뢰도가 낮아질 수 있기 때문에 결과가 제공되지 않습니다.
비교 결과 해석 시, 문항 유형(단일/복수 응답), 표본 구성, 문항 위치 등 분석 맥락을 함께 고려하는 것이 중요합니다.