응답 데이터 클리닝이란?
수집한 응답 데이터 중에서 오응답이나 목표 수를 초과해서 수집한 응답을 숨김 처리할 수 있는 기능입니다. 불성실 응답, 오응답, 경향과 크게 다른 이상치 응답 데이터를 직접 살펴보고 클리닝할 수 있습니다. 이를 통해 사용자는 데이터의 신뢰도를 높여서 더욱 정밀하고 세세하게 데이터를 분석할 수 있습니다.
응답 데이터 클리닝 기능 활용 방법
응답 데이터 클리닝 기능을 활용하는 방법은 다양합니다. 이번 글에서는 응답 성실도 점수 기준으로 클리닝하기, 특정 응답을 기준으로 필터링해서 클리닝하기, 응답 상세 보기 화면을 살펴보며 클리닝하기에 대해 알아봅니다.
① 응답 성실도 점수 기준으로 클리닝하기
응답 클리닝 시 가장 먼저 해야 할 작업은 성실하게 응답하지 않은 응답 데이터를 분석 대상에서 제외하는 것입니다. 이에 분석의 응답 탭은 응답별 ‘sincerity_score(응답 성실도 점수)’를 확인할 수 있고, 이를 기준으로 불성실 응답을 클리닝할 수 있습니다.
응답 테이블에서 sincerity_score(응답 성실도 점수)를 살펴봅니다. 정렬 기능을 통해 성실도 점수 순서대로 테이블을 정렬한 뒤에 점수가 낮은 응답을 클리닝합니다. 이외에도 다양한 변수를 불러와서 데이터를 살펴보고 필터링을 할 수 있습니다.
💡응답 성실도 기준으로 데이터 클리닝할 때 알아두면 좋은 팁
응답 성실도 점수가 70점 이하인 응답은 클리닝을 고려하는 것이 좋습니다. 혹은 전체 응답 중 응답 성실도 점수가 하위 5%에 속하는 데이터도 클리닝하는 것을 고려할 수 있습니다.
단, 클리닝 기준은 조사 목적이나 분석자의 시각에 따라 조금씩 달라질 수 있습니다. 단 하나의 일괄적인 기준을 따르기보다는 응답 테이블을 잘 살펴보면서 그에 알맞은 유연한 기준을 적용할 수 있습니다.
② 특정 응답을 기준으로 필터링해서 클리닝하기
특정 변수의 응답 값을 기준으로 필터링을 하고 싶다면, 해당 변수의 응답 변수를 불러온 뒤 변수별 필터 기능을 활용해서 조건에 해당하지 않는 응답을 클리닝할 수도 있습니다.
예를 들어 주류 소비 트렌드를 파악하기 위한 설문에서 ‘최근 1달 이내 마신 술 종류’ 중 ‘막걸리/동동주/탁주’만 선택한 응답을 제외하는 방법을 알아보겠습니다.
1) 변수 불러오기 기능으로 ‘최근 1달 이내 마신 술 종류’ 변수를 불러옵니다.
2) 응답 테이블을 ‘값 라벨’ 기준으로 변경합니다. 그러면 응답 테이블 해당 응답 칼럼이 숫자가 아니라 ‘맥주’ ‘소주’ 등 값으로 변경됩니다.
3) 해당 응답 칼럼의 ‘필터’를 누른 뒤 ‘응답값 필터’에서 ‘막걸리/동동주/탁주’를 선택한 뒤 적용을 누릅니다. 만약 응답값 필터에 값만 나온다면 응답 테이블 기준을 ‘값 라벨’로 변경해 주세요.
4) 막걸리/동동주/탁주만 선택한 응답을 정렬해서 찾고 선택한 뒤에 클리닝합니다.
③ 응답 자세히 보기 화면에서 클리닝하기
응답 자세히 보기 화면에서 개별 응답자의 응답 현황을 하나씩 살펴보며 응답 데이터 클리닝을 할 수도 있습니다.
또한, 추후에는 응답 탭 응답 자세히 보기 화면에서 이미지 자세히 보기를 지원할 예정입니다. 이에 미션형 조사 등에서 이미지 응답을 받았다면 응답 자세히 보기 화면에서 이미지 응답 현황을 살펴보고, 조건에 부합하는 이미지를 제출하지 않은 응답을 찾아서 손쉽게 클리닝할 수 있습니다.