응답 데이터 클리닝이란?
설문 응답 결과를 분석하다 보면 불성실 응답, 오응답, 경향과 크게 다른 이상치 등을 제외하고 데이터를 분석하고 싶은 생각이 들곤 합니다. 이에 분석의 응답 탭에서 사용자가 직접 응답 데이터를 클리닝할 수 있는 기능을 제공합니다. 클리닝한 응답 데이터는 결과에 반영되지 않아 데이터의 신뢰도를 높여서 더욱 정밀하고 세세하게 데이터를 분석할 수 있습니다.
응답 데이터 클리닝하기
1) 데이터 클리닝 작업을 할 설문의 응답 탭으로 들어갑니다.
2) 응답 테이블에서 클리닝해야 할 데이터를 살펴봅니다. finished_at(응답 종료 시간)을 살펴보며 응답 수집 기한을 초과한 응답은 없는지, sincerity_score(응답 성실도 점수)를 살펴보며 불성실 및 오응답은 없는지 살펴볼 수 있습니다.
또한, 변수 불러오기 기능으로 다른 변수를 추가해서 좀 더 상세하게 응답 테이블을 살펴볼 수도 있습니다.
3) 클리닝할 응답 데이터를 선택한 뒤 오른쪽 하단의 [클리닝] 버튼을 누릅니다. 클리닝 시에는 클리닝 기준 변수와 클리닝 사유를 선택해서 클리닝 기록을 체계적으로 관리를 할 수 있습니다.
4) 데이터 클리닝 바의 ‘대상 응답’란에 숨김 처리하고 싶은 응답 ID, rd_id, UID를 직접 입력하거나, 응답 자세히 보기 화면에서 제외하고 싶은 응답을 선택할 수도 있습니다.
🤔 이미지 응답은 응답 탭에서 확인하고 관리할 수 없나요?
추후 응답 탭에서 이미지 응답도 불러올 수 있도록 업데이트 예정입니다. 이미지 응답이란 응답자가 이미지를 첨부해서 제출한 응답 데이터입니다.
변수 불러오기 화면에서 이미지 응답을 불러온 뒤 응답 자세히 보기 화면을 열어주세요. 그럼 해당 응답자의 이미지 응답을 살펴보고 클리닝할 수 있습니다.
초과 수집된 응답 데이터 클리닝하기
1) 데이터 클리닝 바의 오른쪽 상단에 있는 ‘응답 현황 보기’를 활성화합니다.
2) 데이터 클리닝 바에 응답 현황 테이블이 나타납니다. 여기서 해당 설문의 수집그룹별 총 응답 수, 초과 및 클리닝 응답 수, 유효 응답 수, 수집 목표 수를 테이블 형태로 살펴봅니다.
3) 오른쪽 상단의 [초과 응답 제외] 버튼을 누릅니다. 수집그룹별로 초과 수집된 응답을 랜덤으로 제외할 수 있는 기능입니다.
예를 들어 총 5개의 수집그룹에서 응답 목표를 100명씩 설정해서 응답을 수집했는데, 1개 수집그룹에서 응답을 완료한 사람의 수가 107명이 되는 경우도 있습니다. 이때 해당 버튼을 누르면 107명 중 7명의 응답 데이터가 랜덤으로 제외됩니다. 이를 통해 초과 응답을 빠르게 제외해서 분석 대상 응답 수를 관리할 수 있습니다.
🤔 대표표본으로 데이터를 보기 위해 초과 응답 제외 작업이 필요한가요?
분석 목적에 따라 다를 수 있으나 시장을 대표하는 데이터를 확인하기 위해 분석 작업을 시작하기 전에 대표표본으로 데이터를 수집하고 수집그룹별 응답자 수를 관리해야 합니다. 대표표본이란 시장 현황이나 모집단을 대표할 수 있는 응답자 구성을 말합니다.
이에 설문 응답 수집 시 대표표본으로 수집그룹을 설정해서 응답 데이터를 수집한다고 하면, 데이터 수집 이후 각 수집그룹에서 미달된 응답을 더 채우거나 초과한 응답을 제외하는 작업이 필요합니다.