메인 콘텐츠로 건너뛰기

응답 탭에서 응답 클리닝하기

응답 탭에서 오응답·불성실 응답 등 데이터를 클리닝하는 방법을 살펴봅니다.

최소 한 달 전에 업데이트됨

응답 데이터 클리닝이란?

설문 결과를 분석하는 과정에서 불성실 응답이나 문항에 대한 오해로 인한 오응답, 전체 경향에서 벗어나는 이상치 등을 제외하고 데이터를 정제하고자 하는 경우가 있습니다.

이러한 목적에 맞춰, 데이터스페이스의 '응답' 탭에서 사용자가 직접 응답 데이터를 클리닝할 수 있는 기능을 제공합니다.

클리닝된 응답은 분석 결과에 반영되지 않으며, 보다 신뢰도 높은 데이터를 기반으로 정밀한 분석이 가능합니다.

응답 데이터 클리닝 방법

① 직접 클리닝 응답 선택하기

1) '응답' 탭에서 아래 항목을 기준으로 클리닝이 필요한 응답을 검토합니다.

  • finished_at(응답 종료 시간): 응답 수집 기한을 초과한 응답 여부 확인

  • sincerity_score(응답 성실도 점수): 불성실 응답이나 오응답 여부 판단

  • 우측 상단의 [변수 불러오기] 기능을 통해 다양한 기준 변수를 추가하면, 더욱 정밀한 응답 검토가 가능합니다.

2) 클리닝할 응답을 선택한 뒤, 오른쪽 하단의 [클리닝] 버튼을 클릭합니다. 이때 ‘클리닝 기준 변수’와 ‘클리닝 사유’를 함께 설정하여, 클리닝 이력을 명확하게 기록하고 관리할 수 있습니다.

3) 하단 '응답 클리닝' 영역의 ‘대상 응답’ 입력란에 응답 ID, pannel_id, UID 등을 직접 입력하여 응답을 개별적으로 제외할 수도 있습니다.

② 원클릭 클리닝하기

원클릭 클리닝은 사용자가 설정한 기준 점수에 따라, 오픈서베이가 자체 개발한 알고리즘으로 응답 품질을 분석하고, 클리닝이 필요한 항목과 응답을 자동으로 제시하는 기능입니다.

1) '응답' 탭 우측 상단의 [원클릭 클리닝] 버튼을 클릭합니다.

2) 응답 신뢰 점수(sincerity_score)에 따라 유효 응답 수가 그래프로 시각화되어 표시되며, 설정 기준 이상과 미만의 응답 분포를 한눈에 확인할 수 있습니다.

3) 기준 점수를 설정하면, 해당 기준에 따라 클리닝 대상 응답이 자동 분류됩니다. 내용을 검토한 후 [클리닝] 버튼을 클릭해 응답을 제외할 수 있습니다.

4) ‘클리닝 사유 표시’ 옵션을 활성화하면, 제외된 각 응답에 대한 클리닝 사유가 함께 표시됩니다.

5) 제외된 응답 중 다시 분석에 포함하고자 하는 경우, 해당 응답을 선택한 후 우측 하단의 [유효화] 버튼을 클릭해 복원할 수 있습니다.

🤔 이미지 응답은 응답 탭에서 확인하고 관리할 수 없나요?

  • 추후 응답 탭에서 이미지 응답도 불러올 수 있도록 업데이트 예정입니다. 이미지 응답이란 응답자가 이미지를 첨부해서 제출한 응답 데이터입니다.

  • 변수 불러오기 화면에서 이미지 응답을 불러온 뒤 응답 자세히 보기 화면을 열어주세요. 그럼 해당 응답자의 이미지 응답을 살펴보고 클리닝할 수 있습니다.

초과 수집된 응답 데이터 클리닝 방법

1) 데이터 클리닝 바 오른쪽 상단의 ‘응답 현황 보기’ 설정을 활성화합니다.

2) 응답 현황 테이블이 표시되며, 설문에 포함된 각 수집그룹별로 다음 항목을 확인할 수 있습니다.

  • 총 응답 수

  • 초과 응답 수 및 클리닝된 응답 수

  • 유효 응답 수

  • 수집 목표 수

3) 오른쪽 상단의 [초과 응답 제외] 버튼을 클릭하면, 수집그룹별로 목표 수를 초과한 응답 데이터를 랜덤으로 자동 제외할 수 있습니다.

예를 들어, 5개의 수집그룹에 대해 각 100명씩 응답 목표를 설정했으나, 특정 그룹에서 107명의 응답이 완료된 경우, 해당 버튼을 클릭하면 107명 중 7명의 응답이 무작위로 제외됩니다.

이 기능을 활용하면 초과 수집된 응답을 손쉽게 정리하고, 분석에 활용할 유효 응답 수를 효율적으로 관리할 수 있습니다.

🤔 대표 표본으로 데이터를 보기 위해 초과 응답을 제외해야 하나요?

분석 목적에 따라 달라질 수 있으나, 시장 현황이나 모집단을 대표하는 데이터를 확보하고자 한다면, 분석에 앞서 대표 표본에 기반해 응답을 수집하고, 수집그룹별 응답자 수를 정확히 관리하는 것이 중요합니다.

대표 표본이란, 전체 시장 또는 대상 모집단의 특성을 적절히 반영한 응답자 구성을 의미합니다.

따라서 설문 설계 시 수집그룹(예: 성별, 연령, 지역 등)을 기준으로 대표 표본을 설정하고 응답을 수집했다면, 데이터 수집 이후에는 다음과 같은 후속 조치가 필요합니다:

  • 응답이 미달된 그룹은 추가 수집

  • 응답이 초과된 그룹은 일정 수만큼 랜덤 제외

이 과정을 통해 표본 구성의 균형을 유지하고, 분석 결과의 신뢰도를 높일 수 있습니다.

답변이 도움되었나요?