메인 콘텐츠로 건너뛰기

응답 클리닝 방법

응답 클리닝의 개념과 데이터스페이스에서 다양한 기능을 활용해 데이터를 정제하는 방법을 안내합니다. 응답 클리닝 기능을 활용해 더 신뢰도 높은 설문 데이터를 만들어 보세요.

어제 업데이트함

응답 클리닝이란?

설문 분석 과정에서 불성실한 응답, 질문을 오해한 응답, 혹은 전체 경향에서 크게 벗어나는 이상치를 제외하여 데이터를 정제하는 과정입니다. 클리닝된 응답은 분석 결과에 반영되지 않으므로, 더 정밀하고 신뢰도 높은 인사이트를 도출할 수 있습니다.

왜 응답 클리닝을 사용해야 할까요?

설문조사의 목적은 단순히 데이터를 많이 모으는 것이 아니라, 의사결정에 활용할 수 있는 정확한 데이터를 확보하는 것입니다. 하지만 실제로 수집된 응답에는 질문을 충분히 읽지 않고 답했거나 의미 없는 내용을 입력한 응답이 포함될 수 있습니다. 응답 클리닝은 이러한 데이터를 정리해 분석의 신뢰도를 높이는 과정이에요.

1️⃣ 정확한 분석을 위한 데이터 신뢰도 확보

질문을 제대로 읽지 않고 무작위로 선택한 응답이나 의미 없는 텍스트가 포함되면 평균값이나 비율이 실제보다 왜곡될 수 있습니다. 응답 클리닝을 통해 이러한 ‘노이즈 데이터’를 정리하면, 실제 시장 상황을 더 잘 반영하는 신뢰도 높은 분석 결과를 얻을 수 있습니다.

2️⃣ 데이터 검토와 분석 과정의 효율 향상

수천 개의 응답을 하나씩 확인하는 것은 시간과 노력이 많이 필요합니다. 데이터스페이스의 알고리즘 기반 클리닝 기능을 활용하면 불성실할 가능성이 있는 응답을 빠르게 식별할 수 있어, 데이터 검토와 분석에 드는 시간을 크게 줄일 수 있습니다.

3️⃣ 표본 관리와 데이터 활용도 개선

초과 수집된 응답을 정리하거나 대표 표본(Quotas)의 균형을 맞추면, 분석에 적합한 응답자들로 데이터 집합을 구성할 수 있습니다. 이를 통해 한정된 표본에서도 더 의미 있는 분석 결과를 얻을 수 있습니다.


응답 클리닝 방법

📌 응답 클리닝은 모든 플랜에서 이용할 수 있어요.

데이터스페이스는 사용자의 상황에 맞춰 직접 선택하거나 알고리즘을 활용한 자동 클리닝 기능을 제공합니다.

1️⃣ 직접 검토하여 클리닝하기

개별 응답을 하나씩 확인하면서 신중하게 데이터를 정제하고 싶다면, 응답을 직접 검토해 클리닝하는 방법을 활용해 보세요.

Step 1. 원하는 설문을 선택한 뒤 상단 메뉴에서 [분석 > 응답] 화면으로 이동해 주세요.

Step 2. 아래와 같은 지표를 참고해 클리닝이 필요한 응답을 선별합니다.

  • finished_at: 수집 기한 이후에 제출된 응답인지 확인할 수 있습니다.

  • sincerity_score: 성실도 점수가 낮아 분석에 활용하기 어려운 응답인지 판단할 수 있습니다.

💡 이용 tip | 응답 화면 우측 상단의 [변수 불러오기] 버튼을 클릭하면 메타데이터에서 다양한 기준 변수를 추가해 더 세밀하게 검토할 수 있어요.

Step 3. 제외할 응답을 체크한 뒤, 화면 오른쪽 하단의 [클리닝] 버튼을 클릭합니다.

💡 이용 tip | 응답 화면 하단의 ‘응답 클리닝’에서 응답 ID 또는 UID를 직접 입력해 특정 응답만 개별적으로 클리닝할 수도 있습니다.

2️⃣ 원클릭 클리닝 활용하기

대량으로 수집된 응답을 빠르게 정리하고 싶다면, 오픈서베이의 알고리즘 기반 원클릭 클리닝 기능을 활용해 보세요. 성실도 점수를 기준으로 클리닝 대상을 자동으로 분류해, 데이터 정제 과정을 훨씬 효율적으로 진행할 수 있습니다.

Step 1. 원하는 설문을 선택한 후 상단 메뉴에서 [분석 > 응답] 화면으로 이동해 주세요.

Step 2. ‘응답’ 화면 우측 상단에 있는 [원클릭 클리닝] 버튼을 클릭합니다.

Step 3. 표시되는 성실도 점수(sincerity_score) 분포 그래프를 참고해 클리닝 기준 점수를 설정해 주세요. 설정한 점수 기준에 따라 클리닝 대상 응답이 자동으로 분류됩니다.

Step 4. 분류된 응답을 확인한 뒤 [클리닝] 버튼을 클릭하면 해당 응답을 분석 대상에서 제외할 수 있습니다.

3️⃣ 초과 수집된 응답 제외하기

설문을 진행하다 보면 목표한 응답 수보다 더 많은 데이터가 수집되는 경우가 있습니다. 특히 수집 그룹(예: 성별·연령별 할당 표본)을 기준으로 응답을 모을 때 일부 그룹에서 응답이 초과될 수 있는데요. 이럴 때 초과된 응답을 정리하면 목표 표본 구조를 유지하면서 분석에 사용할 데이터를 정돈할 수 있습니다.

Step 1. 원하는 설문을 선택한 뒤 상단 메뉴에서 [분석 > 응답] 화면으로 이동해 주세요.

Step 2. 응답 화면 하단의 ‘응답 클리닝’ 영역에서 ‘응답 현황 보기’ 설정을 활성화합니다.

Step 3. 각 수집 그룹별로 총 응답 수, 초과 응답 수, 클리닝된 응답 수, 유효 응답 수, 수집 목표 수, 그리고 목표 대비 부족하거나 초과된 응답 수를 확인할 수 있습니다. 이 정보를 통해 어떤 수집 그룹에서 목표보다 응답이 많이 수집되었는지 한눈에 파악할 수 있습니다.

💡 이용 tip | ‘목표 대비 초과된 행’ 또는 ‘목표 대비 부족한 행’ 체크박스를 선택하면, 해당 조건에 해당하는 수집 그룹만 따로 확인할 수 있어요.

Step 4. [초과 응답 제외] 버튼을 클릭하면, 수집 그룹별 목표치를 초과한 응답이 무작위로 제외되어 목표 표본에 맞게 데이터가 정리됩니다.

💡 이용 tip | 초과 응답 제외 기능을 활용하면 특정 그룹에 응답이 과도하게 몰리는 것을 방지하고, 조사 설계 단계에서 설정한 표본 균형을 유지한 상태로 데이터를 분석할 수 있습니다.


🧙 클리닝한 응답을 다시 복구하고 싶으신가요?

클리닝으로 제외한 응답도 언제든지 다시 유효한 응답으로 복구할 수 있습니다.

응답 화면에서 ‘클리닝’ 상태로 표시된 응답을 선택한 뒤, 오른쪽 하단의 [유효화] 버튼을 클릭해 보세요. 선택한 응답이 다시 분석에 포함됩니다.

또한, 응답 화면 하단의 ‘응답 클리닝’ 영역에서 ‘복구 대상’에 응답 ID를 직접 입력해 복구할 수도 있습니다.

만약 응답을 자세히 확인한 뒤 복구하고 싶다면, 해당 응답 우측의 화살표 아이콘을 클릭한 후, ‘응답 자세히 보기’ 화면에서 해당 응답을 선택해 유효화하는 방법도 활용해 보세요.


💡 응답 화면엔 이런 기능도 마련되어 있어요.

✅ 변수 불러오기

변수 불러오기는 응답 테이블에서 확인할 변수를 추가로 불러오는 기능입니다. 변수는 나이, 성별, 지역, 응답 결과 등 데이터의 구성 요소 중 하나로 측정하거나 계산할 수 있는 항목입니다.측정하거나 계산할 수 있는 정보를 의미합니다.

새로운 변수 불러오기

step 1. 응답 테이블 오른쪽 상단의 [변수 불러오기] 버튼을 클릭해 주세요.

step 2. 변수 불러오기 화면이 나타나면 응답·프로필·메타 데이터 탭 중 원하는 탭을 선택한 뒤, 불러올 변수를 선택하고 [선택 완료] 버튼을 클릭합니다.

  • 응답: 설문 문항의 응답 데이터를 불러옵니다.

  • 프로필: 응답자의 프로필 데이터를 변수로 불러옵니다. 데이터스페이스에서는 MY패널로 등록된 응답자를 대상으로 진행한 설문에서만 프로필 변수가 표시됩니다.

  • 메타 데이터: 응답과 관련된 부가 정보를 불러옵니다. 예를 들어 패널 ID, 응답 시작 시간, 응답 종료 시간, 클리닝 기준 변수, 클리닝 사유, 불성실 응답 개수 등이 포함됩니다.

step 3. 변수를 불러오면 응답 테이블에 해당 변수 데이터가 추가되며, 응답 테이블에서 각 응답자의 변수별 데이터를 함께 확인할 수 있습니다.

이미 불러온 변수를 제외하거나 새로운 변수를 추가하고 싶다면, 다시 [변수 불러오기] 화면에서 원하는 변수를 선택하거나 제외한 뒤 [선택 완료] 버튼을 클릭해 주세요.


자주 묻는 질문

Q. 이미지 응답도 클리닝할 수 있나요?

A. 네, 가능합니다. 먼저 [변수 불러오기]에서 이미지 응답 변수를 추가해 주세요.

이후 응답 목록에서 해당 응답 오른쪽에 있는 화살표 아이콘을 클릭하면 ‘응답 자세히 보기’ 화면으로 이동합니다. 이 화면에서 응답자가 첨부한 이미지를 직접 확인할 수 있어요.

이미지를 확인하면서 해당 응답을 클리닝할지 여부를 판단하시면 됩니다.

Q. 대표 표본을 맞추기 위해 초과 응답을 꼭 제외해야 하나요?

A. 조사 목적에 따라 권장되는 경우가 있습니다. 시장 현황을 파악하거나 모집단을 대표해야 하는 조사라면, 특정 그룹(예: 특정 연령대)의 응답이 목표보다 많이 수집될 경우 분석 결과가 왜곡될 수 있습니다. 이런 경우 [초과 응답 제외] 기능을 활용해 표본 구성을 균형 있게 정리해 보세요.

Q. 어떤 기준으로 클리닝하는 것이 좋나요?

A. 조사 목적과 상황에 맞는 기준을 설정하는 것이 중요합니다. 기업이나 조사 목적에 따라 ‘성실한 응답’의 기준은 달라질 수 있습니다. 처음에는 점수만으로 판단하기보다 텍스트 응답 내용과 응답 속도 등을 함께 확인하며 기준을 정하는 것이 좋습니다. 이를 바탕으로 프로젝트 특성에 맞는 적절한 클리닝 기준을 설정해 보세요.


응답 클리닝에 대해 궁금한 점이 해결되셨나요?

데이터 정제 과정에서 특정 응답의 처리 방향이 고민되거나 기능 작동이 원활하지 않다면, 화면 우측 하단의 [고객센터 아이콘]을 통해 언제든 문의해 주세요.

겪고 계신 어려움을 해결해 드리기 위해 저희 팀이 최선을 다하겠습니다.

답변이 도움되었나요?