데이터스페이스에서는 VTL을 직접 입력해, 분석 목적에 맞는 다양한 변수를 생성할 수 있습니다.
특히 주관식 복수 응답형 문항에서 다수의 텍스트를 수집한 경우, Split() 함수와 리코드 기능을 함께 활용하면, 비정형 텍스트 데이터를 객관식 변수로 전환할 수 있습니다.
이 문서는 텍스트형 응답 데이터를 바탕으로 정제된 분석용 변수를 만드는 전반적인 흐름과 설정 방법을 단계별로 안내합니다.
1단계. Split 함수로 다중 응답 텍스트 분리하기
복수 선택형 주관식 문항의 응답 결과는 일반적으로 '|' 기호로 구분된 하나의 텍스트값으로 저장됩니다. 이 데이터를 분석에 활용하려면 먼저 각 항목을 개별값으로 분리하는 전처리 과정이 필요합니다.
변수 생성 방법
1) ‘분석’ 페이지에서 [변수 > 변수 생성 > VTL] 로 이동합니다.
2) ‘새 변수 이름’과 ‘새 변수 라벨’을 입력하고, 새 변수 유형은 ‘순위 텍스트’로 지정합니다.
3) 아래와 같이 Split() 함수를 입력한 후 [변수 생성]을 클릭합니다.
🔍 '새 변수 VTL'에 입력할 예시
split(v'커피브랜드', '|')
원본 응답 값: 스타벅스|투썸플레이스|없음
분리 결과: ['스타벅스', '투썸플레이스', '없음']
4) 분리된 값은 순서 정보가 있는 '순위 텍스트형' 변수로 저장되며, 저장된 변수는 이후 리코드 기능을 통해 객관식 변수로 쉽게 변환할 수 있습니다.
2단계. 리코딩을 통해 분석 목적에 맞는 변수 만들기
Split() 함수로 생성한 순위 텍스트형 변수를 리코드하면, 분석 목적에 맞게 데이터를 재구성할 수 있습니다.
예시 1️. 1순위 응답만 추출하여 분석하기
분석 목적
응답자가 가장 먼저 선택한 보기(1순위 항목)를 기준으로 선호도나 만족도 등 주요 지표를 비교하고자 합니다.
설정 방법
1) ‘대상 변수’에서 Split 함수로 생성한 ‘순위 텍스트형’ 변수를 선택합니다.
2) 화면 중앙의 필터에서 ‘1순위만’을 선택합니다.
3) 우측의 ‘변수 유형’을 선택형 변수로 지정합니다.
4) [AI 그룹핑]을 클릭해 자동으로 응답 값을 그룹화합니다.
이렇게 생성된 새로운 변수는 교차분석, 시각화, 필터 조건 등 다양한 분석 도구에서 직접 활용 가능하며, 1순위 커피 브랜드별 선호도 비교나 1순위 응답 기준 충성 고객군 파악 등에 사용할 수 있습니다.
📌 함께 알아두면 좋은 정보
1순위뿐만 아니라 2~3순위까지 포함하고 싶은 경우, 변수 유형을 다중선택형으로 지정하고, AI 그룹핑을 적용해 최대 5순위까지 분석 기준으로 사용할 수 있습니다.
예시 2️. 보기 항목 정제 및 기타 묶음 처리하기
분석 목적
'없음', '모름'처럼 유의미하지 않은 응답을 별도로 묶고, 응답 수가 너무 적은 항목은 ‘기타’로 정리해 분석의 명확성을 높이고자 합니다.
설정 방법
1) 대상 변수에서 Split된 순위 텍스트형 변수를 선택합니다.
2) AI 그룹핑 적용 후, 기존 문자열에 ‘없’, ‘모르’ 등으로 검색하여 ‘없다’ 또는 ‘모르겠다’는 의미의 항목을 ‘없음 지정’으로 설정합니다.
3) 응답 수가 적어 분석에 활용하기 어렵다고 판단되는 값은 선택 후 ‘기타 지정’으로 지정합니다.
📌 함께 알아두면 좋은 정보
응답 값을 빈도수 기준(내림차순)으로 정렬해두면, 리코딩 작업을 해도 보기 순서는 그대로 응답 수 많은 순서대로 유지됩니다.
변수를 숨김 처리하고 싶을 경우, [변수> 변수 목록]에서 해당 변수를 선택하여 을 클릭해 주세요.