メインコンテンツにスキップ

分析用語集

Opensurveyの分析レポートで使用するさまざまな統計・専門用語をご案内します。分析を開始する前に、主要用語の意味を確認してデータの中に隠れたインサイトをより正確に見つけてみましょう。

昨日アップデートされました

1️⃣ 分析機能の基本用語

データの全体的な収集状況と信頼性を把握するための基礎用語です。

  • 回答者数: アンケートに参加した固有の回答者数(Unique Sample)を意味します。1つのアンケートに1回だけ回答できる一般的なアンケートの場合、回答者数と回答数は同じ数値になります。

  • 回答数: 収集された回答の件数です。1つのアンケートに回答者が複数回参加できるダイアリーアンケートの場合、回答者数と回答数が一致しないことがあります。

  • 変数の数: アンケートの総変数数が表示されます。

  • 標本誤差: 標本から得たアンケートの結果が実際の母集団の意見や行動とどれだけ差がある可能性があるかを示す数値です。一般的に同じ信頼水準のもとで標本数が母集団の規模に近く多いほど標本誤差は小さく、標本数が少ないほど標本誤差は大きくなります。ただし、Opensurveyは現時点で回答を完了した回答者数を基準に80%の信頼水準のもとで発生しうる最大の標本誤差を表記します。

  • 調査方法: 調査が行われた方法です。Opensurvey自体のパネルを対象に実施した調査であれば「Opensurveyパネル」と表示され、パネル以外のウェブベースのアンケートリンクを活用して回答者を募集した調査であれば「Opensurveyフォーム」と表示されます。

  • 回答期間: アンケートの回答が最初に始まった時点からすべての回答が完了した時点までが表示されます。

  • 母集団: 情報を得ようとする関心対象の全体集合を言います。このような母集団は何を知ろうとするかによって異なる定義ができます。ソウル市の政策に対する市民の意見を知ろうとすればソウル市民全体が母集団になりますが、ショッピングモールAで購入した消費者の満足度を知ろうとすればショッピングモールAの購入者に限定されます。母集団全体を対象にアンケートを実施できない場合が多いため、一般的に母集団の中から一部の標本を抽出してアンケートを実施します。

  • 信頼水準: 母集団から標本を抽出してアンケートを実施すると、毎回抽出される標本が異なるため結果が正確に同じになりません。信頼水準は現在の標本サイズで得たアンケート結果がどれだけ再現される可能性が高いかを示します。分析ではグループ間の小さな差もより細かく見られるよう80%の信頼水準を基本に標本誤差を測定します。 無限に大きな母集団から1,000人の標本を無作為抽出してアンケートを実施すると、80%の信頼水準で最大の標本誤差は±2.0%pです。このアンケートである製品の満足度が50%と測定された場合、100回調査すれば80回は48.0%と52.0%の間になると予想できます。

2️⃣ クロス分析関連用語

グループ間の差を比較して変数間の関連性を把握するときに使用する用語です。

  • クロス分析: 2つの変数間の関連性を把握するための分析方法です。分析単位を基準に分析対象の列合計(Column %)を計算します。たとえば特定の変数の回答結果に性別間の差があるかを調べたい場合、性別を分析単位として該当変数の回答結果を分析対象に設定してクロス分析表を作成します。

  • 分析単位: 分析単位はクロス分析表を作成する際にデータ解釈の基準となる情報です。このような分析単位はクロス分析表の横軸に表れ、分析単位が何かによってクロス分析表のデータが変わります。

  • 分析対象: 分析対象はクロス分析表で解釈しようとするデータを言います。このような分析対象はクロス分析表の縦軸に位置し、分析対象のデータは設定した分析単位を基準に表示されます。

  • 比率: クロス分析表で回答比率基準でデータが表示されるよう設定するボタンです。このような比率は設定した分析単位基準で分析対象の回答件数を該当分析単位の全体回答数で割った値です。

  • 頻度: クロス分析表で「頻度」を選択すると回答数基準でデータが表示されます。比率と頻度の両方を表示したい場合は「比率%(頻度)」を選択します。

3️⃣ 主観式数値変数の用語

  • 平均: 全回答値の合計を回答数で割った値を意味します。分析では算術平均値を「平均」と表記します。

  • 標準偏差: データの散布度を示す数値です。値が大きいほどデータが広く分散しており、小さいほどデータが平均に近いと解釈できます。

  • 最頻値: 全回答の中で最も頻繁に出る値です。最頻値が2つ以上ある場合は最頻値の中で最も小さい値を表記します。最も多くの人を満足させられる値を見つけたり、平均だけではわかりにくいデータ全体の分布を確認する用途として活用します。

  • 最大値/最小値: 全回答の中で最も大きい/小さい値を意味します。全回答値の中に外れ値や極端な値が含まれているかを判断したり、回答範囲を把握するのに有用です。

  • 中央値: 全回答値を大きさの順に並べたときに最も中央に位置する値です。平均は極端な値に大きく影響されるため、極端な値が含まれたデータでは中央値が有用な代表値として使用できます。正規分布データの場合は平均値・中央値・最頻値が類似して現れ、平均値が中央値より大きく異なる場合は外れ値や極端な値がある可能性があります。

  • Percentile 30: 全回答を大きい値から順に並べたときに上位30%に該当する数字です。下位/中位/上位の3グループに回答値を分けるとき、Percentile 30を上位グループに分類する区切り点として使用できます。

  • Percentile 70: 全回答を大きい値から順に並べたときに上位70%に該当する数字です。下位/中位/上位の3グループに回答値を分けるとき、Percentile 70を下位グループに分類する区切り点として使用できます。

4️⃣ 評価型変数の用語

TOPとBOTTOM

評価型の回答を分析する際には、中間的な傾向を示す回答を除いて明確な肯定または明確な否定意見の比率を見なければならない場合が多いです。最もよく使われる5点척度の評価型変数を例に挙げると、TOP 2(肯定的認識)とBOTTOM 2(否定的認識)に分けて見ることが多いです。

  • TOP 2: 評価型5点척도変数を基準にTOP 2は5点と4点を回答した人の比率の合計を表します。

  • BOTTOM 2: 評価型5点척度変数を基準にBOTTOM 2は1点と2点を回答した人の比率の合計を表します。

5️⃣ NPS変数の用語

11点척度で実施したNPS変数は以下のような基準で回答結果を分けて分析します。

  • NPS: 「純推奨顧客指数」と訳されるNPS(Net Promoter Score)は顧客のロイヤルティを示す指標です。0〜10点までの11点척度で推奨顧客の比率と非推奨顧客の比率を計算し、-100点から+100点までのスコアを持つことができます。

  • Promoters(推奨顧客): 自社のブランド/製品に対して満足度が高く、周囲に積極的に推奨する顧客層です。NPSアンケートで9〜10点を付けた回答者が推奨顧客に分類されます。

  • Passives(中立顧客): ある程度満足はしているが、より良いブランド/製品が現れればいつでも離れる可能性がある受動的な顧客層です。NPSアンケートで7〜8点を付けた回答者が中立顧客に分類されます。

  • Detractors(非推奨顧客): 自社のブランド/製品に満足しておらず、周囲に否定的なフィードバックを伝えることもある顧客層です。NPSアンケートで0〜6点を付けた回答者が非推奨顧客に分類されます。

척도の種類によって結果画面に表示されるTOP & BOTTOMの基準が少しずつ異なります。以下の表で具体的な基準を把握することができます。

尺度

基準

3点 尺度

1点=Bottom、3点=TopのためTOP/BOTTOMを別途表示しない

4・5・6点 尺度

TOP 2 / BOTTOM 2

7・9・10点 尺度

TOP 3 / BOTTOM 3

11点 尺度

Net Promoter Scoreの基準で0〜6点は非推奨顧客、7〜8点は中立顧客、9〜10点は推奨顧客に分類

平均と標準偏差

厳密に言えば評価型変数は等間隔척도ではないため平均が適切でない場合があります。つまり5点「非常に満足」と4点「満足」の差が4点「満足」と3点「普通」の差と同じではないという意味です。しかし慣習的に平均と標準偏差を見る場合が多いため、Opensurveyも便宜上平均を提供します。

  • 平均: 全数値回答データの算術平均を表します。

  • 標準偏差: データが平均からどれだけ散らばっているかを示します。値が大きいほどデータが広く分散しており、小さいほど平均に近く分布していると解釈します。

こちらの回答で解決しましたか?