▶ データ分析を学ぶステップについて解説しています。
はじめに
変数には尺度という考え方があるのをご存じですか?今回は変数の尺度について基本から解説します。変数はその性質に応じて「名義尺度」「順序尺度」「間隔尺度」「比例尺度」に分けることができます。この4つの尺度をもうすこし大まかに「質的変数」「量的変数」にわけることができます。
※別の分け方として「離散変数」「連続変数」という分け方もありますがここでは「質的変数」「量的変数」で解説をします。
変数の分類
質的変数と量的変数
まずは大まかな分類である質的変数と量的変数について解説していきます。
質的変数はカテゴリーなどの区分を表す変数です。(仮に数値で表されていたとしても)大小関係がありません。例えば、性別や血液型などが該当します。性別は男性か女性かの区分であり、大小関係がありませんね。
量的変数は数値を持つ変数です。大小関係があり数値で表現することができます。例えば、身長や体重などが該当します。「身長」は数値で表現されるため、大小関係がありますね。
このように変数を区分を表す変数であるか(質的変数)、数値を持つ変数であるか(量的変数)に分類することができます。ここまでは簡単ですね。
尺度水準による分類
では、次に尺度水準による分類を見ていきましょう。
■名義尺度
名義尺度は「特定の順序ではなく他と区別するためのラベル」です。
例:性別、血液型、郵便番号、都道府県、学籍番号など
■順序尺度
順序尺度は「順序の記述」です。順序や大小には意味があるが間隔には意味がありません。和や差の演算はできない。(1位+2位≠3位)
例:ランキング、満足度、好感度など
■間隔尺度
間隔尺度は「目盛が等間隔になっている尺度」です。間隔尺度では「間隔」に意味があります。和や差の演算はできますが、積や商の演算はできません。例えば、気温が19℃から1℃上昇すると20℃になるとは言えるが、10℃から20℃に上昇したとき、2倍になったとは言えません。
例:気温(摂氏)、西暦
■比例尺度
比例尺度は「0が原点であり、間隔と比率に意味があるもの」です。和や差の演算に加えて、積や商などの演算も可能です。例えば、身長が150cmから30cm伸びると180cmになると言えるし、1.2倍になったとも言えます。
例:体重、金額、速度
質的・量的分類と尺度水準による分類を組み合わせた整理
ここまで変数を質的・量的な視点と尺度水準という視点で分類してきました。これらを組み合わせた形で整理しておきましょう。次のようにまとめることができます。
質・量による分類 | 尺度水準 | 説明 | 例 |
質的データ | 名義尺度 | 他と分類するためのもの | 性別、血液型 |
カテゴリに分類する ための特性を表す | 順序尺度 | 順序には意味があるが間隔 には意味がない | ランキング、 満足度 |
量的データ | 間隔尺度 | 目盛が等間隔になっているもの | 気温(摂氏)、 西暦 |
数値で表すことが でき大小に意味あり | 比例尺度 | 原点があり間隔や比率に意味が あるもの | 体重、金額 |
まとめ
今回は変数の分類について基本から解説しました。変数は大まかに分けると質的変数、量的変数に分けることができます。さらに尺度水準により分類することができます。これを用いると、質的変数は、名義尺度、順序尺度に分けることができます。量的変数は、間隔尺度、比例尺度にわけることができます。それぞれの尺度によって利用できる演算が異なるので、変数の意味をよく捉えてデータ分析に臨むようにしましょう。
コメント