データの分析
2015年度のセンター試験から出題されている「データの分析」において、経験値1つで大きく差がつく「変量の変換」について、時間短縮の裏技を紹介します!
「変量の変換」については頻出テーマであり、厳密な解答を行うと、非常に計算が煩雑なため、共通テスト(旧:センター試験)の解答時間内に解ききるのは大変です。
しっかりと解法を覚え、瞬間的に問題を処理し、他の問題にじっくりと時間が使えるようにしましょう!
2017 センター試験
この問題を1分以内に解けますか?
変量の変換の時短裏技をマスターすれば、1分もかからずに処理できます!
【時短裏技】変量の変換
ある \(n\) 個のデータ X (\(x_1 , x_2 , x_3 \cdots x_n\)) に対して、
⑴すべてに \(a\) を加えると
・平 均: \(+a\)
・分 散:変化しない
・標準偏差:変化しない
⑵すべてを \(a\) 倍すると
平 均: \(a\) 倍
分 散: \(a^2\) 倍
標準偏差: \(|a|\) 倍
ある \(n\) 個のデータ
X (\(x_1 , x_2 , x_3 \cdots x_n\))
Y (\(y_1 , y_2 , y_3 \cdots y_n\))
に対して、
⑶すべてのデータ X に \(a\) を加え、すべてのデータ Y に \(b\) を加える
共 分 散:変化しない
相関係数:変化しない
⑷すべてのデータ X を \(a\) 倍、すべてのデータ Y を \(b\) 倍する
共 分 散: \(ab\) 倍
相関係数
\(ab>0\) ・・・変化しない( 1 倍)
\(ab<0\) ・・・(-1)倍
解説(2017センター)
\(X=1.80\times(D-125.0)+60.0\) ・・・①
の式から読み取るべき情報は、
\(D\) に何を加えて、何倍しているかだけ。
X の分散は、D の分散の [ ソ ] 倍
①より、
X は D から125.0 を引いて、1.80 倍し、60.0 を加えると言う計算。
1 つ 1 つの計算を分解して考える。
Step1:D から 125.0 を引く
分散では何を加えても影響しないため、分散の値は変化しない。
Setp2:D を 1.80 倍
分散では 元のデータを \(a\) 倍されると、分散は \(a^2\) 倍になるため、
分散は \((1.80)^2=3.24\) 倍
Step3:D に 60.0 を加える
Step1 同様、分散では何を加えても影響しないため、分散の値は変化しない。
以上から、[ ソ ] =3.24
X と Y の共分散は、D と Y の共分散の [ タ ] 倍
共分散についても、元のデータに何を加えても影響しない(変化しない)ため、何倍されているかだけに注目する。
・D → X を考えると、1.80倍 (\(a=1.80\))
・Y → Y については、変化していないため 1 倍 (\(b=1\))
と考えることができる。
したがって、共分散は \(ab=1.80\times1=1.80\) 倍
以上から、[ タ ] =1.80
X と Y の相関係数は、D と Y の相関係数の [ チ ] 倍
相関係数についても、元のデータに何を加えても影響しない(変化しない)ため、何倍されているかだけに注目する。
上の共分散と同様に考え、
\(ab=1.80>0\) より、相関係数は変化しない ( 1 倍 )
つまり、[ チ ] = 1
2019 センター試験
[ ト ]、[ ナ ]については、
5 秒も必要ない!
瞬殺問題です!
データの標準化
データの標準化とは、与えられたデータを
平均値:0、分散:1(標準偏差:1)
のデータに変換する操作のこと
(正規化。規格化などともいう)
各データ \(x_{k}\) に対して、平均値を \(\bar{x}\) 、標準偏差を \(S_{x}\) とするとき
\(z_{k}=\displaystyle\frac{ x_{k}-\bar{x}}{ S_{x}}\)
解説(2019センター)
まさに2019の問題は、標準化のお話し。
よって、平均値が 0 、分散、標準偏差が 1 となる。
つまり、[ ト ] = 0 、[ ナ ] = 1
標準化に関しては知識として知っておいてください!
参考:偏差値とは
ちなみに、全国模試を受けると必ず目にする「偏差値」は、
\(z_{k}\times10+50\)
を計算することで求めています。
コメント