【t検定】二つの集団の差を見る検定

【t検定】二つの集団の差を見る検定

F検定。2標本の分散の差を判断する!

まずはExcelのデータ分析→「F検定:2標本を使った分散の検定」をクリックします。

F検定の場所
F検定の場所

そして二つの標本のデータを入力します。α=0.05というのは有意水準を表します。0.05とは5%のことで、結果を示すときは「5%以下の有意水準で差が見られた」という記述をします。

F検定の変数いれ
F検定 変数入力

「何が5%以下なんだ???」とか「データの差がある確率が5%以下ってことか??」

 

というような混乱があるかもしれませんが、ここで思い出してほしいのですが、t検定はデータ間の差のたまたま度をみる検定でしたね。データの差がたまたまであれば、データに差がない。逆にデータの差がたまたまでなければデータに差があると言えるのです。つまりこの有意水準5%とは「データ間の差がたまたまである確率が5%以下である。」ということを表すのです。

そしてこれが結果です。

F検定の結果表示
F検定の結果

見るべき値は「観測された分散比とF境界値」or「P値」です。それによって2標本が等分散か否かが分かります。

等分散かどうかの判断のしかた

上にあげた2つのうちどちらかを見ることで判断できますが、P値での判断が分かりやすいですし、簡単ですので「観測された分散比とF境界値」での方法はここでは紹介しません。わざわざ分かりにくいことをする必要は無いですよね笑

さて、先ほどのF検定の結果、P(F<=f)片側の項目がP値を表します。このP値が最初に決めたα=0.05という有意水準よりもP値が小さければ2つの標本の分散は等しくないということになります。逆に大きければ2つの標本の分散には有意な差がなく、等分散であるということができます。

F検定の結果表示
F検定の結果

今回はP値が0.022で0.05よりも小さいため、2つの標本の分散が等しくないことが分かりました。これにより今回使うt検定が、「分散を等しくないと仮定した2標本による検定」であることが分かりました。さて、最後のステップです。

【t検定の結果】

行うべきt検定を行った結果がこちらです。ここで、「仮説平均との差」という項目は0にしてください。これは「両データ間の平均に差は0である」という仮定を意味します。実際にt検定が示していることは、この両データ間の平均の差が0である確率が5%以下であるということなんですよ。

t検定の結果表示
t検定の結果

ここで見るべきは「t境界値 片側」と「t」という項目です。それぞれ、「片側検定での有意差を認められる値」と「t値」を意味しています。さらに、片側検定とは平均が高いほうに差があるということを検定することです。一方両側検定とは平均に差があることを示す検定です。

さて、ラストステップです。この結果は何を示しているでしょうか。t>t 境界値 片側 なので、つまりはt値>t境界値 片側 となっていれば、統計的に有意水準5%以下の有意な差ががAクラス>Bクラスでみられたということです。

 

※ちなみに「P(T<=t) 片側」とか「P(T<=t) 両側」はP値を表します。これは何だというと、有意水準ってありましたよね。記述では「有意水準5%以下で差が見られた」とするべきだと書きましたが、P値はその具体的な確率です。データ間の差が実際何パーセント以下の確率のたまたま度なんだぞ、ということを示しています。

t検定の方法まとめ

用語の説明がかなり多くて流れがつかみにくくなってしまったので、ここでまとめましょう。

 

t検定の流れ

①データが同じ被験者内のデータなのかどうか判断する。同じ被験者内のデータなら④へ。違う被験者間なら②へ。

②データ分析→F検定で分散に差があるか検定する。

③p値が0.05以下ならば2標本の分散に差がある(等分散でない)。0.05以上なら2標本の分散に差が無い(等分散である)と判断する。

④同一被験者内のデータならば、一対の標本による平均の検定。違う被験者間で分散が等しいなら、等分散を仮定した2標本によるt検定。分散が等しくないなら、等分散を仮定しない2標本によるt検定を行う。

⑤t値の絶対値がt境界値よりも高ければ2つの標本は統計的に有意な差が見られたことになる。

 

t検定はExcelでやれば、同じ被験者内のデータなら、データ分析をするだけ、たったの1ステップ終わる簡単な検定です。被験者間のデータでもExcelでデータ分析を2回するだけ。たったの2ステップです。とにかく色んな調査で使えます。簡単なので使いこなしましょう。

固定ページ: 1 2