これまで何回かt検定について、紹介してきました。
今回は平均値の差の検定について紹介したいと思います。
1群の時とは勝手が違い、2群の間のデータの関係性で検定の方法が変わってきます。
ちょっと厄介です。
ですが、安心してください。対象のデータがどのようなものか区別がつけば、後はエクセル任せでも良いので。
それでは行きましょう!
統計学がうまく使えなかった人はコチラ⇒統計学を活かす 解析しやすい数値化のノウハウ
データの内容によって変わるt検定【2群のt検定】
2群の平均値の差の検定には、
・対応のない2群のt検定
・対応のある2群のt検定
の2つが存在します。
対応のない2群とは?
対応のない2群とは、比較するデータ以外の別の要素も異なっているデータ群を指します。
例えば、クラスAとBのテストの平均値の比較なんかは、対応のない2群の平均値の差の検定になります。
クラスA、Bは所属する人間がそれぞれ別々であり、生徒たちの学力は対応しないからです。
対応のある2群とは?
対応のある2群とは、比較するデータ以外すべての要素が一致しているデータ群を指します。
例えば、あるクラスに対して勉強合宿を実施した前後のテストの平均値の比較が、これに該当します。
このように特定の集団に対して、何かしら干渉した場合の前後の効果を確認するときは、この対応のある2群に該当します。
それぞれのt検定の実施方法とは?
対応のない2群のt検定【welchのt検定】
welchのt検定で検定を行います。t値は以下の式で算出します。
$$t=\frac{x_1-x_2}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}$$
$$自由度=\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}÷[\frac{(\frac{σ_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{σ_2^2}{n_2})^2}{n_2-1}]$$
よくwelchのt検定は分散が等しくない場合に使用するものとされていますが、最近では多重性の問題から、分散が等しかろうが、異なろうが、とりあえずwelchを使っておけというのが一般的になっています。
この式を扱うのは面倒くさそうですが、ご安心を。
エクセルの分析ツールに実装されているので、実際にはとても簡単です。
対応のある2群のt検定【1群のt検定と同じ】
この場合はまず2群のデータの差dを算出します。
対応のある2群の差の検定は、差が0に対して有意差があるかどうかをみる1群のt検定に等しいです。
つまり帰無仮説H0 μd=0になります。
例えば以下の表で見てみますと、
差の平均値70が0に対して有意差があるかどうかを検定することになるのです。
つまり検定方法としては1群のt検定と一致することになります。
$$t=\frac{μ_d-0}{s/\sqrt{n}}$$
これもエクセルの分析ツールで簡単にできます。
エクセルでの実施方法【簡単です】
対応のない2群のt検定
まず、エクセルのデータタブの分析ツールをクリックします。
分析ツールの分散が等しくないと仮定した2標本による検定をクリックします。
入力元に分析対象のデータを選択します。
この時にラベル(データのタイトル)ごと選択指定下さい。下のラベルにチェックを入れることで、分析後にラベルが付与されます(これをやっていないと変数1、2となるので識別が分からなくなります)。
またαに有意水準を入力します。一般的には0.05です(5%だからって5とは入れてはいけません)。
そしてOKをクリックすれば分析結果が出力されます。
データの見方としてはP値に注目してください。
このP値が有意水準(=0.05)を下回った場合、有意水準ありになります。
対応のある2群のt検定
この場合は、分析ツールで一対の標本による平均の検定を選んでください。
あとは、先ほどの対応のない2群の検定と同じ方法、データの見方になります。
まとめ
今回は、対応のあり/なしでの2群のt検定を解説しました。
対応のあるなしの識別はそれほど難しくはないと思います。
また識別さえ出来てしまえば、エクセルで簡単に分析出来ますので簡単です。
ただ、検出力の方は事前/事後しっかり見ておく必要があります。
そのあたり気を付けて使用していきましょう。
コンテンツ紹介
昨今機械学習やディープラーニングなど、データを扱うための知識の重要度は日々増していっています。
そんな最先端のスキルを使いこなすには、土台となる統計学の知識が必要不可欠です。
しかしながら、統計学は本で読んでも何とか理論は理解できてもそこからどのように実務に活かしたら良いのか分からない。そんな机上と現実のギャップが凄まじい学問です。
そんな机上と現実のギャップを埋めるために、私は当サイトをはじめ様々なコンテンツを展開しています。
youtubeでは登録者1万人の統計学のチャンネルを運用しています。
動画投稿だけでなく、週2回のコメントに来た質問への回答配信も行っているので気になる方はどしどし質問をお寄せください。
youtubeでは無料動画だけでなく、有料のメンバーシップ限定動画も運用しています。
メンバーシップ登録リンク(押しただけで登録はされないので、気軽にクリックしてください)
エクセルやJAMOVIといった無料で使える統計ツールの実際の使い方。そして無料動画では敷居の高い(というよりマニアックゆえに再生数が見込めない(笑))解説動画をアップしています。
本を読んで実際に分析してみようと思ったけど、どうもうまくいかなかった。本では見かけない、あるいは難しすぎて扱えない手法があったという方。ぜひ一度ご参加ください(動画のリクエストがあれば反映させます)
「そうは言われても、うちのデータは統計学じゃ分析出来ないよ」
そういう方もいらっしゃると思います。私の経験上、そういったデータ分析が出来ない状況の一つとして量的変数として目の前の現象を扱えていないというものがあります。
私のnoteでは、過去私が製品開発を行う上で実践した分析しやすい数値の測定方法を公開しています。
私が開発活動する上で創意工夫を凝らして編み出してきたアイデアの数々を公開しています(私の知見が増えたら更新していきます)。本やネットではまず載っていません。うまい測定方法のアイデアが浮かばないという方はぜひこちらをご覧ください。
「いや、その前に使える手法を体系的に学びたいんだけど」
そんな方には、udemyの講座を推奨します。
初歩的な標準偏差から、実験計画法、多変量解析まで、実際に私が実用する上で本当に使用したことがある手法に絞って順序立てて解説しています。
どの手法が結局使えますのん?という方はぜひこちらをお求めください。
こんな感じで、様々なコンテンツを展開しています。
今後は品質工学や品質管理に重点を絞ったコンテンツなども発信していきます。
ぜひリクエストがありましたら、それらも反映させていきますのでまずはお気軽にご意見くださいな。
コメント