t検定

Style

section-padding-none

t検定とは？

t検定（Studentの t 検定とも呼ばれます）は、仮説検定を使用して1つまたは2つの母集団の平均を評価するためのツールです。t検定を使用して、単一のグループが既知の値と異なるかどうか（1標本のt検定）、2つのグループが互いに異なるかどうか（独立した2標本のt検定）、対応のある測定値が有意に異なるかどうか（対応のある、または関連のある標本のt検定）を評価できます。

t検定の使用方法

最初に、検定する仮説を定義し、誤った結論を引き出すリスクをどれだけ許容するかを指定します。たとえば、2つの母集団を比較する場合、それらの平均が同じであるという仮説を立てます。そして、実際には母平均には差がない場合に、「母平均の差が存在する」と結論付けてしまう確率をどれだけ許容するかをあらかじめ決めておきます。次に、データから検定統計量を計算し、それをt分布の理論値と比較します。結果に応じて、帰無仮説を棄却するか、棄却できないかが決まります。

2つ以上のグループがある場合はどうすればよいですか？

t検定は使用できません。多重比較法を使用します。使用できる検定の例としては、分散分析（ANOVA）、Tukey-Kramerのペアごとの比較、Dunnettのコントロール群との比較、平均分析（ANOM）があります。

t検定の仮定

t検定は仮定からの逸脱に対して比較的ロバスト（頑健）ですが、t検定は次のことを前提としています。

データ値は連続変数である。
標本データは、母集団からランダムにサンプリングされている。
等分散性がある（つまり、各グループのデータのばらつきは類似している）。
分布は、ほぼ正規分布である。

2標本の t 検定の場合、独立した標本が必要です。標本が独立していない場合は、対応のある t 検定が適切な場合があります。

t検定のタイプ

平均を比較するための3つの t 検定があります。1標本の t 検定、2標本の t 検定、および対応のある t 検定です。次の表は、それぞれの特徴を要約し、正しい検定を選択する方法に関する指針を与えます。各タイプの t 検定の仮定と計算の詳細、および例については、個々のページにアクセスしてください。

1標本のt検定

2標本のt検定

対応のあるt検定

シノニム

Studentのt検定

独立したグループのt検定独立標本のt検定等分散の場合のt検定プーリングしたt検定異分散の場合のt検定

対応のあるグループのt検定関連のある標本のt検定

変数の数

変数のタイプ

連続尺度の測定値

連続尺度の測定値グループを定義するカテゴリカル変数または名義尺度変数

連続尺度の測定値グループ内でペアを定義するカテゴリカル変数または名義尺度変数

検定の目的

母平均が特定の値に等しいかどうかを判断する

2つの異なるグループの母平均が等しいかどうかを判断する

母集団で測定値のペアの差がゼロかどうかを判断する

例：次の場合を検定します

あるグループの人々の平均心拍数が65に等しいかどうか

2つのグループの人々の平均心拍数が同じかどうか

グループの人々の運動前後の心拍数の平均値の差はゼロかどうか

母平均の推定

標本平均

各グループの標本平均

測定値のペアの差の標本平均

母集団の標準偏差

不明。標本標準偏差を使用

不明。各グループの標本標準偏差を使用

不明。測定値のペアの差の標本標準偏差を使用

自由度

標本の観測数から1を引いた数、つまり： n–1

各標本の観測値の合計から2を引いたもの、つまり： n1 + n2 – 2

標本のペアの観測数から1を引いた数、つまり： n–1

上記の表は、母平均の t 検定のみを示しています。もう1つのよく用いられる t 検定は、相関係数の検定です。この t 検定を使用して、相関係数がゼロと有意に異なるかどうかを判断します。

片側検定 vs. 両側検定

仮説を定義するときは、片側検定と両側検定のどちらを使用するかも定義します。データを収集したり計算を行ったりする前に、この決定を行う必要があります。平均に対する３つの t 検定すべてに対して、この決定を行います。

説明のために、1標本の t 検定を使用してみましょう。プロテインバーの無作為標本があり、バー当たり20gのタンパク質を含んでいるとラベルに表示されているとします。帰無仮説は、未知の母平均が20であるというものです。データが異なる母平均を示唆しているかについて、単純に知りたいと仮定します。この場合、仮説は次のようになります。

$ \mathrm H_o: \mu = 20 $

$ \mathrm H_a: \mu \neq 20 $

これが両側検定です。データを使用して、標本平均が20と十分に異なるかどうか（大きいか小さいか）を確認して、未知の母平均が20とは異なると結論付けます。

代わりに、ラベルの広告が正しいかどうかを知りたいとします。データは、未知の母平均が20以上であるという考えを裏付けているでしょうか？　それとも裏付けていないのでしょうか？　この場合、仮説は次のようになります。

$ \mathrm H_o: \mu >= 20 $

$ \mathrm H_a: \mu < 20 $

これが片側検定です。データを使用して、標本平均が20より十分に小さいかどうかを確認し、未知の母平均が20以上であるという仮説を棄却します。

片側検定と両側検定の概念を示す画像については、t分布ページの「仮説検定と分布の裾」セクションを参照してください。

t検定を実行する方法

平均に関するすべての t 検定を、同じ手順で分析します。

データを収集する前に、帰無仮説（$ \mathrm H_o $）と対立仮説（$ \mathrm H_a $）を定義します。
有意水準（α値）を決定します。これは、間違った結論を導き出すリスクをどれだけ取るかを決めることです。例えば、2つの独立したグループを比較するときにα = 0.05と設定するとします。これは、実際にはそうではない場合に、未知の母平均が互いに異なると結論付けるリスクを5％に定めたことになります。
データに誤りがないか確認します。
検定の前提条件を確認します。
検定を実行し、結論を導き出します。平均に関わるすべての t 検定には、検定統計量の計算が含まれます。検定統計量をt分布の理論値と比較します。理論値には、α値とデータの自由度の両方が関係します。詳細については、1標本の t 検定、2標本の t 検定および対応のある t 検定のページにアクセスしてください。

layout

2 column

Style

columns-75-25, section-top-padding-xsmall