この実験では、数十枚の葉を計測することによって、ヒイラギモクセイの葉の性質について何らかの結果を出そうとしている。
このようなとき、計測した葉のことをサンプル(または標本)と呼び、計測した葉もしなかった葉も含めて、全てのヒイラギモクセイの葉を母集団と呼ぶ。このように、サンプルの性質を調査することで母集団の性質を推定することを「標本調査」と呼ぶ。
この実験では、各グループごとに十分な数の葉を計測するようにした。また、計測するときに、偏った選び方をしないようにした。これは、この実験での調査対象が「計測したヒイラギモクセイの葉」ではなく「ヒイラギモクセイの葉」だからだ。つまり、例えば、平均や標準偏差を求めるのも、単に計測値の平均や標準偏差を求めるためだけではなく、母集団の平均や標準偏差を推定するためだ。
要するに、計測値に基づく平均や標準偏差(サンプルの平均や標準偏差)は一定の誤差を含む推定値だ。サンプルの平均に違いがあっても、母集団の平均に差がないと考えることはできない。どうしてかというと、母集団が同じでもサンプルにはよほどの偶然がない限り、多少の差が生じるからである。
サンプルの平均の間に差があっても、母集団の平均の間に差があるということにはならない。同じサイコロを同じように同じ回数(例えば10回)振っても、目の平均がぴったりと一致する方がむしろ珍しい。実力が全く同じチームどうしが試合をしても、大抵はどちらかが勝つ。打率が同じ2人のバッターであっても、ある1週間だけを取ってみると、大抵はどちらかが打率で勝っている。
それでは、母集団の平均の大小を論じることができないか、といえば、そうではない。サイコロ10回振りを何回も何回も繰り返して、それでも目の平均がかなり大きく違うとすると、サイコロそのものに違いがあると推定したくなる。多数の試合を繰り返して勝率にある程度の差があれば、チームの実力に差があると言ってもよいだろう。このような推定を論理的に行なうことは、統計的検定の役目の1つだ。
大小関係の仮説は、平均値を比較することによって行なう。しかし、上で述べた理由で、単純に「計測値の平均値の大小」を結論とするわけには行かない。
サンプルの平均値の差が大きいほど、母集団の平均に差がある可能性は高くなる(図の左と右)。また、サンプルの平均値の差が同じでも、サンプルのばらつきが大きければ、母集団の平均に差がある可能性は低くなる(図の上と下)。つまり、母集団の平均を比べようと思ったら母集団のばらつきも考慮する必要がある。また、平均や標準偏差は推定値だから、サンプル数も計算に入ってくる。
このように、サンプルのデータから母集団についての仮説に答えを与えることを「統計的検定」という。統計的検定の筋道は、数学の「背理法」に似ている。「棘の数の平均値のグループ間での差」の場合は、次のようになる。
この実験では、ExcelのTTEST関数を使い、「t検定」と呼ばれる統計的検定で、仮説を検証する。下では、統計的検定のあらすじを、t検定を例にとって説明する。
![]() mA: グループAのサンプル平均 mB: グループBのサンプル平均 sA: グループAの標準偏差(母集団標準偏差の推定値) sB: グループBの標準偏差(母集団標準偏差の推定値) nA: グループAのサンプル数 nB: グループBのサンプル数 |
同じように葉の棘の数の高さによる違いを用い、より適切な検定(Kolmogorov-Smirnov検定)の例は、石居進「生物統計学入門」(培風館)のp.119 例16にある。ただし、初版では文章で「上の枝」と「下の枝」が逆になっている。先端葉と基部葉の違いでは、符号検定または符号順位検定が適している。仮に nA = nB =n とすれば、
Excelを使ってt検定をする場合は、上の1〜3の作業を自動化して、直接tとPの値を求めることができる。しかし、1〜3の筋道を理解して「帰無仮説の元での確率」の意味を理解しないと考察ができない。
右の図は、2つのグループ(AとB)の差のt検定の例である。図だけで理解できない人は、同じファイルがここを右クリック→保存でダウンロードできるので、ダウンロードしたファイルを開いて確認できる。また、
hiiragiM-example1.xls
にもt検定の例が含まれている。
計測値の配置は、これと違っていても構わない。[C3]と[G3]のセルに、検定の結果(帰無仮説の元での確率)が計算されている。
t検定の結果を計算する式は、先端葉と基部葉の比較では、=TTEST(グループAの値がある範囲,グループBの値がある範囲,2,1または3)高さの違いによる比較では、
=TTEST(グループAの値がある範囲,グループBの値がある範囲,2,3)
本来ならば統計的検定(順位相関係数による検定など)によって判断すべきだが、時間の都合で省略し、上の方で描いたグラフによって関係の有無を判断する。
以上の検定や判断を元に、「序論―材料と方法―結果―考察―参考文献」の構成を持ったレポートを作成してください。序論は、配付資料のものを、そのまま使うこと。レポート作成上で分からない点があったら、レポートの書き方を参考にしてください。提出期限は7月中旬(正確な日付は、後日知らせます)です。