Twitter

Twitterで数学に関する話題を発信しています。本家のサイトはログインしなければ閲覧できない仕様になってしまったので,当サイトに移して誰でも見られるようにしました。(2023.8.1)

浜田昌宏 / 浜田塾@hamadajuku

標準分散が偏差の平方和をnで割るのに対し,不偏分散はなぜn-1で割るのかについて考えてみました。そのときに必要になった証明をまとめておきます。
https://hamadajuku.com/publish/misc/variance.pdf

浜田昌宏 / 浜田塾@hamadajuku

不偏分散を使う目的は,標本の分散を使って母集団の分散を推定することです。標本側で標準分散を求めても,その期待値は母集団の分散と一致しません。不偏分散であれば,期待値は母集団の各種分散と一致します。

浜田昌宏 / 浜田塾@hamadajuku

分散の基本は,各要素と平均との関係ではなく,2要素間の関係です。分散の定義が平均との関係を使うようになっているのは,計算量を減らすための工夫に過ぎません。

浜田昌宏 / 浜田塾@hamadajuku

集合内の2要素間の関係から分散を求める場合,その2つの要素の選び方によって対応する分散が異なります。組合せ(nC2)で選ぶと不偏分散に対応し,重複順列(n²)で選ぶと標準分散に対応し,重複組合せ(nH2)で選ぶと低減分散に対応します。

浜田昌宏 / 浜田塾@hamadajuku

集合内の2要素間の関係はn×nの正方行列で表せます。ただし対角成分は同じ要素どうしの関係であり,散らばりを考える材料として本来不要です。これを無視するのが不偏分散,他の成分と同等に評価するのが標準分散,三角行列と転置行列の和とみなして2重に評価するのが低減分散にあたります。

浜田昌宏 / 浜田塾@hamadajuku

不偏分散がn-1で割る理由は,n×nの関係行列で対角成分を無視した場合,1行あたりの要素数がn-1になるからです。対角成分を他の成分と同等に評価する(標準分散)ならnで割り,2重に評価する(低減分散)ならn+1で割る理由もここから分かります。

浜田昌宏 / 浜田塾@hamadajuku

では,なぜ不偏分散が対角成分を無視するかというと,関係行列の対角成分が他の成分に比べて過剰に評価されるのを避けるためです。

浜田昌宏 / 浜田塾@hamadajuku

母集団からあらゆる標本を取り出してその関係行列を集めていくと,母集団の関係行列のうち非対角成分は均等に集まりますが,対角成分はそれよりも多めに集まります。これは標本の抽出を組合せ・重複順列・重複組合せのどれで考えても同じです。

浜田昌宏 / 浜田塾@hamadajuku

つまり標本から母集団を推定する場合,対角成分を見てしまうとそれに評価が偏ってしまい,期待値が母集団に一致しないので,対角成分は無視しなければならないというわけです。

浜田昌宏 / 浜田塾@hamadajuku

これまで不偏分散がなぜ「不偏(偏らない)」と呼ばれるのか納得できていませんでしたが,これで分かったような気がします。偏らないというのは,関係行列における対角成分と非対角成分の評価の比重のことを言っているのではないでしょうか。

浜田昌宏 / 浜田塾@hamadajuku

(続き)
b=6a³ のとき,点B(2a,6a³)から曲線Cに対してひける接線が2本で,それぞれ点P(t=-a)と点Q(t=2a)で接する様子です。点Bは曲線C上にあって接点Qと一致します。S₁:S₂=16:1が確認できます。

浜田昌宏 / 浜田塾@hamadajuku

1対1対応の演習 数II P.150 演習題13の(3)
b=-2a³ のとき,点B(2a,-2a³)から曲線Cに対してひける接線が2本で,それぞれ点P(t=0)と点Q(t=3a)で接する様子です。

浜田昌宏 / 浜田塾@hamadajuku

三角形の決定条件と対応する求積公式
3辺 → ヘロンの公式
2辺とその間の角 → 1/2 ab sinC
1辺とその両端の角 → 1/2 c² sinAsinB/sin(A+B)
3つ目は覚えなくてもいいですが,必要があればすぐ導けるように。

浜田昌宏 / 浜田塾@hamadajuku

正7角形の辺や対角線の長さを小さい順にa,b,cとするとき,1/a=1/b+1/cが成り立つことを証明する件です。こんな方法も面白いと思います。

浜田昌宏 / 浜田塾@hamadajuku

正7角形の1辺の長さをα,対角線の長さをβ,γとすると,1/α=1/β+1/γが成り立ちます。その理由は次のような図を描くと簡単に分かります。