Twitter

Twitterで数学に関する話題を発信しています。本家のサイトはログインしなければ閲覧できない仕様になってしまったので,当サイトに移して誰でも見られるようにしました。(2023.8.1)

浜田昌宏 / 浜田塾@hamadajuku

2変量×n個の偏差xi,yiをベクトルとして考えるとき,n個の2次元ベクトル(x1,y1),...,(xn,yn)とみたり,2個のn次元ベクトル(x1,...,xn),(y1,...,yn)とみたりしますが,偏差ベクトルというときは後者の方を指します。

浜田昌宏 / 浜田塾@hamadajuku

散布図を考えるときは,前者の2次元ベクトル(x1,y1),...,(xn,yn)に注目しています。一方,xとyの相関係数を考えるときは,後者の偏差ベクトル(x1,...,xn),(y1,...,yn)に注目しています。相関係数は2つの偏差ベクトルのなす角θの余弦cosθです。

浜田昌宏 / 浜田塾@hamadajuku

偏差には和が0という性質があります。偏差は平均が0となるようにデータをシフトさせたものだからです。前者の2次元ベクトルで言えば,(x1,y1)+...+(xn,yn)=(0,0)ということです。これは,n個の同じ質量の質点が原点を重心とするように散らばっているイメージです。

浜田昌宏 / 浜田塾@hamadajuku

縦a,横bの長方形の面積abは,2つの正方形の面積a²,b²の相乗平均とみなすことができます。

浜田昌宏 / 浜田塾@hamadajuku

共分散は,長方形の面積(ただし符号つき)の相加平均をとる形になっています。それぞれの長方形の面積は正方形の面積の相乗平均とみなせるので,共分散は正方形の面積の相乗平均(ただし符号つき)の相加平均といえます。

浜田昌宏 / 浜田塾@hamadajuku

すると,相関係数 r[x,y]=s[x,y]/s[x]s[y] は,分子が「正方形の面積の相乗平均の相加平均」,分母が「正方形の面積の相加平均の相乗平均」で,その違いを比で表したものとみなすことができます。

浜田昌宏 / 浜田塾@hamadajuku

n次元の座標空間において,点O,点A(1,2,...,n),点B(n,...2,1) とします。n→∞ とするとき,三角形OABはどんな形になりますか。

浜田昌宏 / 浜田塾@hamadajuku

二等辺三角形なのは明らかなので,あとは頂角を調べます。cos∠AOB=(1∙n+2∙(n-1)+...+n∙1)/(1²+2²+...+n²)=(中略)=(n+2)/(2n+1)→1/2,すなわち ∠AOB→60°となり,正三角形に近づいていきます。

浜田昌宏 / 浜田塾@hamadajuku

直感的にはこれでいいだろうと思いますが,次元を∞にとばしたときの極限がどう定義されるのか,本当は知りません。

浜田昌宏 / 浜田塾@hamadajuku

相関係数は変量を1次式で変換しても変わらないという性質があります。つまり,変量x, yに対してu=ax+b, v=cx+d (a>0,c>0) で新しい変量u,vを定めたとき,相関係数について r[x,y]=r[u,v] が成り立ちます。

浜田昌宏 / 浜田塾@hamadajuku

式で確認すると,s[u,v]=acs[x,y],s[u]=as[x],s[v]=cs[y] より,r[u,v]=s[u,v]/s[u]s[v]=acs[x,y]/as[x]cs[y]=s[x,y]/s[x]s[y]=r[x,y] となります。

浜田昌宏 / 浜田塾@hamadajuku

これは,相関係数をcosθ (θは2つの偏差ベクトルのなす角) と考えると,図形的にイメージすることもできます。偏差ベクトルu,vは,偏差ベクトルx,yをそれぞれa倍,c倍に伸ばしているだけなので,ベクトルのなす角は変わらないということです。

浜田昌宏 / 浜田塾@hamadajuku

標本から母集団の平均・分散を推定するとき,標本平均はそのままで母平均とみなすことができますが,標本分散は母分散より小さめに出る傾向があり,正しい推定になりません。補正するには,分散の ÷n の部分を ÷(n-1) に変えて計算します。これを不偏分散といいます。

浜田昌宏 / 浜田塾@hamadajuku

Excelでは,分散を求める関数がVARP(VAR.P)で,不偏分散がVAR(VAR.S)です。データが母集団であれば前者を使い,標本であれば後者を使います。

浜田昌宏 / 浜田塾@hamadajuku

一様乱数を足していくと正規分布に近づいていくという中心極限定理を試してみました。幅1の一様分布の分散は1/12なので,12回分足すと標準正規分布N(0,1)に近くなります。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/centrallimit.html

浜田昌宏 / 浜田塾@hamadajuku

これを利用してJavaScriptで正規分布の乱数を作ってみました。
var s=0;
for (var i=0; i<12; i++) s+=Math.random();
return s-6;
https://hamadajuku.com/program/js/norm.html