Twitter

Twitterで数学に関する話題を発信しています。本家のサイトはログインしなければ閲覧できない仕様になってしまったので,当サイトに移して誰でも見られるようにしました。(2023.8.1)

浜田昌宏 / 浜田塾@hamadajuku

空間ベクトルのついでに平面の方程式を習うと,ax+by+cz+d=0の形で書かれていると思います。ベクトルとのつながりでそうなるのですが,場合によってはz=ax+by+cという陽関数表示の方が便利なこともありますので,選択肢として両方持っておくようにして下さい。

浜田昌宏 / 浜田塾@hamadajuku

平面上の直線について,ax+by+c=0とy=ax+bの特徴はよく知っていると思います。空間内の平面についても同様と考えて使い分けて下さい。

浜田昌宏 / 浜田塾@hamadajuku

z=ax+by+cのアイデアは3次元空間でなくても使います。座標平面上でax+by+cを扱うときは,それを空間内の平面と考えることで理解しやすくなります。線形計画法,正領域と負領域,点と直線の距離の公式など。

浜田昌宏 / 浜田塾@hamadajuku

点と直線の距離の公式 d=|ap+bq+c|/√a²+b² を,ベクトルの内積を利用して証明して下さい。

浜田昌宏 / 浜田塾@hamadajuku

点P(p,q),直線ax+by+c=0,直線上の任意の点T(x,y)とすると,距離dはベクトルTPと直線の法線ベクトル(大きさ1)との内積です。
d=|(p-x,q-y)∙(a,b)/√a²+b²|=|ap+bq-ax-by|√a²+b²=|ap+bq+c|√a²+b²

浜田昌宏 / 浜田塾@hamadajuku

絶対値記号をつけるのは,法線ベクトルのとり方が2通りあり,そのうち一方は内積が負になるからです。

浜田昌宏 / 浜田塾@hamadajuku

変量x,yに対して新しい変量z=x-yを作ると,標準偏差Sと相関係数RについてSz²=Sx²+Sy²-2SxSyRxyが成り立ちます。これは余弦定理の形をしています。つまりSx,Sy,Szを3辺として三角形を作ると,SxとSyの間の角θの余弦cosθが相関係数になります。

浜田昌宏 / 浜田塾@hamadajuku

GeoGebraで確認してみました。
http://ggbtu.be/m1939573

浜田昌宏 / 浜田塾@hamadajuku

このことから |Sx-Sy|≦Sz≦Sx+Sy が分かります。
前の等号成立 ⇔ θ=0° ⇔ 相関係数 Rxy=1
後の等号成立 ⇔ θ=180° ⇔ 相関係数 Rxy=-1

浜田昌宏 / 浜田塾@hamadajuku

相関係数 Rxy>0 ⇔ θは鋭角 ⇔ Sz²<Sx²+Sy²
相関係数 Rxy=0 ⇔ θは直角 ⇔ Sz²=Sx²+Sy²
相関係数 Rxy<0 ⇔ θは鈍角 ⇔ Sz²>Sx²+Sy²
ここでは鋭角は0°,鈍角は180°を含みます。

浜田昌宏 / 浜田塾@hamadajuku

以上は z=x-y または z=y-x の場合です。z=x+y の場合は Sz²=Sx²+Sy²+2SxSyRxy になります。つまり相関係数の符号の扱いが逆になるだけで,あとは全く同じです。

浜田昌宏 / 浜田塾@hamadajuku

z=x+yの場合は,
相関係数 Rxy<0 ⇔ θは鋭角 ⇔ Sz²<Sx²+Sy²
相関係数 Rxy=0 ⇔ θは直角 ⇔ Sz²=Sx²+Sy²
相関係数 Rxy>0 ⇔ θは鈍角 ⇔ Sz²>Sx²+Sy²

浜田昌宏 / 浜田塾@hamadajuku

分散は,データX=(x1,x2,…,xn)が平均A=(a,a,…,a)からどれだけ離れているかを測るものです。このとき偏差の2乗和Σ(x-a)²を求めるのは,直線距離(ユークリッド距離)で測っているからであり,絶対値の和Σ|x-a|だとマンハッタン距離になります。

浜田昌宏 / 浜田塾@hamadajuku

Σ(x-a)²は,aが平均のときに最小になります。Σ|x-a|の場合は,aが中央値のときに最小になります。

浜田昌宏 / 浜田塾@hamadajuku

n個のデータをベクトルX=(x1,x2,…,xn),その平均をaとしてA=(a,a,…,a)とすると,X∙A=|A|²が成り立ちます。XとAのなす角をθとすると|X|cosθ=|A|,つまり|X|≧|A|で等号成立条件はθ=0°です。

浜田昌宏 / 浜田塾@hamadajuku

分散は|X-A|²/nと表せます。これを展開すると|X|²/n-|A|²/nになり,「分散=2乗の平均-平均の2乗」を導くことができます。

浜田昌宏 / 浜田塾@hamadajuku

図に表すと∠OAX=90°となり,平均は偏差の2乗和|X-A|²を最小にする意味があることがよく分かります。

浜田昌宏 / 浜田塾@hamadajuku

2次元の散布図にn個のデータが正n角形の頂点となるように配置されているとき,相関係数は0であることを証明して下さい。

浜田昌宏 / 浜田塾@hamadajuku

解答例を作りました。
https://hamadajuku.com/publish/misc/correlation0.pdf