Aritalab:Lecture/JSBi/Test/Math

From Metabolomics.JP
< Aritalab:Lecture | JSBi/Test(Difference between revisions)
Jump to: navigation, search
m
 
(10 intermediate revisions by one user not shown)
Line 1: Line 1:
=確率・統計=
+
=確率=
  
===平均===
+
* [[Aritalab:Lecture/Basic/Expectation|期待値と分散について]]
期待値とは、確率変数の取る値とその確率とをかけた総和である。フェアなサイコロのように全ての目が糖確率で出る場合は、目の数の期待値は(算術)平均に等しくなる。二つの確率変数X,Yがあったとき、和の平均は平均の和に等しい。
+
:<math>E[X+Y]=E[X]+E[Y]</math>
+
X,Yが独立のときに限り、積についても分配できる。
+
:<math>E[XY]=E[X]E[Y]</math>(ただしX,Yは独立)
+
===分散===
+
分散とは確率変数がとる値のばらつきの度合いである。
+
:<math>V[X] = E[(X-E[X])^2] = E[X^2] - (E[X])^2</math>
+
X,Yが独立のときに限り、和の分散は分散の和に等しい。
+
:<math>V[X+Y] = V[X] + V[Y]</math>(ただしX,Yは独立)
+
独立でない場合に生じる「ズレ」を共分散と呼ぶ。
+
:<math>V[X+Y] = V[X] + V[Y] + 2Cov[X,Y]</math>
+
===共分散・相関===
+
共分散は二組の対応する確率変数の間で、ばらつきが異なる度合いである。
+
共分散の定義は
+
:<math>Cov[X,Y]=E[ (X-E[X]) (Y-E[Y]) ]</math>
+
となる。
+
XとYに関して対称に定義されていて、XとYのばらつきの傾向が似ていれば大きな正の値になり、似ていなければ大きな負の値になる。XとYが独立であれば0になる。
+
共分散をXの標準偏差とYの標準偏差で割ったものが相関係数である。
+
:<math>Corr[X,Y] = Cov[X,Y] /(V[X]^{1/2}V[Y]^{1/2})</math>
+
  
==正規分布表==
+
=分布=
標準正規分布表の見方。
+
* [[Aritalab:Lecture/Basic/Distribution|分布について]]
{|
+
 
|
+
=統計・推定=
{| class="wikitable"
+
母集団から無作為に抽出された標本集団から、もとの母集団を統計的に推し量ることを推定という。
| z || 0.0 || 0.2 || 0.4 || 0.6 || 0.8
+
===回帰分析===
|-
+
従属変数(近似したい値、目的変数ともいう)と説明変数(近似に用いるデータ)の関係を統計的に推定することを回帰分析という。
| 0.0 || 0.5000 || 0.4207 || 0.3446 || 0.2743 || 0.2119
+
1個の説明変数から1個の従属変数を予測する場合を単回帰、説明変数を複数用いる場合を重回帰という。
|-
+
従属変数を<i>y</i>、説明変数を<i>x</i>とすると
| 1.0 || 0.1587 || 0.1151 || 0.0808 ||0.0548 || 0.0359
+
:<math> y_i = a_{i1}x_{i1} + a_{i2}x_{i2} + ... a_{ij}x_{ij}</math>
|-
+
の形でパラメータ<i>a_{ij}</i>を最小二乗法で決定する線形回帰が一般的。
| 2.0 || 0.0228 || 0.0139 || 0.0082 || 0.0047 || 0.0026
+
 
|-
+
==点推定と区間推定==
| 3.0 || 0.0013 || 0.0007 || 0.0003 || 0.0002 || 0.0001
+
標本の値から、母集団の平均値や分散を予測することを点推定(数値を点として予測)と呼び、その推定がどれ位ずれているかを区間推定と呼ぶ。
|}
+
| [[Image:JSBi-std.gif]]
+
|}
+
表におけるzの値は上から順に左→右方向にみる。正規分布全体の面積を1.0としたときの、
+
zから上側の面積を示している。例えば標準偏差が2.0以上の面積は0.0228、2.2以上の面積は0.0139。
+

Latest revision as of 15:35, 24 May 2011

Contents

[edit] 確率

[edit] 分布

[edit] 統計・推定

母集団から無作為に抽出された標本集団から、もとの母集団を統計的に推し量ることを推定という。

[edit] 回帰分析

従属変数(近似したい値、目的変数ともいう)と説明変数(近似に用いるデータ)の関係を統計的に推定することを回帰分析という。 1個の説明変数から1個の従属変数を予測する場合を単回帰、説明変数を複数用いる場合を重回帰という。 従属変数をy、説明変数をxとすると

 y_i = a_{i1}x_{i1} + a_{i2}x_{i2} + ... a_{ij}x_{ij}

の形でパラメータa_{ij}を最小二乗法で決定する線形回帰が一般的。

[edit] 点推定と区間推定

標本の値から、母集団の平均値や分散を予測することを点推定(数値を点として予測)と呼び、その推定がどれ位ずれているかを区間推定と呼ぶ。

Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox