推定値(estimating)

代表値と推定値

標本定義
代表値 (average)集合の特徴を縮約したもの
推定値 (estimating value)母集団の性質を縮約した統計量の値
統計量(Statistic)母集団の性質を縮約した統計量のこと
推定量(Estimate)標本から母集団の性質を推定した統計量のこと

母数

統計量
母平均$\mu = \frac{\sum_{i = 1}^n {x_i}}{n}$
母分散$\sigma^2 = \frac{\sum_{i = 1}^n {(x_i - \mu)^2}}{n}$
母標準偏差$\sigma = \sqrt{\frac{\sum_{i = 1}^n {(x_i - \mu)^2}}{n}}$
  • なお、母集団に関する統計量は、
  • $x_i$は全数調査による観測値とする
  • よって、無限大(n=全数)の場合は計算不可

標本の統計量

統計量
標本平均$\overline{x} = \frac{\sum_{i = 1}^n {x_i}}{n} = \mu$
標本分散$s^2 = \frac{\sum_{i = 1}^n {(x_i - \overline{x})^2}}{n}$
標本標準偏差$s= \sqrt{\frac{\sum_{i = 1}^n {(x_i - \overline{x})^2}}{n}}$
  • 標本分散は一致推定量ではあるものの不偏推定量ではない
  • つまり、nが十分に大きくない場合には標本分散の期待値は母分散に一致せず、母分散より小さくなります
  • そこで不平推定量を用いる

母集団の不偏推定量(標本から母数を推定した推定量)

  • 不偏推定量(Unbiased quantitative)
    • 不偏分散は標本分散と違い、一致性と不偏性をもつ
統計量
不偏平均$\hat{\mu} = \overline{x}$
不偏分散(unbiased estimate of variance)$\hat{s^2} = \frac{\sum_{i = 1}^n {(x_i - \overline{x})^2}}{n-1}$
不偏標準偏差$\hat{s} = \sqrt{\frac{\sum_{i = 1}^n {(x_i - \overline{x})^2}}{n - 1}}$
  • 分母のn-1の意味は、標本のばらつき =< 母集団のばらつき
    • ばらつきは分散とS.D.のこと
    • 平均以外は分母をn-1する(自由度を-1)
  • 大標本(x>30)のときはn-1を気にする必要はない
  • 母平均の不偏推定量$\hat{\mu}$は標本平均の$\overline{x}$

標本平均の分布から母数の推定量

統計量
標本平均の分布$N(\mu, \frac{\sigma^2}{n})$
標本平均の分布の平均$\bar{\bar{X}} = \bar{X_{\bar{X}}} = E(\bar{X})= \mu$
誤差分散$\sigma_{\overline{x}}^2 = \frac{\sigma^2}{n}$
標準誤差$\sigma_{\overline{x}} = \frac{\sigma}{\sqrt{n}}$
標本誤差分散$s_{\overline{x}}^2 = \frac{s^2}{n}$
標本標準誤差$s_{\overline{x}} = \frac{s}{\sqrt{n}}$
不偏誤差分散$\hat{\sigma_{\overline{x}}^2} = \frac{\sigma^2}{n} = \frac{s}{n-1}$
不偏標準誤差$\hat{\sigma_{\overline{x}}} = \frac{\sigma}{\sqrt{n}} = \frac{s}{\sqrt{n-1}}$
  • なぜ標本平均の分布からの母数の推定が必要になるか?
    • 標本平均$\overline{X}$から母平均$\mu$を推定する場合に、誤差が問題となるから
  • 標本サイズを4倍にすれば標準誤差は半分になる
  • 標本平均の分布は正規分布になる
    • 例え母集団が正規分布でなくてもOK
    • see 中心極限定理

標準偏差と標準誤差

名前意味
分散標本分布に対する分散
標準偏差(Standard deviation; S.D.)標本分布(測定量)に対する標準偏差
誤差分散標本平均の分布に対する分散
標準誤差(standard error; SE)標本平均の分布(推定量)に対する標準偏差
  • 標準誤差は推定量の標準偏差のこと
  • つまり、推定量のばらつき(=精度)を表す
  • 推定量は、あくまで標本から推定した統計量であり、
  • 実際の母集団の統計量とは多少の誤差を含む。
  • そこで標準誤差を使い、標本の代表値(一般的にはmean)の集合である標本平均の分布から推定量の誤差を出す。
  • 他方、標準偏差は母集団から得られた個々のデータ(測定値)のばらつき

標準化変量と準標準化変量

名前意味
標準化変量あるデータが全体の中でどれくらいの位置にあるのかを示す値
準標準化変量T分布での標準化変量

標準化変量

名前
標本の標準化変量(Z値)(A)
標本平均の標準化変量(Z値)(B)
標本平均の準標準化変量(T値)(C)

$$ z_i = \frac{x_i-\mu}{\sigma} \tag{A} $$

$$ z_{\overline{x_i}} = \frac{\overline{x_i}-\mu_{\overline{x}}}{\sigma_{\overline{x}}} = \frac{\overline{x_i}-\mu_{\overline{x}}}{\frac{\sigma}{\sqrt{n}}} \tag{B} $$

$$ t_{\overline{x}} = \frac{\overline{x}-\mu}{\hat{\sigma_{\overline{x}}}} = \frac{\overline{x}-\mu}{\frac{\hat{\sigma}}{\sqrt{n}}} = \frac{\overline{x}-\mu}{\frac{s}{\sqrt{n-1}}} \tag{C} $$

不偏誤差分散と不偏標準誤差

  • 標本平均の分布から母数の推定には、母集団のS.D.や分散が必要
  • だがそれはわからないので、標本から母集団の推定に使用する不偏推定の値を利用する

分散と不偏分散

種類意味
分散測定値のばらつきを表す
不偏分散標本から母集団の分散を推定するために用いる

REFERENCES:

  • http://heycere.com/statistics/interval-estimation-for-population-mean-case-when-population-variance-is-unknown-and-large-samples/
  • https://best-biostatistics.com/summary/sd-se-chigai.html
  • http://web.econ.keio.ac.jp/staff/bessho/lecture/06/econome/060421prob3.pdf
  • http://makemeanalyst.com/observational-studies-and-experiments/population-distribution-sample-distribution-and-sampling-distribution/
  • https://www.youtube.com/watch?v=Ua4rVck2hzI&list=PLdyM_iZEFdcvCM_fUosLvdx5hgZT2x8zt&index=5
  • https://en.wikipedia.org/wiki/Sampling_distribution
  • https://www.jcu.edu.au/__data/assets/pdf_file/0008/115478/Basic-Statistics-6_Sample-vs-Population-Distributions.pdf
  • https://to-kei.net/estimator/unbiasedness/
  • https://toukeigaku-jouhou.info/2018/02/17/difference-between-estimator-and-estimate/
  • https://bellcurve.jp/statistics/course/8616.html
  • https://to-kei.net/basic/glossary/variance/#i-6