Probability statistics

更新日: 2021-02-22

データの可視化

散布図#

データの分布や相関関係を表示する。

pythonでは下記ようにプロットする。

1
2
3
4
5
6
7
import numpy as np
import matplotlib.pyplot as plt

x = np.random.rand(100)
y = np.random.rand(100)
 
plt.scatter(x, y)

scatter

...

検定と仮設検定

統計的推定#

母集団の特性値を標本のデータから推測すること。点推定と区間推定がある。

点推定と標準誤差#

標準誤差は下記の式で求めることができる。

$$ 標準誤差 = \frac{\sqrt{\frac{1}{n-1}\sum^n_{i=1}(x_i-\hat{x})^2}}{\sqrt{n}} $$

区間推定#

母集団が正規分布に従うと仮定できる場合に、標本データを用いて母平均などの推定量を、ある区間で推定する。推定する区間を信頼区間と呼び、「95%信頼区間」などと呼ぶ。

...

工程能力指数

工程能力指数#

よく品質管理に工程能力指数(Cp, Cpk)をいう数値が用いられる。「Cpkが1.33以上なのでOK」とよく言われるアレです。詳細を確認しておく。

...

正規分布

定義#

正規分布(normal distribution)の確率密度関数は、

$$ f(x) = \frac{1}{\sqrt{2\pi\sigma}}\exp{\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)} $$

で表される。$\mu$は平均、$\sigma^2$は分散を表す。

平均$\mu$=0, 分散$\sigma^2=1$のとき、標準正規分布と呼ばれ、

...

統計量

平均#

平均(mean, average)は、測定した数値の合計を、その数値の個数で割ったもの。

$$ \overline{x} =\frac{x_1+x_2+\cdots+x_N}{N} =\frac{1}{N} \sum^{N}{n=1} x{n} $$

と定義される。平均値を表す記号として$\overline{x}$や$\mu$がよく使用される。

...