データの可視化
散布図#
データの分布や相関関係を表示する。
pythonでは下記ようにプロットする。
|
|
更新日: 2021-02-22
データの分布や相関関係を表示する。
pythonでは下記ようにプロットする。
|
|
母集団の特性値を標本のデータから推測すること。点推定と区間推定がある。
標準誤差は下記の式で求めることができる。
$$ 標準誤差 = \frac{\sqrt{\frac{1}{n-1}\sum^n_{i=1}(x_i-\hat{x})^2}}{\sqrt{n}} $$
母集団が正規分布に従うと仮定できる場合に、標本データを用いて母平均などの推定量を、ある区間で推定する。推定する区間を信頼区間と呼び、「95%信頼区間」などと呼ぶ。
...よく品質管理に工程能力指数(Cp, Cpk)をいう数値が用いられる。「Cpkが1.33以上なのでOK」とよく言われるアレです。詳細を確認しておく。
...正規分布(normal distribution)の確率密度関数は、
$$ f(x) = \frac{1}{\sqrt{2\pi\sigma}}\exp{\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)} $$
で表される。$\mu$は平均、$\sigma^2$は分散を表す。
平均$\mu$=0, 分散$\sigma^2=1$のとき、標準正規分布と呼ばれ、
...平均(mean, average)は、測定した数値の合計を、その数値の個数で割ったもの。
$$ \overline{x} =\frac{x_1+x_2+\cdots+x_N}{N} =\frac{1}{N} \sum^{N}{n=1} x{n} $$
と定義される。平均値を表す記号として$\overline{x}$や$\mu$がよく使用される。
...