Color Selector

default niceblue intenseblue otherblue blue puregreen grassgreen green olive gold orange pink fuchsia violet red

Container Selector

Article

平均値・中央値・最頻値をpythonで求める

LinkedIn にシェア
[`evernote` not found]
Pocket

jupyter notebook,numpy,scipyが必要。

平均27000、分散15000の正規分布をランザム数値で10000用意する


import numpy as np

incomes = np.random.normal(27000, 15000, 10000)
np.mean(incomes)

26670.523667810859

ヒストグラムにプロットする


%matplotlib inline
import matplotlib.pyplot as plt
plt.hist(incomes, 50)
plt.show()

中央値を求める

np.median(incomes)

26622.149050827062

1000000000稼ぐ人を加える。

incomes = np.append(incomes, [1000000000])

最頻値は影響が特にないのに対し、平均は大きく影響してしまう。

np.median(incomes)
26624.876013322068

np.mean(incomes)
126657.85788202267
from scipy import stats
stats.mode(incomes)

ModeResult(mode=array([-30995.69146258]), count=array([1]))

LinkedIn にシェア
[`evernote` not found]
Pocket

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Favorite Post

Recent Comments