Color Selector

default niceblue intenseblue otherblue blue puregreen grassgreen green olive gold orange pink fuchsia violet red

Container Selector

Article

平均値・中央値・最頻値をpythonで求める

Share on LinkedIn
Pocket

jupyter notebook,numpy,scipyが必要。

平均27000、分散15000の正規分布をランザム数値で10000用意する


import numpy as np

incomes = np.random.normal(27000, 15000, 10000)
np.mean(incomes)

26670.523667810859

ヒストグラムにプロットする


%matplotlib inline
import matplotlib.pyplot as plt
plt.hist(incomes, 50)
plt.show()

中央値を求める

np.median(incomes)

26622.149050827062

1000000000稼ぐ人を加える。

incomes = np.append(incomes, [1000000000])

最頻値は影響が特にないのに対し、平均は大きく影響してしまう。

np.median(incomes)
26624.876013322068

np.mean(incomes)
126657.85788202267
from scipy import stats
stats.mode(incomes)

ModeResult(mode=array([-30995.69146258]), count=array([1]))

Share on LinkedIn
Pocket

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Favorite Post

Recent Comments