Color Selector

default niceblue intenseblue otherblue blue puregreen grassgreen green olive gold orange pink fuchsia violet red

Container Selector

Category: 統計学

平均値・中央値・最頻値をpythonで求める

No image
jupyter notebook,numpy,scipyが必要。 平均27000、分散15000の正規分布をランザム数値で10000用意する import numpy as np incomes = np.random.normal(27000, 15000, 10000) np.mean(incomes) 26670.523667810859 ヒストグラムにプロットする %matplotlib inline import matplotlib.pyplot as plt plt.hist(incomes, 50) plt.show() 中央値を求める np.median(incomes) 26622.149050827062 1000000000稼ぐ人を加える。 incomes = np.append(incomes, ) 最頻値は影響が特にないのに対し、平均は大きく影響してしまう。 np.median(incomes) 26624.876013322068 np.mean(incomes) 126657.85788202267 from scipy impo

ディズニーランドと統計学

ファストパスが導入されてからまだ一度もディズニーランドに行った事がないkote2です。 先日面白い本を見つけた。 誰もが一度は行ったことのある夢の国、ディズニーランド。知り合いにディズニー関係者がいるだけでディズニーマニアから「効率のよいまわり方」を聞かれまくるなど。そういうkote2も昔知り合いにディズニーのバイトしているディズニーマニアがいました。まさに潜入ですよね。 それはそうと ディズニーランドで導入されたファストパス。あれはあるデータアナリストの魔法によって生み出されたものだといいます。 統計学的に言うと、アトラクションに行列ができてしまうのは平均値ではなく「ばらつき」だと。 要するに、ファストパスが導入される以前のディズニーランドでは、一つのアトラクションに乗ろうにも、1,2時間は平気で待たされました。しかし、ディズニーの収容上における設計はこの待ち時間を発生させないように設計されているとのこと。にも関わらず行列ができてしまうのは、その人達が集まる平均値が想定外だから、と言うことではなく、混んでるから先にあそこに行こう、とか予測を立てて行動するいわゆる例外な人たち、「ばらつ

「おいしい」を統計学的に表現するとどうなるのか考えてみた

「おいしい」を統計学的に表現するとどうなるのか考えてみた。 まず「おいしい」という判断は、非常に曖昧なので仮説として10人に食べてもらって10人が「おいしい」と感じたら「おいしい」と評価する。 しかしながらこの仮説には問題がある。人によって「おいしい」はバラつきがあるからだ。 もう少し話を具体的にしよう。 お肉はどのくらい焼けばおいしいのか。いや、「おいしい」をどのように数値化して、どのような値が10人食べて10人が「おいしい」というのか。「おいしい」「うまい」「最高」「やべぇ」など褒めてると思わしき言葉は同意語とする。 まず肉の分類だ。肉には国産、外国産、また種類を挙げればきりがない。種類が同じでも成長過程や出荷年月、いわゆる生まれて育っていつ屠殺するかによって変わってくる。条件が必要だ。 調理法はどうだろう。おいしいとされているのは炭火焼き?ただフライパンで焼いてもおいしい肉はないとは言い切れない。蒸しても煮ても揚げても、生のまま食べても良い。ということは調理法という条件も加えなければならない。 次に、例えば炭火で焼くとする。味は塩コショウのみ。焼き肉のタレなどつけてしまえば「この

jupyterを使ってみた

ひょんな事をいろいろ調べていたところjupyterというツールを見つけたのでご紹介。 jupyter jupyterはひとことで言うと、様々なプログラミング言語の対話形式実行環境をブラウザで実現できるツールです。昔はIPythonという名前でPython独自のアプリケーションだったらしいのですが、現在はrubyやphp、C#、JSなどいろいろ対応しているようです。いまんとこPythonしか確認してないですけど! Pythonに関してですが、pandasというデータ解析を支援するライブラリとの連携がとても良い感じです。pandasで解析したデータをブラウザで確認しながらプロットできたり、また、メモ帳アプリとしての機能も充実しててMarkdown形式での記述や共有機能に優れています。 インストール jupyterのインストール方法ですが、以下URLをご参照ください。 http://jupyter.readthedocs.io/en/latest/install.html 使ってみる jupyterをインストールして、任意のディレクトリに移り以下コマンドを実行します。 jupyter not

マンガでもわからない統計学

何回か読みなおしては少しずつ学んでいる統計学。先日入門書見てもさっぱりんちょだったのでマンガでわかる統計学を買って読んでみた。 なるほどわからん。 マンガと言えども数式と専門用語が一杯で萎えてきた。とりあえず、ここまでは分かったのでメモする。ブログにアウトプットすれば少し理解が深まるだろう(←追記:記事書き終わってちょっと深まった) 統計学ってなんなんよ? 基本的な事を理解すれば、マーケティングデータ分析、金融商品のリスクとリターン、株のボラティリティ、など、いろいろ使い道があるっている学問です。 身近な所だと先日あった選挙。選挙速報ってあるじゃないですか?開票率1%でも当選確実って出せるのは統計学による推測統計というもの。これは比較的新しいやり方で、その前は記述統計と呼ばれるものが主流だったそうです。棒グラフ(ヒストグラム)からある特徴を導き出すとかですね。記述統計も推測統計も一部の事実から全体を把握するというのがその目的で、記述統計に対し、推測統計は確率理論がミックスされた、未来を読み取る方法と言うことで注目されています。 沢山のデータからある特徴を導き出す 世の中いろいろなデータ

Favorite Post

Recent Comments