■
リファレンスタグの分布が正規分布ぽいのでパラメータを推定したい。
from scipy.stats import norm
のnorm.fitで正規分布の推定できるらしい。
pandasの.as_matrixでデータフレームからnumpyのarray型に変換できる。
rのヒストグラムに正規分布の近似曲線を重ねる
d <- read.csv("avg_position_lonlat.csv") tmp <- subset(d, d$ID == 17426) # x x <- seq(min(tmp$X), max(tmp$X), 0.1) hist(tmp$X, freq=F) curve(dnorm(x, mean=20.5266654676259, sd=0.89719845716615454), add=TRUE, col="red") # y x <- seq(min(tmp$Y), max(tmp$Y), 0.1) hist(tmp$Y, freq=F) curve(dnorm(x, mean=-32.161988489208632, sd=0.6560484386265516), add=TRUE, col="red")