はじめに
matplotlibのboxplotでは箱ひげ図を作成することができる。ヒストグラムは1種のデータの分布を調べるのに有用ではあるが、複数種のデータを比較するのには向いていない。一方、箱ひげ図は、コンパクトであるため複数種のデータを比較するのに向いている。ここでは、matplotlibの箱ひげ図であるboxplotの詳細な設定方法について説明する。
コード&解説
基本的な箱ひげ図
data:image/s3,"s3://crabby-images/5406e/5406ebed34d0ac0ba5db91be84b843c24e600876" alt=""
データの生成
np.random.randint(1,100,50)
で1から99のいずれかを要素としてもつ、要素数50個の配列を作成する。np.ones(25) * 50
で50を要素として持つ25個の配列を作成する。
同様に、flier_highは101〜199、flier_lowは-99〜-1を要素として持つ配列となる。np.concatenate
により、これらの配列を結合し、ひとつにする。
箱ひげ図の表示
ax1.boxplot(data)
で箱ひげ図を表示できる。
boxの中央値部分に切り込みを入れる
data:image/s3,"s3://crabby-images/abe73/abe735d6c70e19f31f9780ecf4b8886fff055262" alt=""
notch=True
で箱に中央値部分に切り込みを入れることができる。
外れ値のマーカーの設定
data:image/s3,"s3://crabby-images/c8070/c8070531a41c564f0503b123cc2e197116cb31c1" alt=""
辞書形式でflierprops
を設定することで外れ値の見た目の調整ができる。
外れ値を非表示にする
showfliersによる設定
data:image/s3,"s3://crabby-images/0ed59/0ed595c3f147de5abe9b4876f2a641319bf3a11e" alt=""
showfliers=False
で外れ値を非表示にできる。
symによる設定
data:image/s3,"s3://crabby-images/2fed9/2fed9a424ee9dddc005e5899308eeb3d7eca02b2" alt=""
sym=""
でも外れ値を非表示にできる。
boxを横にする
data:image/s3,"s3://crabby-images/46ae6/46ae6d074b20c8804ae9f5d4579c8e95ae1f6d21" alt=""
vert=False
で箱を横向きにすることができる。
ひげの調整
ひげを短くする
data:image/s3,"s3://crabby-images/590f4/590f4d3eccd69e99b22680265172e113b655f04a" alt=""
whis=1
で箱1個分離れた値までひげが伸びる。デフォルトは1.5なので、ひげが短くなる。
ひげを長くする
data:image/s3,"s3://crabby-images/2bb0c/2bb0c2187741c704533e5e768e3edc23be6f2df6" alt=""
whis=2
で箱2個分離れた値までひげが伸びるので、ひげが伸びる。
ひげをパーセンタイルで指定
data:image/s3,"s3://crabby-images/de5e5/de5e511f15ae19cf7a33ef0c7a85f558467db967" alt=""
whis=[5,95]
のようにすることでひげの長さをパーセンタイルで指定することができる。
複数のboxplotを表示
data:image/s3,"s3://crabby-images/d6df6/d6df6651a35b11e220fd0d0d7f98739e93585425" alt=""
data_ = [data,data2, data3]
のようにboxplotしたいデータをリストにして渡すことで複数のboxplotを表示できる。
boxplotの表示位置を変える
data:image/s3,"s3://crabby-images/7e02c/7e02c8f72b948277cdb3e85cd739b84436462df7" alt=""
positions=[1,3,9]
のようにすることでboxplotを表示する位置を変えられる。
boxの幅を変える
data:image/s3,"s3://crabby-images/27466/274667ce9d64423058a537e854f7674d92934c08" alt=""
widths=[.1,.3,.9]
のようにすることで各boxの幅を変えられる。
算術平均を表示
data:image/s3,"s3://crabby-images/6902b/6902b7a2c7cbfbee6c518194806a1fa139eba679" alt=""
showmeans=True
で算術平均を表示できる。
中央値の線の設定
data:image/s3,"s3://crabby-images/edc13/edc138c4ee9146c6a1be019abf2fbb9fe92b9e63" alt=""
medianprops=medi_style
で辞書形式のmedi_styleを指定することで中央値の線の見た目を変えられる。
参考
data:image/s3,"s3://crabby-images/5975d/5975d72be6c1a76243e5f9445408c4a4fb2b07c6" alt=""
コメント