[seaborn] 5. lineplotの信頼区間つき線グラフで複数データを表示する

python

はじめに

簡単かつ簡潔にデータを可視化できるライブラリであるseabornを用いて、複数データの信頼区間つき線グラフをlineplotにより表示する方法について説明する。

コード

コードをダウンロード(.pyファイル)

コードをダウンロード(.ipynbファイル)

解説

モジュールのインポートなど

データの読み込み

3/8〜10の京都と鹿児島の気象データを下記サイトから読み込む。

気象庁|過去の気象データ検索
過去の気象データ検索

DataFrameの結合と列の追加

pd.concatでデータフレームを結合した後に、新たな列データ[‘loc’]を追加する。np.tileは同じ要素をもつ配列を作る関数であり、データフレームの長さとおなじサイズの配列を追加した。
最終的にDataFrameは下記のようになる。(上位5行のみ表示)

index現地海面降水量(mm)気温(℃)露点温度(℃)蒸気圧(hPa)湿度(%)風速風向日照時間(h)全天日射量(MJ/㎡)降雪積雪天気雲量視程(km)loc
0011010.21016.60.011.22.57.3553.2東北東NaNNaNNaNNaN20.00kyoto
1121009.61016.00.010.83.47.8604.3NaNNaNNaNNaN20.00kyoto
2231008.71015.10.010.23.78.0642.2東北東NaNNaNNaNNaN20.00kyoto
3341008.51014.90.510.14.18.2660.9北北西NaNNaNNaNNaN9.73kyoto
4451007.81014.21.09.76.19.4782.5北東NaNNaNNaNNaN13.40kyoto

鹿児島のデータも同様に処理する。

index現地海面降水量(mm)気温(℃)露点温度(℃)蒸気圧(hPa)湿度(%)風速風向日照時間(h)全天日射量(MJ/㎡)降雪積雪天気雲量視程(km)loc
0011007.81011.60.015.013.715.7925.1西北西NaNNaNNaNNaNNaNkagoshima
1121008.01011.814.312.514.5894.4西北西NaNNaNNaNNaNNaNkagoshima
2231007.81011.613.912.114.1893.6西北西NaNNaNNaN620.0kagoshima
3341007.81011.613.911.313.3843.6北西NaNNaNNaNNaNNaNkagoshima
4451008.01011.813.110.612.8853.5北西NaNNaNNaNNaNNaNkagoshima

DataFrameの合体

京都と鹿児島のデータを合体してひとつにする。

複数データの95%信頼区間つき線グラフの表示

x軸が”時”, y軸が”気温(℃)”の線グラフを作成する。hue=”loc”とすることで、京都と鹿児島それぞれで平均と信頼区間が計算され、複数の信頼区間つき線グラフとして表示される。

styleで違いを表現する

style=”loc” とすることで、線が点線と実線で表示される。

hueとstyleで違いを表現する

hueとstyleの両方に’loc’を設定するとより視認性が高まる。

マーカーを表示する

styleを設定した状態でmarkers=Trueとするとマーカーが表示される。dashes=Falseで点線が表示されなくなる。

palleteで色を変える

palleteで色を設定して適用することで色を変えることができる。

線の太さを変える

size=”loc”とすることで、データに応じて線の太さが変化する。

参考

Visualizing statistical relationships — seaborn 0.12.2 documentation

コメント