はじめに
seabornは簡単かつ簡潔にデータを可視化できるライブラリである。ここではlineplotにより時系列データの信頼区間つき線グラフを表示する方法について説明する。
コード
コードをダウンロード(.pyファイル)
コードをダウンロード(.ipynbファイル)
解説
モジュールのインポートなど
seabornはsnsとしてインポートするのが一般的となっている。
sns.set(style=”darkgrid”)で見た目の設定を変えている。
sns.set_context(‘talk’)で文字サイズを大きくした。
データの読み込み
データは下記サイトから3/8〜10の京都の気象データを取得した。
気象庁|過去の気象データ検索
過去の気象データ検索
3つのDataFrameをconcatで結合し、reset_indexでインデックスを振り直したDataFrameの最初の五行は以下のようになる。
index | 時 | 現地 | 海面 | 降水量(mm) | 気温(℃) | 露点温度(℃) | 蒸気圧(hPa) | 湿度(%) | 風速 | 風向 | 日照時間(h) | 全天日射量(MJ/㎡) | 降雪 | 積雪 | 天気 | 雲量 | 視程(km) | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 0 | 1 | 1010.2 | 1016.6 | 0.0 | 11.2 | 2.5 | 7.3 | 55 | 3.2 | 東北東 | NaN | NaN | — | — | NaN | NaN | 20.00 |
1 | 1 | 2 | 1009.6 | 1016.0 | 0.0 | 10.8 | 3.4 | 7.8 | 60 | 4.3 | 東 | NaN | NaN | — | — | NaN | NaN | 20.00 |
2 | 2 | 3 | 1008.7 | 1015.1 | 0.0 | 10.2 | 3.7 | 8.0 | 64 | 2.2 | 東北東 | NaN | NaN | — | — | NaN | NaN | 20.00 |
3 | 3 | 4 | 1008.5 | 1014.9 | 0.5 | 10.1 | 4.1 | 8.2 | 66 | 0.9 | 北北西 | NaN | NaN | — | — | NaN | NaN | 9.73 |
4 | 4 | 5 | 1007.8 | 1014.2 | 1.0 | 9.7 | 6.1 | 9.4 | 78 | 2.5 | 北東 | NaN | NaN | — | — | NaN | NaN | 13.40 |
95%信頼区間つき線グラフの表示
x軸が”時”, y軸が”気温(℃)”の線グラフを作成する。とくに何も設定しなくても、値が複数ある場合は、信頼区間つき線グラフとなると考えられる。
信頼区間を非表示にする
ci=Noneとすることで信頼区間が表示されずに、平均値のデータで構成された線グラフのみが表示される。
標準偏差を表示する
標準偏差を表示する場合にはci=’sd’とする。
参考
Visualizing statistical relationships — seaborn 0.13.2 documentation
コメント