[seaborn] 7. relplotのcol, rowを使って多変数なグラフを表示する

python

はじめに

簡単かつ簡潔にデータを可視化できるライブラリであるseabornのrelplotでcolとrowを使って多変数な散布図を表示する方法について説明する。

コード

解説

モジュールのインポートなど

データの読み込み

データは下記サイトから2019シーズンのJ1の結果を取得した。

リーグサマリー:2019 J1 順位表 | データによってサッカーはもっと輝く | Football LAB
フットボールラボ(Football LAB)はサッカーをデータで分析し、新しいサッカーの観戦方法を伝えるサッカー情報サイトです。選手のプレーを評価するチャンスビルディングポイントやプレースタイル指標、チームの戦術を評価するチームスタイル指標といった独自のデータを開発しています。データを活用してサッカーに新しい視点を提供...

新たな列データをDataFrameへ追加

得失のデータを使って得失点差がプラスなチームとマイナスなチームに分ける。プラスのチームには”得失+”をいれ、マイナスのチームには”得失ー”を入れる。

DataFrameは以下のようになる。

順位Unnamed: 1Unnamed: 2勝点試合数得点失点得失平均得点平均失点得失点
01NaN横浜F・マリノス横浜FM703422486838302.01.1得失+
12NaNFC東京FC東京643419784629171.40.9得失+
23NaN鹿島アントラーズ鹿島633418975430241.60.9得失+
34NaN川崎フロンターレ川崎F6034161265734231.71.0得失+
45NaNセレッソ大阪C大阪5934185113925141.10.7得失+
56NaNサンフレッチェ広島広島5534151094529161.30.9得失+
67NaNガンバ大阪G大阪4734121111544861.61.4得失+
78NaNヴィッセル神戸神戸473414515615921.81.7得失+
89NaN大分トリニータ大分4734121111353501.01.0得失ー
910NaN北海道コンサドーレ札幌札幌463413714544951.61.4得失+
1011NaNベガルタ仙台仙台4134125173845-71.11.3得失ー
1112NaN清水エスパルス清水3934116174569-241.32.0得失ー
1213NaN名古屋グランパス名古屋3734910154550-51.31.5得失ー
1314NaN浦和レッズ浦和3734910153450-161.01.5得失ー
1415NaNサガン鳥栖鳥栖3634106183253-210.91.6得失ー
1516NaN湘南ベルマーレ湘南3634106184063-231.21.9得失ー
1617NaN松本山雅FC松本3134613152140-190.61.2得失ー
1718NaNジュビロ磐田磐田313487192951-220.91.5得失ー

多変数グラフの表示 (1 x 2)

sns.relplotでx=”勝”, y=”敗”, hue=”分”,col=”得失点”, data=df_j1とすることで,DataFrame(df)の勝をx軸、敗をy軸とした図で引き分けの値に応じて色を変えた散布図を表示する。左の図には得失点差がプラスのチームのデータが表示され、右のグラフには得失点差がマイナスのチームのデータが表示される。

新たな列データをDataFrameに追加

新たな列 ランクを作成し、順位が8位以上のチームを上位、それ以下を下位としたデータをデータフレームに追加する。最終的なデータフレームは以下のようになる。

順位Unnamed: 1Unnamed: 2勝点試合数得点失点得失平均得点平均失点得失点ランク
01NaN横浜F・マリノス横浜FM703422486838302.01.1得失+上位
12NaNFC東京FC東京643419784629171.40.9得失+上位
23NaN鹿島アントラーズ鹿島633418975430241.60.9得失+上位
34NaN川崎フロンターレ川崎F6034161265734231.71.0得失+上位
45NaNセレッソ大阪C大阪5934185113925141.10.7得失+上位
56NaNサンフレッチェ広島広島5534151094529161.30.9得失+上位
67NaNガンバ大阪G大阪4734121111544861.61.4得失+上位
78NaNヴィッセル神戸神戸473414515615921.81.7得失+上位
89NaN大分トリニータ大分4734121111353501.01.0得失ー下位
910NaN北海道コンサドーレ札幌札幌463413714544951.61.4得失+下位
1011NaNベガルタ仙台仙台4134125173845-71.11.3得失ー下位
1112NaN清水エスパルス清水3934116174569-241.32.0得失ー下位
1213NaN名古屋グランパス名古屋3734910154550-51.31.5得失ー下位
1314NaN浦和レッズ浦和3734910153450-161.01.5得失ー下位
1415NaNサガン鳥栖鳥栖3634106183253-210.91.6得失ー下位
1516NaN湘南ベルマーレ湘南3634106184063-231.21.9得失ー下位
1617NaN松本山雅FC松本3134613152140-190.61.2得失ー下位
1718NaNジュビロ磐田磐田313487192951-220.91.5得失ー下位

多変数データの表示(2 x 2)

先ほどと同様に、DataFrame(df)の勝をx軸、敗をy軸とした図で引き分けの値に応じて色を変えた散布図を表示する。
左上がランク上位で得失点差がプラスのチーム、
右上がランク上位で得失点差がマイナスのチーム、
左下がランク下位で得失点差がプラスのチーム、
右下がランク下位で得失点差がマイナスのチームとなる。

この結果から、得失点差がプラスなのにランクが下位であるチームがいることがわかる。

コードをダウンロード(.pyファイル)

コードをダウンロード(.ipynbファイル)

参考

Visualizing statistical relationships — seaborn 0.13.0 documentation

コメント