[pandasの使い方] 21. DataFrameにおけるGroupBy

Pandas
スポンサーリンク

pandasのDataFrameにおけるGroupByの使い方

DataFrameにおけるGruopBy

pandasのGruopByでは、DataFrameをあるキーで分割し、分割したグループにある演算をし、その結果を結合する、一連の操作ができる。

データの生成

groupbyによる平均値

df.groupby(‘key’).mean()により、’key’の同じものを分割して、その分割したものに対して平均値を計算している。

複数列をもつデータの生成

groupbyによる中央値

df2.groupby(‘key’).median()で、各列に対して、groupby(‘key’).median()の操作が行われ、data1, data2の同じkeyをもつ要素の中央値が得られる。

groupbyでスライス

[‘data2’]のように列名でスライスすると、その列の部分だけの結果が返ってくる。

groupbyでSeriesを返す

groupbyによる演算結果に、.unstack()とすることで、結果をSeriesとして得ることができる。

複数列ををもつDataFrameで.unstack()しない場合は、DataFrameが横に繋がった結果が返ってくる。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント