[pandas] 10. マルチインデックスの作成について

Pandas

はじめに

マルチインデックス(階層型インデックス)は、Pandasにおいて複数レベルのインデックスを持つデータ構造を実現する機能です。これにより、多次元データをより直感的に扱うことが可能になります。

解説

モジュールのインポート

indexとcolumnsをリストで指定

インデクスを2次元の配列とすれば、マルチインデクスをもつDataFrameを作成できます。

マルチインデックスのレベル名はdf.index.namesで設定できます。

MultiIndexオブジェクトの作成

2次元配列からの作成

マルチインデックスのみを作成したい場合は、pd.MultiIndex.from_arrays()に2次元の配列を渡すだけで簡単に作成できます。

tuplesから作成

タプルからマルチインデックスを作成するには、pd.MultiIndex.from_tuples()関数にタプルのリストを渡すだけでよいです。

リストから作成したマルチインデックスとタプルから作成したマルチインデックスは同等であることがわかります。

多層構造をもつインデクスとカラムによるデータフレーム

データを生成し、index=indexとcolumns=columnsを指定することで、階層構造を持つインデックスとカラムを設定したデータフレームを作成しました。

カラム名がdata1、階層インデックスの第一レベルがB、第二レベルが(b,1)である要素を参照するには、df[‘data1’][‘B’][‘b’,1]のように指定します。

参考

pandas.MultiIndex.from_arrays — pandas 2.3.2 documentation
pandas.MultiIndex.from_tuples — pandas 2.3.2 documentation
コードをダウンロード(.pyファイル)

コードをダウンロード(.ipynbファイル)

コメント