はじめに
マルチインデックス(階層型インデックス)は、Pandasにおいて複数レベルのインデックスを持つデータ構造を実現する機能です。これにより、多次元データをより直感的に扱うことが可能になります。
解説
モジュールのインポート
indexとcolumnsをリストで指定
インデクスを2次元の配列とすれば、マルチインデクスをもつDataFrameを作成できます。
マルチインデックスのレベル名はdf.index.names
で設定できます。
MultiIndexオブジェクトの作成
2次元配列からの作成
マルチインデックスのみを作成したい場合は、pd.MultiIndex.from_arrays()に2次元の配列を渡すだけで簡単に作成できます。
tuplesから作成
タプルからマルチインデックスを作成するには、pd.MultiIndex.from_tuples()関数にタプルのリストを渡すだけでよいです。
リストから作成したマルチインデックスとタプルから作成したマルチインデックスは同等であることがわかります。
多層構造をもつインデクスとカラムによるデータフレーム
データを生成し、index=indexとcolumns=columnsを指定することで、階層構造を持つインデックスとカラムを設定したデータフレームを作成しました。
カラム名がdata1、階層インデックスの第一レベルがB、第二レベルが(b,1)である要素を参照するには、df[‘data1’][‘B’][‘b’,1]のように指定します。
参考
pandas.MultiIndex.from_arrays — pandas 2.3.2 documentation
pandas.MultiIndex.from_tuples — pandas 2.3.2 documentation
コメント