[pandasの使い方] 11. マルチインデクスの作成

Pandas
スポンサーリンク
スポンサーリンク

Series, DataFrameにおける階層型構造をもつインデクスの作成についての解説

マルチインデクスを作成するには?

pandasでは階層型構造をもつインデクス(=マルチインデクス)を用いると、データの操作性や視認性が向上する。ここでは、そのマルチインデクスの作成方法について解説する。

indexとcolumnsをリストで指定

インデクスを2次元の配列とすれば、マルチインデクスをもつDataFrameが作成できる。

MultiIndexオブジェクトの作成

2次元配列からの作成

マルチインデクスのみを作成したい場合は、pd.MultiIndex.from_arrays()の中に2次元の配列を入れれば良い。

levels, labelsを直接入力して作成

pd.MultiIndex()で、levelsとlabelsを直接指定することでも作成できる。

tuplesから作成

タプルからマルチインデクスを作成するには、pd.MultiIndex.from_tuples()の中にtuplesを入れれば良い。

マルチインデクスをもつDataFrameの作成

データは、[pandasの使い方] 10. 階層型インデクスと同様に、チョコレートとビスケットの年間総生産量(トン)を用いた。tuplesからマルチインデクスを作成し、indexとした。
DataFrame作成時に、 index=indexとすることでマルチインデクスを適用している。

インデクスのレベル名の設定

df.index.names にちょうどサイズの合う配列を指定すれば、データフレームのインデクスの上に名前がつく。

多層構造をもつインデクスとカラムによるデータフレーム

多層構造をもつデータフレームの例として、サボテンの2年毎の成長データを示す。残念ながらデータは適当となっている。
indexには、年とサンプルナンバーを設定して、columnsには、サボテン名と大きさとしている。

適当なデータを作成して、index=index, columns=columnsとすることで、多層構造をもつインデクスとカラムを設定したデータフレームを作成した。

cactus_data[‘Ryujinboku’]のようにすれば、Ryujinboku(竜神木)に関するデータのみが得られる。

スポンサーリンク

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

スポンサーリンク
Pandaspython
スポンサーリンク
この記事をシェアする
sabopy.comをフォローする
スポンサーリンク
サボテンパイソン

コメント