[pandasの使い方] 2.pandasのDataframe

Pandas
スポンサーリンク

pandasの2次元配列(Dataframe)について

Dataframeの作成

Seriesは1次元の配列で、複数のSeriesが繋がったものをDataframeと呼ぶ。
上記のように2つのSeriesを作成して、Dataframeにカラム名を指定して入れることでDataframeが作成できる。

インデクスラベルと列ラベル

.indexでインデクスを取得でき、.columnsで列ラベルを取得できる。

辞書としてのDataframe

辞書ではキーが値にマップされるが、Dataframeでは、列名で一連の列データを参照できる。例えば’area’をみたい場合、states[‘area’]とすれば、areaのSeriesが得られる。

Dataframeの作成

Seriesから作成

Seriesにカラム名をつけることで、Dataframeにすることができる。

辞書から作成

辞書データをそのままDataframeにすることができる。

辞書の中に値がない場合はNaNで穴埋めされる。

np.arrayから作成

2次元のnp.arrayでカラム名とインデクスを指定すれば、Dataframeとなる。
インデクスとカラム名を指定しなかった場合は、それぞれ整数のインデクスとカラム名となる。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント