[pandasの使い方] 5. Dataframeにおけるデータの選択(loc, iloc)

Pandas
スポンサーリンク

loc, ilocを用いたDataframeにおけるデータの選択

pandasのDataframeで要素にアクセスするには?

pandasのDataframeの要素へのアクセス方法は、np.arrayとは異なる点があるため注意が必要。

データの生成(辞書データ→Series→Dataframe)

辞書からSeriesを作成して、SeriesからDataframeを作成。

カラム名による参照

data[‘###’]の###にカラム名を入れれば、そのカラム名の列が参照できる。

data.###の###にカラム名をいれても、そのカラム名の列が参照できる。

データの追加

data[‘###’]= data.popu/data.areaとすれば新しいカラム名’###’の列が作成される。ここでは、人口/面積の人口密度を要素として追加している。

np.arrayへの変換

data.valuesにより、Dataframeはnp.arrayとなる。カラム名やインデクスなどの情報がなくなる。

Dataframeの転置

np.arrayと同様にdata.TでDataframeの転置ができる。

iloc、locの使い方

ilocを使用した場合

ilocを使用することで間接的なインデクスで要素にアクセスできる。

locを使用した場合

locにより明示的なインデクスにより、要素にアクセスできる。

ixを使用した場合

ixはloc,ilocの両方を使ってDataframeをスライスできる。逆にいうと、.locか.ilocのどちらが使われているか分からないので、混乱の原因となる。そのため、廃止の予定らしく、↑のようなDeprecationWarningがでる。

ilocによるデータの変更

data.iloc[1,1]はOsakaのareaなので、1899から1900へと変化している。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント