pandasの1次元配列(Series)について
モジュールのインポート
pandasはas pdとするのが一般的。
Seriesの生成
Seriesにしたい配列をpd.Series()で囲めば、↑のような形式のSeriesとなる。
NumPy配列への変換
pandasのSeriesに.valuesとすることでnp.arrayに変換することができる。
インデクスの参照
data.indexとすることで、インデクスに関する情報を得ることができる。
要素の参照
pythonで同じみの[]表記で要素を選択できる。
[0]で0番目の要素、[1:]で1番目から最後までの要素を参照できる。
インデクスに文字列
index=[‘A’,’B’,’C’,’D’]のようにすることで、インデクスを文字列にすることができる。
[]内にインデクス名を入れることで要素を参照できる。
順不同な数字によるインデクス
インデクスは自由度が高く、順不同な数字でも作成できる。
DATA[3]とすると、インデクスが3の部分の要素が参照される。3番目の要素ではないことに注意が必要。
辞書からSeriesの作成
辞書形式のデータをSeriesとして読み込むと、キーがインデクスとなり、値が要素となったSeriesが得られる。
辞書のようにして、要素にアクセスできる。さらにSeries形式なので、スライス表記でも要素を参照できる。
Seriesオブジェクトの作成
Seriesの作成方法について紹介する。
pd.Series()でリストを囲むことで作成できる。
要素が一個でインデクスが複数ある場合は、すべての要素が等しいSeriesが得られる。
インデクスを指定すると、それが優先され、インデクスにない要素は無視される。
ここでは、index=[3, 2]としているので、インデクスの1は反映されていない。
参考
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
コメント