[pandasの使い方] 25. pandasにおける時系列データの操作

Pandas
スポンサーリンク

pandasにおける時系列データの操作について

DataFrameで時系列データを操作する

pandasは、日付、時刻を扱う有用な機能を備えている。ここでは、時系列データの操作方法について説明する。

pythonの組み込みモジュール datetime

datetime型による日付オブジェクトの作成は上記のようにする。

dateutilモジュールを用いることでも日付データを作成できる。

date.strftime(‘%A’)でdateが何曜日なのかがわかる。%A は曜日を表示するための書式化コードである。

numpyのdatetime型(datetime64)

このnumpyのdatetime64型を使うことで、ベクトル化された操作ができるようになる。

date + np.arange(10)で一日ずつ増えていく日付の配列が生成する。

時間の単位(日、時間、秒)などは入力に応じて変化し、明示的に指定することもできる。

時間
ミリ秒

.str.upper()ですべて大文字にすることができる。

pandasにおけるdatetime

pandasのdatetimeオブジェクトは、pd.to_datetime(“4th of Feb, 2019”)のようにすることで、作成できる。
生成するデータ型はTimestampとなる。このTimestampは、曜日を調べる(.strftime(‘%A’))が実行できる。

また、np.arrayのtimedate64とおなじようにベクトル化された操作ができる。

dateに+pd.to_timedelta(np.arange(10), ‘H’)のようにすることで、時間単位で順次増加する配列が得られる。

日付をインデクスとして用いる

pd.DatetimeIndexに日付のリストを渡すことで日付インデクスが生成する。

日付インデクスによるスライスも可能。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント