[pandasの使い方] 26. pandasにおける時系列データ型

Pandas
スポンサーリンク

pandasにおける時系列データの型について

DataFrameの時系列データ型を理解する

pandasは、日付、時刻を扱う有用な機能を備えている。pandasの時系列データ型は、timestamp(時刻), period(間隔), time delta(時間差)の3種類がある。

ここでは、3つの時系列データ型について説明する。

pd.to_datetime()について

pd.to_datetime()はいろいろな日付の表記方法を受け入れてくれる。

.to_period(‘D’)とすることで、日に対して周期性をもつ、PeriodIndexが生成する。

.to_period(‘H’)とすれば、時間に対して周期性をもつ、PeriodIndexが生成する。

DatetimeIndexに対して、DatetimeIndexを引く、足すなどをすることによって、TimedeltaIndexが生成する。

date_range()による規則的な時間インデクスの作成

pd.date_range(‘2019-02-01’, ‘2019-02-05’)で、’2019-02-01’〜’2019-02-05’の一日刻みのデータが生成する。

開始時間と繰り返し回数を指定することでも作成できる。

freqを指定することで、どの単位で繰り返しを行うかを設定できる。 freq=’H’で時間ごとの繰り返しとなる。

period_range()による規則的な時間インデクスの作成

period_rangeでは、dtype=’period’のPeriodIndexを生成することができる。

timedelta_range()による規則的な時間インデクスの作成

timedelta_rangeでは、dtype=’timedelta64’のTimedeltaIndexを生成することができる。

頻度の種類について

日次
週次
月末
4半期末
年末
毎時
毎秒
毎ミリ秒
毎マイクロ秒
毎ナノ秒
毎日(土日除く)
月の最終(土日除く)
4半期の最終(土日除く)
年末(土日除く)
毎時(17時から8時除く)
毎月はじめ
毎月はじめ(土日除く)
4半期のはじめ
4半期のはじめ(土日除く)
毎年始
毎年始(土日除く)
1月の末を年ごとに

freqに、3桁の月コードを追加することで、開始月を変更できる。

水曜日を週ごとに

freqに3桁の曜日コードの追加で、開始週を変更できる。

任意の頻度を設定

freq=”4H45T”のように、任意の周期性をもつ、TimedeltaIndexを生成することができる。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント