はじめに
sklearnのdatasets.make_gaussian_quantiles
で等方性なガウス分布に従う分類用のデータを作成することができる。ここでは各種パラメータが生成するデータに及ぼす影響について説明する。
解説
モジュールのインポートなど
バージョン
n_samples
n_samplesを変化させることでサンプル数を変えることができる。

mean
分布の平均値を設定できる。(2,2)のようにタプルで指定する。Noneの場合、(0,0)となる。

cov
共分散行列はこの値に単位行列をかけたものになる。

n_features
データの列数を変えることができる。
n_classes
n_classesを変えることでクラス数を変えることができる。

random_state
random_stateを変えることで再現可能な乱数を生成することができる。

shuffle
shuffleをFalseとすることでラベルがソートされたデータを得ることができる。デフォルトはTrue.
コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)参考

make_gaussian_quantiles
Gallery examples: Multi-class AdaBoosted Decision Trees Two-class AdaBoost
コメント