[scikit-learn] 5. make_gaussian_quantilesによる等方性なガウス分布データの生成

matplotlib

はじめに

sklearnのdatasets.make_gaussian_quantilesで等方性なガウス分布に従う分類用のデータを作成することができる。ここでは各種パラメータが生成するデータに及ぼす影響について説明する。

解説

モジュールのインポートなど

バージョン

n_samples

n_samplesを変化させることでサンプル数を変えることができる。

mean

分布の平均値を設定できる。(2,2)のようにタプルで指定する。Noneの場合、(0,0)となる。

cov

共分散行列はこの値に単位行列をかけたものになる。

n_features

データの列数を変えることができる。

n_classes

n_classesを変えることでクラス数を変えることができる。

random_state

random_stateを変えることで再現可能な乱数を生成することができる。

shuffle

shuffleをFalseとすることでラベルがソートされたデータを得ることができる。デフォルトはTrue.

コードをダウンロード(.pyファイル)

コードをダウンロード(.ipynbファイル)

参考

make_gaussian_quantiles
Gallery examples: Multi-class AdaBoosted Decision Trees Two-class AdaBoost

コメント