[scikit-learn] 4. make_moonsによる三日月状データの生成

matplotlib

はじめに

sklearnのdatasets.make_moonsで三日月状の分布を示すクラスタリング、分類用のデータを作成することができる。ここでは各種パラメータが生成データに及ぼす影響について説明する。

解説

モジュールのインポートなど

バージョン

n_samples

n_samplesを変化させることでサンプル数を変えることができる。

noise

noiseでばらつきを付与できる。

random_state

random_stateを変えることで再現可能な乱数を生成することができる。

shuffle

shuffleをFalseとすることでラベルがソートされたデータを得ることができる。デフォルトはTrue.

コードをダウンロード(.pyファイル)

コードをダウンロード(.ipynbファイル)

参考

make_moons
Gallery examples: Classifier comparison Comparing different clustering algorithms on toy datasets Comparing different hi...

コメント