はじめに
sklearnのdatasets.make_circles
で円状に分布したクラスタリング、分類用のデータを作成することができる。ここでは各種パラメータが生成データに及ぼす影響について説明する。
解説
モジュールのインポートなど
バージョン
n_samples
n_samplesを変化させることでサンプル数を変えることができる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/n_samples-3.png)
noise
noiseでばらつきを付与できる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/noise-1.png)
random_state
random_stateを変えることで再現可能な乱数を生成することができる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/random_state-3.png)
factor
factorを変えることで外円と内円の距離を変えることができる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/factor-1.png)
shuffle
shuffleをFalseとすることでラベルがソートされたデータを得ることができる。デフォルトはTrue.
コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)参考
![](https://scikit-learn/stable/_images/sphx_glr_plot_classifier_comparison_thumb.png)
make_circles
Gallery examples: Classifier comparison Comparing different clustering algorithms on toy datasets Comparing different hi...
コメント