[scikit-learn] 3. make_circlesによる円状データの生成

matplotlib

はじめに

scikit-learnのmake_circles関数を使用して円状に分布したデータを生成する方法とそのパラメータが出力に与える影響について解説します。機械学習のクラスタリングや分類問題のテストデータとして活用できます。

解説

モジュールのインポートなど

バージョン

n_samples

n_samplesを変化させることでサンプル数を変えることができます。

noise

noiseでばらつきを付与できます。

random_state

random_stateを変えることで再現可能な乱数を生成することができます。

factor

factorを変えることで外円と内円の距離を変えることができます。

shuffle

shuffleパラメータをFalseに設定すると、ラベルがソートされた状態のデータを取得できます。デフォルト値はTrueです。

コードをダウンロード(.pyファイル)

コードをダウンロード(.ipynbファイル)

まとめ

make_circles関数は、機械学習アルゴリズムのテストや評価に便利な円状データを簡単に生成できるツールです。noise、factor、random_stateなどのパラメータを調整することで、さまざまな分布パターンを作成でき、クラスタリングや分類アルゴリズムの性能評価に役立ちます。

参考

make_circles
Gallery examples: Classifier comparison Comparing different clustering algorithms on toy datasets Comparing different hi...

コメント