階層的クラスタリング
階層的クラスタリングはデータの中から最も似ている組み合わせを選択しながら分類する方法です。順番に分類することから階層構造となります。
1,2,3,4,5のデータがある場合、
まず、1と2をクラスタリングします。
次に3と4をクラスタリングします。
次に(1,2)と(3,4)をクラスタリングします。
最後に(1,2,3,4)と5をクラスタリングします。
最終的にすべてのデータをまとめます。
データをクラスタリングした順番を示した図を樹形図(デンドログラム)といいます。
非階層的クラスタリング
非階層的クラスタリングの分類の仕方は階層クラスタリングと同様ですが、階層構造を持ちません。事前に作成するクラスターの数を決定します。最適なクラスターの数は決まっていません。計算量が少ないため、データ量が多い場合に有効となります。
非階層的クラスタリングの代表的な手法のK-means法については後ほど詳しく述べます。