116_決定木とRandomForestの違いを説明できる

決定木
目的変数に属する確率を複数の説明変数の組み合わせで算出する方法。
イメージは以下で、Yes/Noなどの条件に属するかどうかで確率を算出する。

ランダムフォレスト
ランダムフォレストは、アンサンブル学習法(複数の分類器を集めて構成される分類器)の一つ。
決定木を複数集めて使うので、木が集まってフォレスト(森)として使う。

http://qiita.com/yshi12/items/6d30010b353b084b3749

★ランダムフォレストは決定木の弱点を補う方法の一つ

決定木では、枝分かれを必要な程度まで成長させて、枝先の内容を見ます。
そのため、どこまで枝分かれさせるかが解析のポイントになります。

枝分かれでは、最初の枝分かれが先の方まで影響します。
因果関係の分析 で決定木を使う場合は、どこまで枝分かれさせるかだけでなく、
最初の枝分かれをどう扱うかも大事なポイントになります。 因果関係の分析では、大きな要因から順に枝分かれするのが理想的です。

しかし、分析対象のデータによっては、大きな要因から枝分かれしないです。 また、2つの要因で優劣がほとんど変わらない場合は、枝分かれの出発点は、両方を見てみたいのですが、 できあがった木を見ても、そのような優劣の状況はわかりません。
これらが決定木の弱点です。

↓それの対策

ランダムフォレストというのは、決定木の一種です。
すべての説明変数でひとつの木を作るのではなく、説明変数の組をランダムに複数作り、その複数の組について木を作成します。
複数できた木を見て、総合的に考えます。

http://heartland.geocities.jp/ecodata222/ed/edj1-3-1.html