■要求されるスキル
線形回帰分析が量的なを予測するのに対して、ロジスティック回帰分析は何を予測する手法か(発生確率予測など)を説明でき、実際に使用できる
・線形回帰分析が量的変数を予測するのに対して、ロジスティック回帰分析は発生確率を予測する手法です。
基本的な考え方は線形回帰分析と同じなのですが、予測結果が 0 から 1 の間を取るように、数式やその前提に改良が加えられています。
ロジスティック回帰分析に用いるデータは、目的変数(求めるもの)が0,1のデータまたは%のデータ、説明変数は数量データ(n)でなければなりません。
http://blogs.teradata.com/international/ja/hhg10/
↓これが凄く丁寧に書いている
https://istat.co.jp/ta_commentary/logistic
ロジスティック回帰分析を行うために着けるキャップは、loge{y/(1-y)}= ax+b です。y は購入する確率を意味し、1-y は購入しない確率を意味します。分母に非発生確率、そして分子に発生確率をおいて算出したものを「オッズ」と呼び、発生確率が非発生確率の何倍あるかを意味している指標です。
・重回帰分析ではP値を求めるのにt値という指標を用いるのに対し、ロジスティック回帰分析ではWald統計量という指標を用いますが、P値が5%未満であれば、係数は統計的に意味があると判断することが多いというのは、重回帰分析と同様です。
・ロジスティック関数=シグモイド関数
モデルは同じく1958年に発表された単純パーセプトロンと等価であるが、scikit-learn などでは、パラメータを決める最適化問題で確率的勾配降下法を使用する物をパーセプトロンと呼び、座標降下法や準ニュートン法などを使用する物をロジスティック回帰と呼んでいる。