リフト値とは、バスケット分析における重要な指標の一つ
ある商品xの購買が他の商品yの購買とどの程度相関しているかを示す指標です。
英単語”lift”は「持ち上げる」という意味であり、リフト値は商品xの購買が商品yの購買を
どの程度”持ち上げる”か(促進させるか)を示す指標であると言えます。
リフト値が大きければ大きいほど、商品xの購買が商品yの購買を”持ち上げて”います。
この「リフト値(Lift)」という指標は、
「支持度(support)」
と
「確信度(confidence)」
という指標とともに説明されます。
すべてのトランザクション(購買履歴)のうち商品xと商品yがともに購買されている割合を「支持度」といい、
商品xの購買したときに、さらに商品yを購買する確率を「確信度」といいます。
「支持度」「確信度」をそれぞれ式に表わすと次のようになります。
・・・
・・・
そして、この「確信度」を商品yを含むトランザクションの件数で割ったものが、「リフト値」になります。
この式は、次のようになります。
・・・・
この式から「リフト値」は、「xが買われたときにyも買われる確率」を「全体でyが買われる確率」で割ったものである、と考えることができます。
リフト値の考え方はバスケット分析以外にも応用できる
「リフト値」は「xが買われたときにyも買われる確率」を「全体でyが買われる確率」で割ったものであると書きましたが、これを一般化すると次のようになります。
「リフト値」は、「条件Xのときの事象Yの割合」を「全体での事象Yの割合」で割ったものである。
(バスケット分析の時は、条件Xが「xが買われた」になり、事象Yの割合が「yが買われる確率」になります)
つまり、「リフト値が高い」ということは条件Xのときに事象Yが起こりやすいということを示しています。
このように一般化すると「リフト値」の考え方は「バスケット分析」以外でも活用できます
3つの指標はどれも同じくらい重要であり、そのうち1つが最も重要というものではありません。
マーケットバスケット分析の一般的な「使い方」は、3つの指標がどれも高い組み合わせ{A}→{B}があった場合に、
Aを買っていてBを買っていない人に、Bをレコメンドするというものです。
その場合、support(支持度)の高い組み合わせほど全体的な頻度が高い組み合わせであり、
confidence(確信度)の高い組み合わせほど併売の度合いが高い組み合わせであり、
lift(リフト)が高い組み合わせほど、Aを買っていることによるBの購買確率が向上することになります。
■実学
リコメンドする組み合わせの優先順位には、一意の正解があるわけではありませんが、
多く行われる方法としては、support(支持度)とconfidence(確信度)に、
一定の「しきい値」を設けて組み合わせの「足切り」をした上で、lift(リフト)順にソートを行い、
上位の組み合わせについて、併売を促す施策を行うということがあります。
Rでの実際の処理プロセスは以下を参照する