160_条件Xと事象Yの関係性をリフト値を用いて評価できる

リフト値とは、バスケット分析における重要な指標の一つ

ある商品xの購買が他の商品yの購買とどの程度相関しているかを示す指標です。
英単語”lift”は「持ち上げる」という意味であり、リフト値は商品xの購買が商品yの購買を
どの程度”持ち上げる”か(促進させるか)を示す指標であると言えます。
リフト値が大きければ大きいほど、商品xの購買が商品yの購買を”持ち上げて”います。

この「リフト値(Lift)」という指標は、
「支持度(support)」

「確信度(confidence)」

という指標とともに説明されます。
すべてのトランザクション(購買履歴)のうち商品xと商品yがともに購買されている割合を「支持度」といい、
商品xの購買したときに、さらに商品yを購買する確率を「確信度」といいます。
「支持度」「確信度」をそれぞれ式に表わすと次のようになります。
・・・

・・・
そして、この「確信度」を商品yを含むトランザクションの件数で割ったものが、「リフト値」になります。
この式は、次のようになります。

・・・・

この式から「リフト値」は、「xが買われたときにyも買われる確率」を「全体でyが買われる確率」で割ったものである、と考えることができます。
リフト値の考え方はバスケット分析以外にも応用できる

「リフト値」は「xが買われたときにyも買われる確率」を「全体でyが買われる確率」で割ったものであると書きましたが、これを一般化すると次のようになります。
「リフト値」は、「条件Xのときの事象Yの割合」を「全体での事象Yの割合」で割ったものである。
(バスケット分析の時は、条件Xが「xが買われた」になり、事象Yの割合が「yが買われる確率」になります)
つまり、「リフト値が高い」ということは条件Xのときに事象Yが起こりやすいということを示しています。
このように一般化すると「リフト値」の考え方は「バスケット分析」以外でも活用できます

リフト値とは:その事象が、どれだけ「持ち上がっているか」を考える指標|データ分析用語を解説

3つの指標はどれも同じくらい重要であり、そのうち1つが最も重要というものではありません。
マーケットバスケット分析の一般的な「使い方」は、3つの指標がどれも高い組み合わせ{A}→{B}があった場合に、
Aを買っていてBを買っていない人に、Bをレコメンドするというものです。
その場合、support(支持度)の高い組み合わせほど全体的な頻度が高い組み合わせであり、
confidence(確信度)の高い組み合わせほど併売の度合いが高い組み合わせであり、
lift(リフト)が高い組み合わせほど、Aを買っていることによるBの購買確率が向上することになります。

■実学
リコメンドする組み合わせの優先順位には、一意の正解があるわけではありませんが、
多く行われる方法としては、support(支持度)とconfidence(確信度)に、
一定の「しきい値」を設けて組み合わせの「足切り」をした上で、lift(リフト)順にソートを行い、
上位の組み合わせについて、併売を促す施策を行うということがあります。

第2回 マーケットバスケット分析の評価指標|POSデータでマーケットバスケット分析の実践 with R

Rでの実際の処理プロセスは以下を参照する

第4回 分析結果と考えられる「打ち手」|POSデータでマーケットバスケット分析の実践 with R