ECモールの通説「ロングテール」は本当か 機械学習による1億件の推計データで検証
コメント
注目のコメント
2004年にアンダーソンが言ったようなECモールが「ロングテール」であるというのがどこまで通説なのかは知りませんが、「売れ筋ではない商品も結構大事」くらいの意味だと思っていました。
むしろ最近では「ブロックバスター戦略」などと、集中投下型のウィナーテイクオールには勝てないという元も子もない例が多く、やはり普通にべき乗則に従うパレート分布だという話の方が良く聞きます。
記事中のデータをみても、どうみてもパレート分布。
興味深いのは、「20-80の法則」に従うヤフーや楽天に比べ、amazonは「10-90」になっていて、「ロングテール」から1番遠い存在だということがわかります。amazonは典型例として言われる本ですら「20-80」です。
服部哲弥,「Amazon ランキングの謎を解く」化学同人,2011
によると、Amazonのランキングは、いわゆる「先頭に飛び出す規則(Move-to-Front)」と注文頻度のポワッソン課程というモデルで説明ができ、ある商品が買われると一気に1位となり、その後他の商品が買われるたびにランクを下げるという仕組みのため、常に瞬間瞬間の売れ筋がレコメンドされていることになる。
楽天やヤフーがどの様な仕組みを採用しているかわからないが、ランキングシステムとレコメンドの差でこれだけの違いが出るのだとしたら、我々はかなり「買わされて」いることになり、ある意味恐ろしさを感じる。いや、寧ろこれが「自然」なのか。
パレート分布ならロングテールじゃないじゃないかというのは、マーケティング的にはそうかもしれないが、パレート分布というのは指数分布に比べれば十分「ロングテール」なわけで。
「ロングテール」という言葉は、少なくとも1940年代の統計学に存在し、近年では、待ち行列理論の世界(コールセンターやや病院施設設計、サーバーやルーターのバッファ設計などのシステムの混雑具合を数理的に解析する分野)では、「裾の重い分布(ヘビーテイル)」の特殊なケースとして定義されている。
確率変数Xがある値xより大きくなる確率として、累積確率分布関数をF(x)を
F(x) = P[X>x]
と定義したとき、
全てのt>0において、
F(x+t) 〜 F(x) as x→∞
となる分布のことで、指数函数などと比べると殆ど減衰しない分布となる。amazonと楽天・ヤフーの差は、検索の精度と体験の差かなと。検索したあと高い精度で商品に行くamazonと、雑多に並んで店舗に行く楽天・ヤフーだと、検索から購入の間に接する商品数に差がある。