2019/10/10 02:35
a2c-ceres
何か操作が行われている事は見えるが会員・非会員とは別の要因か。高いスコアのプレミアム性を維持する操作なのかなぁ。そしてそれを代理店が悪用してると。
2019/10/10 13:05
havanap
追試えらい・・・
2019/10/10 21:57
teasquare
全国で見るのではなく各地域で見ないとシンプソンのパラドックスが働く可能性が否定できないのでは?食べログの影響から会員になる店がいるかどうかは地域差大きそうだし。
2019/10/10 22:59
Fushihara
githubのソースが404になってる。消したのか、消されたのか知りたい
2019/10/11 08:44
chikuwabus
当初のtweetから知が積み上がっていって良いインターネット感ある。別の話として、昔よく言われていた「食べログ3.5以上は外れない」があくまで「外れない」であって「良い店」とまでは言えないことも類推できそう
2019/10/11 09:54
bob3
なるほど。疑念は晴れぬまま。
2019/10/11 10:23
shibacow
きちんと追試が出るのは良いことだ。/こうなってしまっては食べログは統計学者にNDAを結んだ上で、生データと計算ロジックを渡して食べログと同じ結果になるか再計算させたら良いのにと思う。
2019/10/11 11:48
dnsystem
ソースない
2019/10/11 12:25
Yagokoro
いや、これは詭弁だなあ。そもそも、あれは証明じゃなくて点数操作の推定でしょ。もともとその裏側のシステムが何かの証明なんかしていない。つか、このブログこの記事しかなくて限りなく怪しげ。
2019/10/11 12:28
anon3
3.8問題は(1)1−2を付けられる店は残らない(2)美味い店でも5は付け辛い(3)コミュニティサイトという性質上、ある程度スコアユーザー間の協調が出る。あたりで普通に点数は4のやや下ぐらい=3.6近辺になるのが原因と思ってる
2019/10/11 12:30
timetosay
地域性と代理店次第ってことなのかぁ。 リリースも「あ゛?そんなことすんの、うちじゃねぇんだよ!」ってニュアンスぷんぷんだもんねぇ。
2019/10/11 12:31
Outfielder
「運営が評価点に何かしら恣意的な操作を加えていることは明らか」「仮説が証明できない」
2019/10/11 12:35
ROYGB
会員の店でも3.6が多いのか。
2019/10/11 12:39
NOV1975
何らかの問題が存在する、という結論に何ら変わりはないのでは?
2019/10/11 12:56
asakura-t
店舗が食べログ会員/非会員かは関係なさげ(ただ、別の要因はありそう)って話か。
2019/10/11 12:56
mirai-iro
“(陰謀というものはそう簡単に尻尾を出さないものです)”
2019/10/11 13:09
Mash
食べログの会員店舗と非会員店舗のいずれでも3.6問題が起きており、会員店舗への優遇では説明が付かないという結果
2019/10/11 13:10
enemyoffreedom
面白い
2019/10/11 13:15
satomi_hanten
公取ちゃんと仕事してくれなー。まぁ恣意的な操作をしてることはほぼ確定だな。
2019/10/11 13:16
taitoku
この話は「点が買える」って話とセットだと思っていて、そこにカラクリがありそうな気はしている。ちゃんとした仮説検証は偉いし素晴らしい
2019/10/11 13:20
barringtonia
ブログのコメントでも指摘があるけれど、折れ線グラフの会員比率と棒グラフの結果が一致していないような。3.25あたりのピークの所とか。
2019/10/11 13:23
HelloRusk
なるほど、、これはかしこい。
2019/10/11 13:26
public_key
恣意的に非会員を落としてるわけではなく、単に食べログのバグで3.6付近にピークがあるのだとしても、食べログの評価は参考にはしたくないな…
2019/10/11 13:29
hasiduki
何をやっているのかまるで理解できない。1.モデル(仮説)を作成、2.データを用いてモデルパラメータ推定、3.推定されたパラメータの評価とモデルの評価、の手順がわからない。
2019/10/11 13:35
monopole
自分のモデルでは説明できなかったという話で、ヘンテコなモデルならいくらでも説明できるはず(そして食べログはモデルを公開してない…)
2019/10/11 13:37
hosi
会員・非会員の区別ではなく、利用者にはわからない他の要因で点数を操作しているのであれば、そっちのほうが問題では?
2019/10/11 13:37
tg30yen
おそらく3.6と3.8の壁ができるような点数操作をしているが、それと課金の有無は関係ないという結果。
2019/10/11 13:45
terencow
「会員かどうかは、店舗ページのトップに写真があるか」とあるが、無料でも画像は貼れるように見える owner.tabelog.com 「非会員/無料会員/有料会員」で見るべきでは / 追記 anond.hatelabo.jp
2019/10/11 13:45
murashit
追試だ
2019/10/11 13:45
moccos_info
「この記事著者が推定した操作と全く同一のことだけが行われていて他の操作アルゴはない」のが否定されただけであって、"存在を証明できない" ”この不当な風評” はダメなほうの恣意的な統計運用ってかんじ
2019/10/11 13:52
lone-dog
仮説が正しい場合、会員/非会員の2分法ではなく会員をさらに細分化するキャップ外しのオプションといった要素があるとか?
2019/10/11 13:55
mn112hr
地域によってやってる、やってないありそう
2019/10/11 13:56
karia
“(陰謀というものはそう簡単に尻尾を出さないものです) 食べログ運営のみなさんが、この不当な風評で苦しむことがないように祈るばかりです。”
2019/10/11 13:56
hobo_king
“最終的には仮説が証明できない、否定的な結果となってしまいましたが、全国的な評価点分布の傾向、そして個別の評価から考えれば、食べログ運営が評価点に何かしら恣意的な操作を加えていることは明らか”
2019/10/11 13:59
kagioo2uma
>食べログ運営が評価点に何かしら恣意的な操作を加えていることは明らかです。
2019/10/11 14:01
nankichi
sourceが公開されているのは素晴らしい:仮説が違う。まずこの分布で検証するべきは「3.6と3.8に大きな断絶があること」また会員非会員での分析も疑惑と違う。会員VS会員を断った非会員だよね。調べるべきは時系列データ
2019/10/11 14:04
rusemoly
店の質が正規分布かつ客が正確・独立に採点すれば、なので正規分布は苦しいが、普通はなだらかなカーブになりそう①レベルキャップがある②待遇の違う店が混在している 等考えられ、②の要因が金という物証はまだ。
2019/10/11 14:04
hisawooo
terencow様のご指摘の通り無料会員でも画像登録できますねpcu.jp
2019/10/11 14:07
reteru
「3.8を超え続けることは難しく、3.6に回帰するように調整されている」ということは明らかで、一部代理店はそれを理解したうえで営業かけてると。営業トーク問題と口コミサイトとしての信頼性の問題と2つがあるわけだ
2019/10/11 14:10
masasiro
仮に3.8リミッターがあったとしても、会員になった途端にこれを解除するわけじゃないだろうから解除後に少しずつ上がっていく仕様になっているだろう。ならば単純な会員/非会員フラグのみでは検証は難しい気がする。
2019/10/11 14:14
sisya
記事にあるような理想形の不正データになってしまえば、それこそユーザに一発でばれてしまうので偽装されないわけがないし、そこまできれいな形に分布するのも逆に不自然なので検証としてはどうだろうかという気持ち
2019/10/11 14:17
ntstn
非会員の良い店で評価が高いのを3.6とか3.8に張り付けてるだけなのでは。会員費も色々あるみたいだし。
2019/10/11 14:19
DocSeri
食べログ評価3.8問題について、「会員か非会員か」では3.6以下と3.8以上に有意差がない、つまり「それが点数操作を左右する要因ではない」という分析。何らかの不自然な操作が加わっていることを否定するものではない。
2019/10/11 14:21
bYMQ
“最終的には仮説が証明できない、否定的な結果となってしまいましたが、全国的な評価点分布の傾向、そして個別の評価から考えれば、食べログ運営が評価点に何かしら恣意的な操作を加えていることは明らかです。”
2019/10/11 14:22
tribird
店側が食べログ会員なら食べログから予約した客かどうかでサービスに差をつけて客の満足度が変化するかも。そういう調査は難しいかな。
2019/10/11 14:28
benridane111
やはり時系列データがいるか。もしくは、レビューと評価で差が生まれているか。
2019/10/11 14:33
mouki0911
時系列データがないと。
2019/10/11 14:38
as365n2
評価3.6の店舗で会員/非会員の有意の差なし、と。/ 会員に有料・無料の2者があることがここでは未評価とのこと。
2019/10/11 14:40
wow64
そもそもが星が正規分布しないというか、店から出てきた人を出口調査するとかじゃなきゃ公平な点数にならんだろ。
2019/10/11 14:41
natu3kan
会員か非会員かでは3.6近辺で有意差はなかったと。ブコメみて確かに会員を断った非会員か、会員に勧誘されてない非会員かどうかは、このデータではわからないってのはあるか。
2019/10/11 14:45
otihateten3510
グラフ見た感じギリギリのラインだなとは思ってる。計算の方偏りとかでこのくらいは起こるかと。
2019/10/11 14:46
sin4xe1
データ操作のキーが年会費の有無ではないということが判ったということでは
2019/10/11 14:47
charliecgo
このブログ主の仮設設定が悪かっただけで、もっとうまい仮説があると思わせる生データ。
2019/10/11 14:47
deamu
『証明することは不可能であることが示唆』から『証明できないことが明らかとなり』x2回と『示唆』から『明らか』に表現が飛躍してたり、太字で『証明できない』を度々繰り返してて世論誘導の意図を感じる記事だな
2019/10/11 14:48
maturi
きむかせつ
2019/10/11 14:51
rkchy
証明ではなく検定ではと思ったけど検定でもないっぽい
2019/10/11 14:54
tailwisdom
ほえー。
2019/10/11 14:54
kenjikana
これじゃない感半端ない。操作をしていない証明が欲しい。ないなら食べログは客観的ではない評価だったと認めて客観的な評価を行うシステムに早急に変更してください
2019/10/11 14:55
racebyrace
ユーザーごとに評点の重みがあるという話なので、その統計方法では分かるはずがありません。ユーザー分析から必要です。
2019/10/11 14:58
tyhe
いいね。ついでに事の発端となったツイ主の過去のツイート見て怪しさを再認識しましょう。twitter.com
2019/10/11 14:58
develtaro
店が食べログの有料サービスを使っているかどうかはセンシティブな情報だから簡単に分かるようにはなってないと思うんだけど
2019/10/11 14:59
samu_i
“証明できない” 統計学では証明は不可能は実行する前からわかってるはず。仮説っぽいか仮説っぽくないが結論で得られる。そこから何らかの仕組みを疑うことはできる。類似サービスのデータと比較するとか、
2019/10/11 15:00
lifehackcat
全データ洗い出して非公開になっている計算式を加えないと分かららないけど一般客の平均値3.6がブレなく全国一律にピークっての明らかに何かしてる。店客の母数が県で違うから±0.1ぐらい普通ブレると思うんだよな。
2019/10/11 15:02
AKIMOTO
有料会員かどうかサイトに書いてあるの?
2019/10/11 15:03
napsucks
なるほど。おカネで操作してるとは言い切れないということか。では3.6付近の崖はどういった操作によるものなんだろう。
2019/10/11 15:03
I8D
“対象が食べログ店舗会員かどうかは、店舗ページのトップに写真があるか、店舗側の書いたセールス文章が表示されているかでわかります。” これが間違っているのかな?無料会員でも可能というコメントがある。
2019/10/11 15:07
kazuya53
何らかの理由から3.6に評価を集める人為的操作を行ってるのは確実だが、有料会員か否かという基準ではなさそうか。何のためにやってるんだ。どちらにしろもうこのサービスは客観的評価には使えないな。
2019/10/11 15:17
knok
スクレイピングコードを公開して他の人も追試出来る形にしているのは偉い
2019/10/11 15:17
fujihiro0
すばらしい検証。有料会員を加点する操作をしていないのならば、食べログは疑惑を晴らすために有料会員・無料会員の印を表示するとよい。
2019/10/11 15:20
TownBeginner
おお、追試が出てる。Githubにソースコード置いてるの良いね。しかし、真相はなんだろう。何らかの操作はされているように見えるのだけど。
2019/10/11 15:25
roll8
純粋に面白かったです。有料か無料かが問題だと思うんだけど、そこの検証はこういう技術がある人でもできないのは残念。
2019/10/11 15:29
mohno
評価点が単純平均でないことは表明されているが…/「店舗ページのトップに写真があるか」どうかで有料会員かどうかは分からないらしい。有料会員の判別はできないってことか?
2019/10/11 15:30
hazlitt
陰謀論を否定的に検証する体で顕著な偏向の追認になってる。恐らく食べログ的にもこの点数分布は意味がないので、分布のみ適当に是正すればごまかせる気はする
2019/10/11 15:30
tdam
会員・非会員仮説が証明できないのなら、仮説の修正、作り直しに入るべき。不自然なピークは何らかの操作が行われていることは統計的に有意でしょう。そして我々消費者は操作された点数を安易に信頼すべきではない。
2019/10/11 15:30
mnoguti
こういう分析したいよね。
2019/10/11 15:31
anoworl
客が付けた点数と食べログの点数の乖離を見てみたい
2019/10/11 15:33
TAKAPPRS
記事投稿1…
2019/10/11 15:34
onasussu
3.8を3.6に下げる、という一つのパターンの操作だとは誰も思ってないと思うんだが。もっと巧妙にやってるよ、一部有名店は別格で4以上とか
2019/10/11 15:37
letsspeak
3.6からジャンプする店を定期観測すれば消費者としてもwin-winなのでは / この記事の方法だと会員非会員を正しく見分けられていないのか..
2019/10/11 15:38
cyan0302
「陰謀というものはそう簡単に尻尾を出さないものです」
2019/10/11 15:40
wkoichi
店舗ページのトップに写真があるかで会員と非会員を区別できるという前提でなされた検証であるが、その前提が誤っているため、この検証の結果は正しくないという理解でOK?
2019/10/11 15:41
unagiga
もともとは数字が偏らないよう極端な評価を排除する仕組みだったのかもしれないが、色々な積み重ねで不信感が上回ってしまったんだろう。ユーザーの評価に頼るシステムで信用を失うのは致命的
2019/10/11 15:41
crexist
面白い記事。まぁ証明はできないけども・・・ってとこだな。。。
2019/10/11 15:42
yoshis1210
そりゃあ会員だけ点数高かったらあからさま過ぎるし不正があるとしても別メニュー(裏メニュー)に決まってるだろうとは思うけど。点数を操作可能な機能があるかシステムの仕様をチェックするか内部告発しかないのでは
2019/10/11 15:43
estragon
大事なことは、恣意的な点数操作は可能か、Twitterでの報告は事実かの二点だよね「全国的な評価点分布の傾向、そして個別の評価から考えれば、食べログ運営が評価点に何かしら恣意的な操作を加えていることは明らか」
2019/10/11 15:45
nephar
人が感じられるほど明らかにおかしい実感があるのに「おかしい」という結果が出ないのは、手段や前提がおかしいか本人がバイアスかけてるかやで。
2019/10/11 15:49
sds-page
有料会員かどうかの判定基準が間違ってるから3.6と3.8にピークがある事の追試にしかなってないと / 判定基準は合ってるとの事。この記事には問題はない
2019/10/11 15:50
kyudainogaku
大学で統計学ちょっと勉強したくらいだとなかなか理解できない記事だと思う。作者賢い。
2019/10/11 15:53
exshouqosa
ほー
2019/10/11 15:55
KariumNitrate
お手間でなければ1週間後、1ヶ月後、3ヶ月後くらいに再検証をして欲しい。あと評価点の分布がわかるとその数値の持つ意味もわかりやすい。▼公式の『概ね3.50点未満(全体の約97%)』というのは信じがたいね。
2019/10/11 15:57
doas1999
すでに言われてるが、ここ間違ってる。 "対象が食べログ店舗会員かどうかは、店舗ページのトップに写真があるか、店舗側の書いたセールス文章が表示されているかでわかります"
2019/10/11 16:05
zapperd
3.8点以上の店舗は年会費を払わなければ評価を3.6点に下げられる、ではなく3.8を初めて超えた店舗は3.6に下げられる的な事なんだろうか
2019/10/11 16:10
remcat
どういう意味で「実験」っていってるんだろうか。(内容は未確認)
2019/10/11 16:14
II-O
まともに読む気は無いけど、ブログがこの記事だけ、はてブもこの記事だけ、と言う書き手の必死さは伺える。
2019/10/11 16:14
quabbin
カカクコム側にある問題点は、データ上変なことをしているかどうかではなく、(非公式だとしても)evilな営業をしているかどうかにあるのだが、データの問題を確認することはそれはそれとして重要。興味深い
2019/10/11 16:15
wetones
非会員でも3.6以上がつく場合もあるってことでしょ。なんかたくさん書いてあるけど、結論ありきのデータ作成になってるように見える。
2019/10/11 16:19
yn1104
既に食べログの☆が体感値でも信用をなくしてるんだから巻き返しは無理だろうね。緩やかにユーザーを失うか、現在必要とされてる電話番号、住所、画像、駐車場の情報取得が代替可能な競合が出てきたら一気に廃れるな
2019/10/11 16:21
kyoumoe
そもそもデータが本当にユーザーのつけた点数のデータなのかわからないんだから意味ないのでは/別枠で金を払う3.8会員みたいなのがあったとしたらこういう調査意味なさそうだしそういう枠がありそうな気もしている
2019/10/11 16:21
megadrive
無料/有料の分布、3.25以下の店舗情報、低スコア有料店舗の比率チェックなどの追試が待たれる
2019/10/11 16:25
masahiko_of_joytoy
食べログは一言も正規分布に沿うって言ってないのに、何でみんな正規分布前提なんだろ?
2019/10/11 16:30
fock
まず正規分布を仮定するとこがおかしいし、この人の能力が足りなくて証明できなかっただけかもしれないし、証明できないことを証明する必要があるし。
2019/10/11 16:31
ttysumi
やってることは素晴らしいがタイトル・結論はおかしい。統計で「行為の証明」はできない。あくまで「統計的に不自然」を示すだけ。それも仮説によるのだが、この場合会員情報が確実ではないので、証明以前のところ。
2019/10/11 16:31
securecat
そもそも食べログの点数ってレビュー採点の平均とかではないってこと忘れてないか? 単純にフラグでしょ。金払ってないけど美味しい店は3.6、支払申込があれば3.7、振込完了で3.8、加えて何かしたら3.9、みたいな感じ。
2019/10/11 16:40
honeybe
すばらしい追試
2019/10/11 16:41
eidai
46都道府県とは
2019/10/11 16:42
zazenzazen
簡単に高得点出ない操作つか、調整はしてるでしょうよ。問題はそれで有料/無料で差をつけてるか?なのにおかしいのものはおかしいの!ってごり押ししてるコメントが多いね。
2019/10/11 16:43
blueboy
 konkon3249 の はてブ履歴は1件(本件)だけ。  身元を隠しているね。後ろめたいことがあるのかな?
2019/10/11 16:48
rAdio
このエントリのみの新規ブログなんだけど、Githubにはもう少し長い活動履歴がある。ただ、この手の情報を公開するなら、自分のポジションも明らかにした方が、要らぬ詮索を避けられて情報の価値が明瞭になるのでは。
2019/10/11 16:52
rti7743
結論にも書かれているように、3.6にピークが出ているから、何かが起きているのは間違いないと思うんだけどなあ。実はランク計算にバグがあって3.6にピークがでてしまうから、恣意的な操作まで可能性多すぎ。
2019/10/11 16:53
table
食べログのアルゴリズム分析する方がおもしろそう。単純平均ではない、ユーザーごとに影響度、評価数、情報の鮮度だって食べログ書いてんだし、むしろ時間が経てば点数落ちる方が普通
2019/10/11 16:55
pmint
なんで"評価数100以上"だけを対象にしたんだろう。作為的。tabelog.com によると評価数によって評価点を加工してるらしいので影響は大きいはず。それとインフルエンサーの評価を強く反映してるともある。
2019/10/11 17:00
onesplat
こいつまともに統計勉強したことないだろ
2019/10/11 17:03
Panthera_uncia
低評価の店ほど潰れやすい、極端にうまい/まずい方が口コミが書き込まれやすい…などなどで正規分布にはならなそう
2019/10/11 17:05
osoma02
人は信じたい情報を信じる
2019/10/11 17:10
miyazawataichi
3.65からガクンと数が減って、その後0.5刻み(?)に増えているのを見ると、有料プランのオプションを1個増やすと0.5増えるんかな?んで、カネで買える評価の最大値が3.8あたりなんだろうか
2019/10/11 17:13
damselfish
まずそもそもここと元のブログで行われてることは、データの可視化とそれに対する主観的な印象論なのであって、検証だとか証明できないだとかは言葉が強すぎ。
2019/10/11 17:14
fai_fx
飲食店店主達の言葉が全てやと思う…。
2019/10/11 17:20
monmon225197810
記事を怪しむより記事の内容を確認して指摘を見つけることが大事かな。
2019/10/11 17:22
Helfard
検証自体は面白かったけどネ。
2019/10/11 17:22
crcus
お店が会員になるか否かはランダムではないので全体の分布の1/5を会員とやってはダメな上に、非会員の3.8以上を全てカットするのではなく3.8→3.6、3.9→3.65、4.0→3.7、、、4.2→3.8のような操作の可能性もあるからなあ。
2019/10/11 17:26
nekong87
詭弁とか仮説が違うとか言われてっけど、「証明できない」は合ってるし元ネタの大阪府の検証の方がどう見ても雑でツッコミどころ満載だろ。お前らどんだけ食べログ叩きたいんだよ。
2019/10/11 17:26
watarux
非会員の割合、がグラフにあってないように見えるけどスプレッドシートも公開してほしいなあ。0.01点ごとの分布も見たいし。スクレイピングデータから自分でつくりゃいいっちゃいいんだけど
2019/10/11 17:32
tsugitta
元のブログ、言葉を丁寧に選んでいたと思うし「証明した」とも言っていないと思うけどな〜
2019/10/11 17:33
TakamoriTarou
仮定が違っているのでは。例えば、食べログはそもそも生の値を単に出しておらず、独自のアルゴリズムによるらしいので、正しい値が正規分布によるとの仮定が違うのではないかなぁ。ネット妖怪シンギフメイの爆誕か
2019/10/11 17:36
augsUK
恣意的な操作までは明らかで十分よ。そもそも任意のレビューの点数は正規分布になるのかから怪しいし。また、おそらく超有名店については、金を出してなくても高い得点がつく操作をしてるはず。
2019/10/11 17:39
megumin1
おそらく統計学でいう仮説検定をやろうとしたんだけど、p値とか計算できなかったらしく、言葉を濁しまくっている記事ですね。そして「検定」なのに「証明」なんて言葉を不用意に使ってしまうのは罪だと思いますよ。
2019/10/11 17:40
gcyn
『陰謀というものはそう簡単に尻尾を出さないものです』 (笑)。
2019/10/11 17:47
oakbow
追試は素晴らしいけど、会員になり、かつ追加のスペシャル料金を払わないと3.8越えないとかだと思ってたので用いてる仮説が違うのではないかな、と思うなあ
2019/10/11 17:57
saku4saku
☆たくさんもらってるコメントが、そもそも記事を読んでいないのか読んでも趣旨が理解できてないようなのが多くて草。
2019/10/11 18:01
ite
統計で、「データから証明できる」なんてことはまず無いよ。仮説検定で仮説を棄却することは良くあるけど、「証明」なんてしないだろ。最近の数学教育は知らないけど、この程度のことも授業でやらないのか?
2019/10/11 18:04
tym1101
勉強はこうやって盛り上がるべきよね
2019/10/11 18:05
kibitaki
単発なのが気になる/同じデータで論が違う場合はまず自分が入れた仮定・期待値を疑え、の好例。「店舗会員かの判定基準」「全て3.6以下に落とされている」が一手詰み。
2019/10/11 18:06
stp7
「食べログの点数は単純平均ではありません。 各評価がお店の点数に与える影響度はユーザーによって異なります。」tabelog.com そもそも数字を弄ってるので、どれだけ弄ってるかが争点。仮定から間違い。
2019/10/11 18:10
thesecret3
まあ、何からの操作があるのは追試されてる。不正評価の自動検出かなと思ってるけど。
2019/10/11 18:25
wildhog
これで見る限り会員かどうかは関係なさそう。別の評価操作メニューがあるのかな
2019/10/11 18:25
abarakun
食べログ年会費辞めましたエントリが来ることを楽しみにしてるんだがなあ
2019/10/11 18:29
nori__3
存在は証明できなくても、存在しないことを証明したわけではない
2019/10/11 18:33
daruism
有料会員でも料金に幅があるんだから、サービス内容に差があると考えるのが妥当
2019/10/11 18:45
yas-mal
ここで否定された仮説は、「有料会員かだけを条件として3.8以上→3.6への操作が行われている」かな。「代理店の気まぐれで3.6に落とせるシステムで、今回はたまたま有料会員を拒否したのがトリガーだった」とか。
2019/10/11 18:46
ohira-y
ポアンカレとパン屋のようにはいかなかったか。
2019/10/11 18:53
yorkfield00
何であれ数値が正規分布に従わないなら食べログ側は数値の意味するところを説明しなければならないし、3.6のピークや3.8の崖のカラクリを明かさねばならない
2019/10/11 19:04
ireire
単純平均じゃないのか。食べログ投稿回によって影響度が変化するなら、初回投稿は全て3.6としてカウントとかじゃないかな?(適当)/ソース見れるみたい/無料有料割合の変化は統計手法とは別にデータとして有用では?
2019/10/11 19:07
hyuuikku
横軸に平均点、縦軸に食べログ点?の散布図を を会員と非会員でそれぞれでとれば良いのでは?
2019/10/11 19:11
nisatta
「評価点の分布が正規分布であると仮定します」正直この時点で無理筋だと思うので、この議論ずっと脱力感しかない。そしてgithubデータあるし、パッと作ったアカウントでもない。食べログは絶対に使わないけどさ…
2019/10/11 19:13
omi_k
そろそろ陰謀論に足を取られてるひとが出てきている
2019/10/11 19:16
July1st2017
怪文書だ。
2019/10/11 19:16
todo_todo
この記事、非会員割合の値がおかしいし、このIDで投稿している記事は1件だけだし、どうにも怪しい。
2019/10/11 19:20
greenbuddha138
やっぱ幸楽苑だな
2019/10/11 19:23
hdannoue
統計学的手法の議論の欠点で、そもそも母集団が操作された集団であるのに、正規分布に準じる…って仮定しているのでいろいろ穴はあるわな。
2019/10/11 19:24
sthya
与太話以下の感想。たぶん、食べログの人達も、こういう人にデータ分析されるのを理解しているから、中央値で3.2-3.6を多くするようにしているんじゃない。
2019/10/11 19:27
filinion
グラフの形が不自然で、何らかの操作を行っていることは間違いないが、「無料会員は3.6以下に落とす」というような単純なものではなさそう…という結論。
2019/10/11 19:32
xxxxxxxxlarge
このグラフの透過pngイカしてる
2019/10/11 19:54
i_ko10mi
追試が出るのは良いこと。
2019/10/11 19:56
gabari
統計で「証明」という言葉使っちゃうあたり、うーんとなる。ちょっとでも心得あれば「検定」になるはず。でも、どういう仮設にするかは難しい。
2019/10/11 20:09
tick2tack
3.6付近で非会員の割合が高くなるというのは見いだせないからもとの話は違うだろうと。会員かどうかは分かるものなのね。/ ブコメ見るに食べログはもともと評価に手を入れてる感じなのかな?
2019/10/11 20:12
kota2009
しまったタイトルに釣られた。。ヒストグラムを描いたぐらいで「データ解析を駆使した」なんて、、。会員と非会員の両方で3.6にピークがあるから、食べログ不正が証明できないなんて。。確かに証明していないけどね。
2019/10/11 20:21
ninininininini
ちゃんとした記事書いたらいい仕事が見つかりそう
2019/10/11 20:22
z1h4784
統計的な方法で分かるのは評価値の分布がおかしいというところまで。それ以上は別の手段を使わないと調べられないよ
2019/10/11 20:28
xorzx
有料会員率12%ぐらい?会費だけで億いくのかな。
2019/10/11 20:30
remix-cafe
注目記事1、記事数1。ほぉ。ほぉ。ほぉ⁈
2019/10/11 20:34
m_ogawa
証明できないって、中の人じゃないなら当たり前では?あと、恣意的な操作を受けたかどうかの厳密な検定はできないのでは(真の分布は未知なので)。だから元記事はヒストグラムの異常だけを示したのだと思うけど。
2019/10/11 20:46
chocolate0521
馬鹿なんじゃないの?会員非会員のデータがないと証明できないとか。そんなデータがあればとっくに炎上しとるわ(´Д`)めう
2019/10/11 20:47
amematarou
関東関西中四国以外には3.8以上の店がほとんどないことが可視化された笑
2019/10/11 20:54
invoicekun
全く説得力なくて草
2019/10/11 20:54
Tucana
Uber Eatsやら食べログやら最近は単発垢ではてなブログに擁護記事載せるのが流行ってるんですか
2019/10/11 21:08
atcgouch
今すぐ「食べログ3.8問題を証明する気がなかった話」に題名を変えろ
2019/10/11 21:23
ebibibi
点数を運営が恣意的に操作してる場合にしかできない分布が再度確認されましたね。
2019/10/11 21:33
ghostbass
正規分布になるはず、というのは仮説として雑すぎ。とはいえ3.6付近のピークはやっぱり何かあると思わせる
2019/10/11 21:33
k-takahashi
『少なくともインターネット上で公開されているデータだけでは、食べログ3.8仮説を証明することは不可能である』 証拠不足ゆえ推定無罪としましょう、という話。別のデータでの追加検証に期待
2019/10/11 22:03
world24
自分で食って決めろ
2019/10/11 22:09
neetfull
“食べログ運営のみなさんが、この不当な風評で苦しむことがないように祈るばかりです。” この一文で一気に胡散臭くなった。この解析では分からなかった、ってだけで「不当な風評」とまで言っちゃうかなあ。
2019/10/11 22:40
kaos2009
“非会員割合”
2019/10/11 22:45
zentarou
俺も適当な擁護記事書いてやるから食べログさんお金ください!!!
2019/10/11 22:46
zmk99
若干要求がずれている観
2019/10/11 22:47
oktnzm
タイトルだけで統計学を勉強しなされ・・・と言えるエントリ
2019/10/11 22:50
shikiarai
継続日数1日のはてブロをどうやって信じろと
2019/10/11 22:52
rainbow_doll
大学生かな?
2019/10/11 22:55
munioka303
これは便乗バズりしたくて欲しい結論に向けてこねくり回してる感があって嫌い
2019/10/11 23:16
touhousintyaku
この記事1件しかないのを訝しむ反応がやたら多いけど探したら普通にTwitterアカウントがあった twitter.com /年会費云々はあくまで調査が行われたきっかけでしかなく「なんかおかしいぞ」から何も進んでない
2019/10/11 23:30
hahiho
グラフを一目見た時点で採点アルゴリズムの中に3.6と3.8と言う数字が固定値として何らかのフラグに使われてるのは明らかで、不適切な評価の排除やレビュアーの重み付けでは済まされない不審さは否めないと思う。
2019/10/11 23:36
ank0u
面白かったしどんどん続いてやってほしい。不自然なのは間違い無いのでルール試して行ったらきっとどこかでわかるわけでしょ?わくわく。
2019/10/11 23:44
sunvisor
"陰謀というものはそう簡単に尻尾を出さないものです
2019/10/11 23:44
yarukimedesu
有料会員に下駄を履かせているのかもしれない。
2019/10/11 23:51
mocktan
統計素人が読んでも怪しさを感じる記事
2019/10/11 23:52
Dragoonriders
そもそものところ、仮定がgdgd。正規分布から割り出した形と現実の形を比較してこねくり回したところで、なにも確かなことは言えないよ。
2019/10/11 23:56
d415uk3
統計を勉強し直して欲しい
2019/10/12 00:20
quality1
3.6がやたら多いけどそらは3.6がやたら多くなる計算方法を取ってるからだという話であれば別に公平なわけでお金によって評価が決まってるかどうかはまた別の話
2019/10/12 00:26
nymc
〜3.6、3.6〜3.8、3.8〜の違いでユーザーの動向が大きく変わるというデータが食べログには恐らくあって、そこに店の格式とかも含めて評価を合わせている可能性はあるね。もしかしたら妥当なのかも知れないけども。
2019/10/12 00:28
ssst888
バカばっかり。金銭で評価が変わるだなんてあり得んってば。 食べログ側にどこにそんな事するメリットがあるのよ。あるとしたら馬鹿な代理店の営業マンが契約欲しさにアホな営業トークしただけ。
2019/10/12 00:30
lettuce0831
おまえらの手のひら返しがすごいな
2019/10/12 00:34
nakag0711
「証明できなかった」が「立証できないことが証明された」にすり替わってるぞ
2019/10/12 00:37
kitano_ow2
統計統計みなさんおっしゃってますが、私の統計によりますと、 id:ssst888 は食べログの中の人です。
2019/10/12 00:37
yubi1guitarbook
あかんやんwwwwwwwwwwwww
2019/10/12 00:55
kaz_the_scum
ここですよね。「全国的な評価点分布の傾向、そして個別の評価から考えれば、食べログ運営が評価点に何かしら恣意的な操作を加えていることは明らかです。」
2019/10/12 01:01
waihasaruya
存在を証明できないけど否定もできないとしか受け取れない書き方だなあ
2019/10/12 02:31
beginnerchang
「データが足りなくて証明できなかった」が許されるのはデータ処理業界だけなんだよなぁ
2019/10/12 02:47
hietaro
「最終的には仮説が証明できない、否定的な結果となってしまいましたが、全国的な評価点分布の傾向、そして個別の評価から考えれば、食べログ運営が評価点に何かしら恣意的な操作を加えていることは明らか」
2019/10/12 03:40
tsu_nyan
「3.8→3.6に落としているだけではないようだ」と言ってるだけで、「おかしい」という結論は全く同じに聞こえる。単純な平均ではない=手を加えているという事は公式に告知されているので、それで結論は出ている
2019/10/12 07:43
brimley3
というか食べログの点数で行く店を判断する人がどのくらいいるのかなぁ?感性は人それぞれだぜ。
2019/10/12 07:44
tnal
[?]
2019/10/12 08:20
misopi
駆使駆使ってハム太郎かよ。
2019/10/12 09:55
adramine
そりゃ統計で証明は出来ないわ。というか初投稿でこれは中々香ばしい。
2019/10/12 10:06
mobits
評価する人間は機械じゃないしみんなで同じ問題を解いてるわけでもないので正規分布するとは言えないからワイも懐疑派。3.6は評価者の多数が暗に作ってる壁だったりしないのん。
2019/10/12 10:43
AspergerSyndrome
元無料会員だが、有料会員の方が優先表示されるとしつこく営業されたので、無料会員もやめた。
2019/10/12 11:25
yasudayasu
こんな面倒な上に仮定の入り込むことするより、まずは東京と大阪で共通して見られた傾向が他の45道府県でも見られるか確認した方が良いんでは。
2019/10/12 12:04
vanbraam
食べログの点数分布の問題は,3.6及び3.8近辺で明らかに不連続な事.正規分布してない程度ならこんなに燃えない;会員も無料会員と有料会員(ランクあり)があるから,これだけでカカクコムの主張が正しいとも言えない
2019/10/13 07:10
ookitasaburou
“あらかじめ言っておきますが、本記事では、食べログ3.8仮説は証明できないということを最終的に示します。 以上のことを念頭に置いたうえでお読みいただければ幸いです。”
2019/10/13 23:46
tetsu23
書いてある通り「評価点3.25辺りで非会員割合が増大して」「評価点4.0以降では非会員の割合が減少して」いるのが事実でしょ。雰囲気で言うんじゃなくて、数値があるなら優位な差があるかどうかの統計処理しようよ。