2021/05/06 16:01
jovi0608
連休中の宿題として書きました。今世間を賑わせているChromeのFLoCについての技術解説です。
2021/05/06 16:18
suzu_v
わかりやすかった
2021/05/06 16:37
wataken44
たすかる
2021/05/06 17:04
koyhoge
仕組みはよくわかったのだけど、その人の見ているサイトの全ドメインから CohortId が分かったとして何が嬉しいのだろう? 7日間有効な追跡番号が得られるということ?
2021/05/06 18:18
unsoluble_sugar
めも
2021/05/06 18:55
ssssschang
1はいいけど2,3は疾く滅びてほしい。僕の見えないとこで僕の情報を使うな
2021/05/06 18:57
denqueue
FLoCのアルゴリズムが詳説されていてありがたい。CityHashでドメイン履歴を2^64次元の疎ベクトルに変換→それをLSH(SimHash)で50bitのハッシュ値に変換して利用。/そもそもFLは利用されていないのかよという驚きがある
2021/05/06 20:52
mio2mi
FLoC の実装
2021/05/06 21:28
typex2
「ユーザが7日間に1000ドメインも閲覧することはなく」って前提は成り立たない気がする。サイトによっては組み込んでいるアドネットワークが呆れるほどすさまじい数のドメインと通信させるよね。。
2021/05/06 22:05
daikikohara
助かる。こんなに詳細な日本語記事が出てくるなんて素晴らしい。
2021/05/06 22:33
yosuke_furukawa
面白かった。閲覧履歴の7日間分使ってグルーピングして、そのグルーピングされたidを使って興味対象カテゴリと結びつけるのね。知らないことだらけだった
2021/05/06 23:30
mkusunok
面白いけど運用が重そう
2021/05/06 23:44
p1ass
面白かった
2021/05/06 23:49
hitode909
おもしろい
2021/05/06 23:51
tmatsuu
わいわい
2021/05/06 23:57
efcl
FLoCの仕組み。 ブラウザ履歴から作ったSimHashをChrome Syncを経由してGoogleへ送信して、Googleがカテゴライズしたコホートのデータをブラウザに送って分類する
2021/05/07 02:22
hc0001
属するコホートを算出するために、どこかしらで閲覧履歴と集計データを突き合わせる必要がありそうに見えていて、どうやって端末のブラウザで完結させるのか理解しきれていない。
2021/05/07 04:25
a_ako
今まで読んだどの記事より一番分かりやすかった。検証感謝
2021/05/07 04:25
rryu
「Cohort Id 内に含まれるドメインを洗い出し」の部分が謎すぎる。それができるならハッシュ化している意味が無いような。
2021/05/07 06:12
fujihiro0
素晴らしい。
2021/05/07 07:05
sharaku3eyes
面白い
2021/05/07 07:24
side_tana
ははあん
2021/05/07 08:06
tagomoris
詳しい / あれ、結局SimHashをGoogleアカウントと紐づいた状態でGoogleに送ってCohort idを計算させてる? ブラウザ内で計算するから安心て話なんじゃなかったっけ?
2021/05/07 08:35
onody_onody
FLoC気になっていたのでありがたい。
2021/05/07 08:38
send
こんなに早く日本語での詳細記事が出てくるとは思っていなかった。素晴らしい
2021/05/07 08:46
acealpha
広く協調フィルタ技術 ブラウザ内でランダム生成されたベクトルと演算し、シードを共通にすることでユーザ間の結果が揃いつつ、具体閲覧コンテンツを晒すことなく類似度兼IDの50bitが発行される
2021/05/07 09:07
t_motooka
中身ほとんど知らなかったので後で読む
2021/05/07 10:37
moromoro
後でもっかい読む > 一般のユーザが7日間に1000ドメインも閲覧することはなく //えっ
2021/05/07 11:48
programmablekinoko
これ統計なんかにも応用できそうだよな、アルゴリズム的にはすごく洗練されている(小学生並みの感想)
2021/05/07 11:57
deep_one
「データを多次元ベクトルで表現し、データ間の近さを表す指標としてベクトルの角度を利用します」特性情報をベクトルで表現するの別の何かで見たな。
2021/05/07 12:32
daira4000
現状だと結局Googleにはデータを握られるように見えるけど圧縮した時点で具体的には分からなくなるからいいのかな
2021/05/07 13:24
field_combat
あとで読もう
2021/05/07 13:32
isrc
ユーザの閲覧行動をブラウザ内に閉じた処理で数値化し、それを数千人単位にまとめる/ Locality Sensitive Hash(LSH: 局所性鋭敏型ハッシュ) は、似ているデータを近いハッシュ値に変換/センシティブ情報のブロック
2021/05/07 14:13
h_taiji
覚えとく
2021/05/07 16:36
roshi
一意性と類似性をどう両立させるのか気になってたけどそういうハッシュ計算があるのかー。ぱっと見落とし所としては無難な気がするけど時系列にCohortIdの動きを蓄積して追えば個人を特定できたりするんだろうか。
2021/05/08 22:15
T-miura
ドメインのアクセス履歴でクラスタリングなんだ、、。クラスタの興味の粒度あらそ、、、
2021/05/09 22:53
tkmkg8m
詳細な分析と報告に感謝