2022/06/02 14:39
togetter
こういう視点を1つのパターンとして持っておくといいのかも。
2022/06/02 15:33
petronius7
昔古いAIの遺伝的プログラミングを使った経験ではまずデータをかき集め、AIに規則性を見つけさせ、その原因は何故かと仮説を立てて問題を解決したので、逆のアプローチもあるのです。
2022/06/02 16:46
tomiyai
仮説検証に適したデータをたまたま持ってるなら仮説が後になることはあるが普通は仮説がないと検証の条件満たしたデータが取れんからね。↓の例もまずデータをかき集める段階である程度の仮説は立ててるだろうし。
2022/06/02 16:50
osoma02
データから始めるっていうのは、医者に対して患者が「なんとなーく今調子悪い気がするんですけど、今より快調になる方法ないっすかね?」と言ってかかりに行くようなもんだ。
2022/06/02 16:50
akanama
偉い人「ガラガラポンで何かいい感じの方向性出しといてよ」(責任逃れ)
2022/06/02 16:54
meganeya3
データからプロット見て仮説検討もふつうだと思います。定常系でなんらかの変化があってパフォーマンスが下がったりする場合、先回りして対応はできない
2022/06/02 17:11
take-it
仮説思考とかいうけど、どうしてもただの確証バイアスに陥る気がしてダメだった。無闇にデータを見るより、ある程度「こうじゃね?」と当たりをつけた方が効率がいいのは頭では理解できるんだが。
2022/06/02 17:17
sqrt
ファインマントラップの話?
2022/06/02 17:18
dekaino
帰納(induction)、演繹(deduction)、遡因推理(abduction) どれも重要。バランスよく使おうぜ。
2022/06/02 17:37
flirt774
問題を設定するのが難しくてデータを見て仮説を設定して裏付けを探すためにデータを見て、となりやすいかも。問題を探るのが一番難しそう
2022/06/02 17:53
table
『仮説が先、データが後』は何を言ったかより誰が言ったかが重要視されるよね。1年中、事業のことを考えてる人の仮説と、素人の思いつきには全く別物だ。インプット大事。
2022/06/02 18:00
getcha
極端すぎる話を目にするのが多すぎるは、ネットの特性なんだろうか。データが先の場合もあるし、何も考えずにデータをこねくり回してると仮説が生まれる事もあるでしょ。
2022/06/02 18:16
underd
どっちのパターンもあるしどっちが優れてるとかではない気がするけど
2022/06/02 18:38
slimebeth
「おむつを買いに来るとビールを買いたくなるのではないか?よし、この仮説をデータで検証してみよう!」(これ自体は実話じゃなかったらしいですが)
2022/06/02 18:43
suisuin
科学でもビジネスでも漫然とデータから考えてもせいぜい小改善レベルの変化しかないのはわかる。飛躍レベルは仮説ありきでないとまず起こらない
2022/06/02 18:53
btei
天体観測
2022/06/02 19:09
chintaro3
わかりやすい業績を上げることが目的になっちゃうとそうなるよね。
2022/06/02 19:24
differential
いや両方やろ。仮説考えるのとデータ見るのは最低2往復。仮説だけ考えると見えなくなる動きはあるし、データだけ見ても策は出てこない
2022/06/02 19:25
aya_momo
考え方が古いのでは。
2022/06/02 19:58
kurotsuraherasagi
実験とか分析とかするときに、具体的なゴールは見えてたほうが効率いいとは思う。「ゴールを定めるためにとりあえず手を動かす」ができる人はそれなりに玄人で、初心者が形だけ真似してもうまくいかない…(私です)
2022/06/02 20:08
tettekete37564
仮説って現象=データから立てるものだからどちらが先ってのも変な話。仮説優先にすると確証バイアスに陥ると思う
2022/06/02 20:11
saiyu99sp
仮説はあるけどデータが取れない(物理)
2022/06/02 20:17
tekmak
データがまだ無いところにも補助線引いてよしとする感じかな
2022/06/02 20:33
yancy1969
おいおい、探索的データ分析はどこへいった?
2022/06/02 20:38
turanukimaru
少なくとも論文は仮説が先。でなければ「何の論文」かが曖昧になり査読評価が「何の話をしてるのか分からない」になる。研究でも「たまたまそうなった」と「これ以外にあり得ない」が区別できない偽論文につながる。
2022/06/02 20:58
acealpha
何もわかってない上司がデータドリブンで新規企画を打ち出せとか言い出すのが駄目だ、と言えばどれだけ愚鈍なことかわかるかな? ホントに死ねボケ(たまの口の悪さ
2022/06/02 21:04
miki3k
別にこんなんなんでもいいんです。データの羅列から気づく場合があってもいい。捨てる必要はないかな
2022/06/02 21:04
suikyojin
仮説が無いと、一般には、データが無い。データを得るためには、コストがかかる。仮説が無い場合は、データを得るコストは省かれる。
2022/06/02 21:07
steel_eel
データを見てから仮説を立てることはHARKing(Hypothesizing after the results are known)と呼ばれていて、(なんかあんまり真面目に不正だとは思われてないっぽい気がするが)代表的な研究不正のひとつです。
2022/06/02 21:21
nuara
仮説検定するなら先になければならないということ。使う統計による。
2022/06/02 21:23
crowzz
もっともらしい仮説を立てるためにデータをいっぱい見ることが必要になるのでは?
2022/06/02 21:25
nori__3
何から仮説をたてるの?データ→仮説→データ→論証かなぁ
2022/06/02 21:25
urandom
理論を知らない人がデータを漫然とこねくり回して妙なものを「発見」してしまっている例はよく見る。まあどっちに片寄りすぎるのもよくないんだろうけどね。
2022/06/02 21:38
apipix
「そういうケースもあるけど、そうでないケースもあるよねー!」で終わる話。
2022/06/02 22:10
tianbale-battle
警察とか検察みたいに仮説ありきで証拠を勝手に解釈する事もあるから、その順番が必ずしもいいわけではないだろね
2022/06/02 22:24
Gucchan
確証バイアスに気をつける。仮説ドリブンにやるなら仮説を確認する方法を初めに定めて、途中で方法論や解釈を曲げない。が必要でしょうねぇ。でもEDAも大切よ。仮説を立てる前提となる暗黙知が変わるとかあり得るし。
2022/06/02 22:34
test9
そうだねとしか。分析は基本課題ありきだからデータドリブンの場合でも疑問、課題(問い)設定してから開始するので仮設が先になる
2022/06/02 22:40
Phenomenon
仮説→データ見る→違うな→仮説2→データ見る→違うな→仮説3→データ見る→違うな→仮説4→データ見る→違うな→仮説5→データ見る→まあだいたいこんな感じかなあ
2022/06/02 22:44
PrivateIntMain
今データがある人の悩みなので、データが無い人は悩まずにデータ集めから開始です。めんどい?時間かかる?そういうものです。
2022/06/02 23:24
kjin
自分の立ち位置、そのデータとはどう認識されると考えるか、仮説はどこから来てると思うか、等しっちゃかめっちゃかになりそう。
2022/06/02 23:29
htnmiki
どっちが先でもいいけどそういうのは「仕事」なので私には関係ないな。私は末端で「作業」しかできないボンクラです。
2022/06/02 23:36
wiz7
仮説生成と仮説検証どっちが大事という観点は何か違う気がする、知らんけど
2022/06/02 23:52
dacksf25
こんなの経営学で研究されて事例紹介されてたのは1990年代の話だよ。。。今は同時に回してニュートラルに見るんだよ。
2022/06/03 00:02
gcyn
「仮説が後」だと、データ全部とり直しとか、データとる際の前提条件検討し直しとか、手元にあるデータにあとちょっとの裏付けが要るのを見て見ぬ振りしたりすることになったりするから戒めとして大切な気はします。
2022/06/03 00:20
ikura_chan
なんか医療データ総当たりで解析したら思ってもみなかった疾病の治療効果があったみたいな研究もあったと思うのでどっちも大事ですよ。
2022/06/03 00:27
takilog
場合によるのでは
2022/06/03 00:46
a446
学生の時に言われた研究の手法は仮説が先だな。仮説をもとにデータのとり方を考える。マーケティング的なのは逆でもいいんじゃない
2022/06/03 01:08
T-norf
バイオ実験系だと、(データ取得コストが高く)特定の仮説検証用のデータだけを取り、仮説が悪いand/or実験の腕が悪いで悩むのがパターンで、まあ仮説先行は一緒なんだけど、モヤモヤするぞ笑
2022/06/03 01:27
maketexlsr
仮説もそうだけど、せめて"問い"は確立してから作業に入ってほしい😭
2022/06/03 01:37
xorzx
データは好きに加工出来るのでデータから作った仮説だけでは不十分。仮説から検証実験やってデータを取らないと意味がない。
2022/06/03 01:38
uzusayuu
これは、仮説の検証のためのデータは仮説の後でルールに従ってとるべき、という事ではないのかな?一部の学術分野では実験を始める前に実験手法と目的等を登録してから始めないと正当と認められないと聞くが。
2022/06/03 01:39
Betty999
いくら仮説立てても、データがないんだよ! これが現実。
2022/06/03 02:20
monopole
ナニモンだぁ?と思ってみたら自称データサイエンティストのコンサル崩れか。そっ閉じ。。。
2022/06/03 02:59
y_u_s_u_k_e
鶏が先か卵が先か
2022/06/03 03:02
privates
すいません、その「最初の仮説は何処から」やって来るのですか?ヒラメキ?カン?「少ない結果というデータ」では?
2022/06/03 03:40
restroom
マーケティングではそうかもしれません。科学一般ではいろいろ。
2022/06/03 04:31
ippeichangg
マーケティングと学術的探求心だと目的が違うのでアプローチが異なるってことだと思うけど。
2022/06/03 04:37
oka_mailer
仮説を否定できるかも検証するなら。「アベノマスクのおかげで不織布マスクの価格が下がった」って仮説に拘って、一ヶ月近いタイムラグも「記者発表の効果だ」みたいな解釈に陥ったりするからね。
2022/06/03 04:51
SndOp
どうしても冤罪とかを考えちゃうな
2022/06/03 05:09
ya--mada
ネット動画で有名な成田祐輔さんなどは、典型的な仮説ヶ崎なんじゃないかな。企業がデータサイエンティスト雇って何かしようとすると、そこに有るデータに何かを組み合わせてストーリーを構築する事になる、と思う。
2022/06/03 06:30
gairasu
どっちかが先になる一方通行というか、循環だと思ってるわ
2022/06/03 06:40
kgkaaz
科学をカジったこと無い人の浅知恵。多くの大発見が意図せぬデータから生まれてる訳で、通常、データが後に来るのはデータ収集にコストが掛かる為です。既に良いデータがあるならデータを見つめるのも良い方法
2022/06/03 06:42
rolophus
仮説と、その反証とを両方データから見出そうとしないといけないと受け取りました
2022/06/03 06:57
zfufufufufu
筆者は、上司の糞仮説に付き合わされる辛さをまだ知らない。(上司はデータを信じない)
2022/06/03 07:22
HaJK334
具体例が無いと何が問題か分かり辛いと思うので00年代以降の学力調査の例を挙げておきます bit.ly
2022/06/03 07:46
sds-page
HARKingはデータを見てから仮説を立てる事じゃなくて、仮説立ててデータ集めてデータ見て「最初からこういう仮説でした」と偽る事じゃね
2022/06/03 07:52
respectbookmark
パワポ画像込みメソッド
2022/06/03 07:56
circled
科学者が宗教批判する時に、哲学者が「お前らの科学とやらは仮説という想像を信じるところから始まってるから、始めから起きた出来事を基に信じてる宗教よりも実は酷いぞ?」と突っ込んでるのを見た時は衝撃だった。
2022/06/03 08:06
jaguarsan
仮説思考に必要なのは、仮説に反するデータを真面目に探す態度だよ。そこ怠るとデータを後にしたところで都合良くサンプリングするだけ
2022/06/03 08:10
imash
仮説を観察と洞察というなら、観察とはデータ取得なわけで、データ先に取ってますよね。詳細データは後という話ならわかる。
2022/06/03 08:15
flowerload
“仮説とは何か。私は観察と洞察だと捉えました”だったらデータを先に観察してから洞察して仮説を立ててもいいのでは…?
2022/06/03 08:46
mujisoshina
仮説→検証→仮説→検証…のサイクルを何周も回すことで精度が高まる。どちらが先かと考えるレベルならおそらくどちらも足りていない。先行研究を最初の仮説の前の検証とすれば過去のサイクルを利用する事ができる。
2022/06/03 08:49
anigoka
認識が20〜30年前の教科書並みの古さ 最先端のフィールドではそんなかったるいサイクルで研究してたら死ぬ 古書店で術書読んでるのか疑うレベル
2022/06/03 09:00
unfallen_castle
仮説が重要なのはそれはそうだけど、どちらかというと「仮説に反するデータが出た時、きちんと仮説を見直せる/放棄出来るかどうか」がより重要だし出来る人少ないと思う
2022/06/03 09:02
Diomedeidae
実験計画法における狭義の"仮説"の扱いはこのとおりで、データドリブンで広義の"仮説"を立てるのは普通にある。"仮説"の語義が色々あってややこしい。
2022/06/03 09:16
taiyousunsun
データで仮説が否定された時にそれを受け入れられることは大前提として、筋のいい仮説を立てることの重要さは大学での短い研究の間でも感じた。
2022/06/03 09:16
hrmitsumane
こういうのみて 『仮説が先、データが後』なんだ!! すごい!! て見るけど、ブコメ見て『両方向からやれ!』『確定バイアスなるやろ』 て言われて、たしかに🤔 てなる。 なんかニワトリみたいな頭で悲しくなる🐓
2022/06/03 09:22
sin4xe1
まず仮説を持つことが重要であるという仮説
2022/06/03 09:33
ysync
重要とか大切ってのがまず仮説にすぎないのでは?/AIはデータから人が気づかないパラメータをすくい上げて、そこを試行錯誤ぶん回すんじゃないの?(よくわかってない)
2022/06/03 09:47
napsucks
クラスタリング全否定かな?
2022/06/03 09:58
mayumayu_nimolove
単純にデータ引っ張ってくるの大変だからでしょ
2022/06/03 10:42
m0zz-neko
仮説検証はサイクルだろ、、仮説はあくまでも仮説
2022/06/03 10:42
Sei
人間中心設計やってると利用者視点ばかりに目がいって結果車ではなく速い馬車を作りがちになるケースも少なくなく、最初にある程度指針になる仮説が組み立てられないとマズイ。結局バイアスとどう向き合うかに尽きる
2022/06/03 11:43
deep_one
まあ「データを眺めて、仮説を立てて、さらにデータを集める」のだけどな。
2022/06/03 12:00
dgwingtong
人間の限界。仮説から始めないと森羅万象のデータから規則性を見つけられない。偏見や先入観が分析には必要
2022/06/03 12:20
kenitikitani
両方なのは当然で、この人もデータ分析には2つの役割があると言っている。先に仮説を立てないで無闇に分析ばかりしているケースが多いという苦言だろう。
2022/06/03 12:25
nyaromi
データをこねくり返して〜っていうのは、データを使った仮説構築してるので、これも仮説が先って例だよ。データが先っていうのは、このデータ使ってなにかするっていうそのデータを使うことが条件になってることでは
2022/06/03 12:33
snowcrush
バイアスに気をつける、仮説が否定されることを受け入れる、がセットならまあそうやろなと。あととっかかりがない時に先行データを眺めて仮説を立てるというケースはある。
2022/06/04 01:38
ys0000
これは単にドメイン知識の話で、当たりもつけずに闇雲にデータだけみてもなぁということでしょう。前提知識なしでデータだけ見ても擬似相関すら見抜けないだろう。
2022/06/04 20:55
cafeen
大企業に仮説を送ると新卒じゃ受からないのかのぉ。