プロフィール

BlueTrain

茨城県

プロフィール詳細

カレンダー

<< 2024/5 >>

1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

検索

:

アーカイブ

アクセスカウンター

  • 今日のアクセス:30
  • 昨日のアクセス:88
  • 総アクセス数:1236543

QRコード

釣りのためのデータサイエンス。大数の法則について。

  • ジャンル:日記/一般
釣りのためのデータサイエンスの記事を書きたいと思います。

なぜ宣言するのかというと、内容が難しいのでうっかり読んでしまうのを防ぐためです。

今回は大数の法則について言及します。

今回の話の裏には不偏分散というものがあり、それはnが小さいと大きくなります。

 
経験からの釣り方について
 
「釣ってないやつが釣り方を語るな」というのは実は正しいです。

正確には「たくさん釣って無いやつが語るな」です。

これは統計学では大数の法則というもので説明できます。


我々が釣った魚のデータというのは統計学では標本といいます。

大前提として、標本には必ず誤差があり、真値を知ることは出来ない、というのはご了承いただきたいです。

例えば、定規で3cm測ったとします、しかし3cmぴったりというのは例えばいくら定規の精度がよくて電子顕微鏡のレベルで見ても長さの誤差は含まれてしまいます。

釣った魚のデータにも誤差が含まれているので、その誤差の範囲内に真値がある、という事は分かりますが、釣った魚が全てという考えはデータサイエンスでは否定されます。

ありがちな例として、ある釣り人が下げ潮の時に5匹魚を釣りました。だから下げ潮の時には誰がやっても5匹魚が釣れます、という事は言えないという事です。


このような例では釣り人100人くらいを用意して満ち潮から下げ潮までずっと釣りして、そのうち下げ潮で100人全員が5匹きっかり釣れたら統計的には意味があると思われます。

これが、2人くらいで実験してたまたま5匹釣れた、という事はありうるという話です。(実際に確率求めてないので起きるかどうかは適当ですけど)

今回書こうと思っていた大数の法則からはズレる話なのですがP値ハッキングといって100人用意して下げ潮で5匹釣れた人だけのデータを用意するようなインチキも存在します。

かなり大雑把に大数の法則を説明すると、誤差というのは

誤差÷データ数 のような形をしているのでデータ数が大きくなると誤差が小さくなりますよ、という話です。


ここでこの大数の法則を使って自分の大好きなヒラメのベイトの話をします。


通説ではヒラメは大きくなると色々なエサを食べだすという事になっています。

自分はこれを論文の中の文言として読んだのですが、ホントかよ、と思いました。

理由はデータ数がヒラメのサイズが大きくなると小さくなるためです。

例えば40cm以下サイズ、レギュラー(40cm以上)、座布団サイズの3つに分けられていたとして40cm以下のサイズはデータ数が3000、レギュラーが50、座布団は5のような極端なデータ数の中ではヒラメが大きくなれば分散も大きくなるので大数の法則が効かなくなると思ったのです。

ソゲサイズやレギュラーサイズでは約4~6割がカタクチイワシであるデータが多く、座布団サイズになると色んなベイトが入っていることが多くなりますが、カタクチを食べなくなるというわけでは無いです。

自分の説では、ヒラメのベイトというのはカタクチだけで、6割がカタクチ、残りの4割は一様分布のその場の環境を反映したベイトになる、と予測しています。

これをシミュレーションに掛けてみました。




これは10匹の座布団を仮定して青がカタクチ、そのほかの色が他のベイトの入っている一様分布を表しています。

それを5回やってみました。

すると6割もカタクチがはいっているはずなのに、そのカタクチと同等くらいのベイトが入っている率がかなり高くなることがわかります。

大数の法則がここにも表れていて、5回じゃなくて100回くらいこの実験をやってみてカタクチ同等のベイトが入っている割合を探ってみるといいかもしれません。

まぁとにかく、座布団に限定するとカタクチが6割も現れないデータが頻発します。

最初の話題に戻って、あまりヒラメの数を釣ってない人が語るヒラメ釣りも、本当は釣れる釣り方と誤差の範囲で起きていることをそのまま語っている釣り方とごっちゃになっている可能性は高いと思われます。


じゃあどれくらい釣ったらいいのか?

統計的に大きい数字と言われているのは100なので、ヒラメ100枚釣れば釣り方を少し語っていいと思われます。

自分の感覚でもまぁソゲ抜きで100枚釣っていれば上級者かなという気はします。

youtubeに出てくるようなサーフヒラメの初心者向け動画というのは内容がいい加減でそこまで釣りこんだ人は居ないです。


まとめると

・過去釣果全てにぴったりあてはまっているというパターンは無い

・釣果から何かを見極めるにはかなりの数(100が目安)を集める必要がある

自分は他の人の釣果というのは怪しい情報も入っていると思うので論文のデータが一番価値があると思います。

例をあげると、ヒラメのコノシロパターンは頻繁に語られていましたが論文ではコノシロパターンは確認できなかったので自分は懐疑的です。

安易な少ない数から言えることを鵜吞みにせずにデータ数を増やして検討することが大事だとおもわれます。

コメントを見る