釣りの家の記録 https://www.fimosw.com/ 釣果情報・シーバス、メバル、イカ、チヌ、青物、ヒラメ、マゴチ...ソルトアングラー支援サイト、日本最大のWEB釣り大会『凄腕』、釣り動画fimoTVなど(会員登録無料) ja 釣りのためのデータサイエンス。大数の法則について。 https://www.fimosw.com/u/bluetrain/mdpseodedf328j 2024-04-22T03:44:00+09:00
なぜ宣言するのかというと、内容が難しいのでうっかり読んでしまうのを防ぐためです。

今回は大数の法則について言及します。

今回の話の裏には不偏分散というものがあり、それはnが小さいと大きくなります。

 
経験からの釣り方について
 
「釣ってないやつが釣り方を語るな」というのは実は正しいです。

正確には「たくさん釣って無いやつが語るな」です。

これは統計学では大数の法則というもので説明できます。


我々が釣った魚のデータというのは統計学では標本といいます。

大前提として、標本には必ず誤差があり、真値を知ることは出来ない、というのはご了承いただきたいです。

例えば、定規で3cm測ったとします、しかし3cmぴったりというのは例えばいくら定規の精度がよくて電子顕微鏡のレベルで見ても長さの誤差は含まれてしまいます。

釣った魚のデータにも誤差が含まれているので、その誤差の範囲内に真値がある、という事は分かりますが、釣った魚が全てという考えはデータサイエンスでは否定されます。

ありがちな例として、ある釣り人が下げ潮の時に5匹魚を釣りました。だから下げ潮の時には誰がやっても5匹魚が釣れます、という事は言えないという事です。


このような例では釣り人100人くらいを用意して満ち潮から下げ潮までずっと釣りして、そのうち下げ潮で100人全員が5匹きっかり釣れたら統計的には意味があると思われます。

これが、2人くらいで実験してたまたま5匹釣れた、という事はありうるという話です。(実際に確率求めてないので起きるかどうかは適当ですけど)

今回書こうと思っていた大数の法則からはズレる話なのですがP値ハッキングといって100人用意して下げ潮で5匹釣れた人だけのデータを用意するようなインチキも存在します。

かなり大雑把に大数の法則を説明すると、誤差というのは

誤差÷データ数 のような形をしているのでデータ数が大きくなると誤差が小さくなりますよ、という話です。


ここでこの大数の法則を使って自分の大好きなヒラメのベイトの話をします。


通説ではヒラメは大きくなると色々なエサを食べだすという事になっています。

自分はこれを論文の中の文言として読んだのですが、ホントかよ、と思いました。

理由はデータ数がヒラメのサイズが大きくなると小さくなるためです。

例えば40cm以下サイズ、レギュラー(40cm以上)、座布団サイズの3つに分けられていたとして40cm以下のサイズはデータ数が3000、レギュラーが50、座布団は5のような極端なデータ数の中ではヒラメが大きくなれば分散も大きくなるので大数の法則が効かなくなると思ったのです。

ソゲサイズやレギュラーサイズでは約4~6割がカタクチイワシであるデータが多く、座布団サイズになると色んなベイトが入っていることが多くなりますが、カタクチを食べなくなるというわけでは無いです。

自分の説では、ヒラメのベイトというのはカタクチだけで、6割がカタクチ、残りの4割は一様分布のその場の環境を反映したベイトになる、と予測しています。

これをシミュレーションに掛けてみました。




これは10匹の座布団を仮定して青がカタクチ、そのほかの色が他のベイトの入っている一様分布を表しています。

それを5回やってみました。

すると6割もカタクチがはいっているはずなのに、そのカタクチと同等くらいのベイトが入っている率がかなり高くなることがわかります。

大数の法則がここにも表れていて、5回じゃなくて100回くらいこの実験をやってみてカタクチ同等のベイトが入っている割合を探ってみるといいかもしれません。

まぁとにかく、座布団に限定するとカタクチが6割も現れないデータが頻発します。

最初の話題に戻って、あまりヒラメの数を釣ってない人が語るヒラメ釣りも、本当は釣れる釣り方と誤差の範囲で起きていることをそのまま語っている釣り方とごっちゃになっている可能性は高いと思われます。


じゃあどれくらい釣ったらいいのか?

統計的に大きい数字と言われているのは100なので、ヒラメ100枚釣れば釣り方を少し語っていいと思われます。

自分の感覚でもまぁソゲ抜きで100枚釣っていれば上級者かなという気はします。

youtubeに出てくるようなサーフヒラメの初心者向け動画というのは内容がいい加減でそこまで釣りこんだ人は居ないです。


まとめると

・過去釣果全てにぴったりあてはまっているというパターンは無い

・釣果から何かを見極めるにはかなりの数(100が目安)を集める必要がある

自分は他の人の釣果というのは怪しい情報も入っていると思うので論文のデータが一番価値があると思います。

例をあげると、ヒラメのコノシロパターンは頻繁に語られていましたが論文ではコノシロパターンは確認できなかったので自分は懐疑的です。

安易な少ない数から言えることを鵜吞みにせずにデータ数を増やして検討することが大事だとおもわれます。]]>
BlueTrain
3月の茨城の海流とカタクチについて。 https://www.fimosw.com/u/bluetrain/mdpseodswozeih 2024-03-30T19:17:00+09:00
カタクチには沿岸性と沖合性の2種類が居てしかも食性が違う、との事。

いくつかの論文によると、カタクチは時期によって海流で入ってくるパターンと植物プランクトン(クロロフィル)によって入ってくるパターンがあるようだ。


鹿島灘(常磐エリア)の場合、2~5月くらいまでは海流によってのみカタクチが入ってくる、とのことだった。



じゃあこの時期は上記の海流見て等高線が凸になって当っている場所を探せばカタクチパターンが再現できるじゃないか、と思い、今年は海流を中心にランガンしてみた。

等高線の形から上記の場合は県央だろう。


これは3月22日の形でやはりこれも県央から県北といった感じ。

外房、勝浦近辺も流れが当たっているがそこまで行くのは骨だ。

ただ、カタクチが入ってきているという話はSNSで流れては来ている。


県央は実際どうだったか?

SNSを見る限り、まぁまぁ釣れているようだったし、自分が釣りに行った時も残念ながらヒットとはならなかったがヒラメが跳ねはした。

根掛ったマットをずる引きしていたらびっくりしたヒラメが跳ねた。


海流はカタクチパターンの再現性が取れている、と自分は判断している。

ヒラメだけの釣果でカタクチパターンが再現できたって言っていいのかというと、船の釣果や情報も加味して整合性を取っているのでほぼ間違いない。

船と岸の釣果というのはかなり連動しているというのは分かっていることでもある。(これもデータを取って分析やってもいいかもしれない。)


海流と釣果が関係しているとは自分は昔から言っているので知ってはいたが、ここ数年の研究によって、夏になってくると今度はクロロフィルを考慮して沿岸性のカタクチを狙うようになるのが理論が進化したところ。

クロロフィルについても研究は進んでいて、その海独自の、「クロロフィルの育ち安い場所」というのが存在したりするのでいつか書いていきたい。




海流については、CNNを用いた衛星画像とヒラメの釣果についても調べてみた。

CNNというのは画像認識の分野では未だ最先端の一角を担っているAIの技法。


これによって海流とヒラメの釣果の関連性も調べることが出来た。

海流図を入れると平均釣果の予測が出来る。

もっと詳しいデータさえあれば、ヒラメは完全に分析できるだろう。

そこまで掘りつくして釣りとして面白さが残るのかどうかは別問題だけど。]]>
BlueTrain