プロフィール

BlueTrain

茨城県

プロフィール詳細

カレンダー

<< 2024/4 >>

1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

検索

:

アーカイブ

アクセスカウンター

  • 今日のアクセス:110
  • 昨日のアクセス:932
  • 総アクセス数:1231065

QRコード

機械学習を用いてヒラメのサイズを環境変数で分類しました。

  • ジャンル:ニュース

自分はコンビニの店長をやっていて、数字には強かったし、データは好きで毎日見ていたけど、機械学習までには踏み込んでやっていなかった。
理由はデータセットをいじるのがめんどくさそうというのと、プログラミングが面倒だから。
理屈は分かるので調べれば出来るのかもしれないけど、全部理解するのが手間だなぁ、と思っておりました。

しかし、そこにきて全てそれらを解決してくれるchatGPTなる救世主が出現。
これなら分からない事聞いちゃえばなんでも出来ますぞ、という事でやってみました。
自分が興味あるのはサーフヒラメ(ヒラメよりイワシの方が好きなんだけど)。

そこでデータセットでいつもお世話になっているひらめっぱりさんのHPからデータを拝借し、分析してみることにしました。
本当はヒラメの釣果数を分析したかったんだけど、分析するには「釣れていない」データを挿入するのが好ましく、それがとても大変そうなのでサイズについて分析してみることにしました。
分析手法は「決定木」という機械学習方法。

機械学習と聞くと難しいイメージがあるんだけど、関数の中に入れちゃえば結果は返ってくる。
主要な内容機械学習本体はrpart()だけ。
え、と思われるかもしれないけど、やりたければrpart()って書けば誰でも出来る。

機械学習でちょっと骨なのが、データの処理とかデータの解釈なのだ。
分析したいデータが何なのかというと、釣れたヒラメのサイズと地形や潮回りや釣れた時間は関係があるのか?という事。
ヒラメは40cm~80cmくらいまでのデータが入っていて一番多いのは40cm台だろうと推測できる。
逆に座布団80cm以上の大物で、非常に珍しい。それでは、地形や潮回り、釣れた時間がヒラメのサイズにどのような影響を与えるのか、決定木を使って分析していきます。

まず、データを整形し、地形、潮回り、釣れた時間などの情報を持つデータセットを準備します。
次に、rpart()関数を使って決定木のモデルを作成し、学習させます。
モデルができたら、新しいデータに対して予測を行い、精度を評価します。







これが結果。

一番上から分類したデータになっています。

point_船道=0と書いてあってyesとnoで分かれています。

船道=1で他のが0だとすると0であれば、yesとなっているので逆の解釈になります。


これを見ると、船道であれば平均60cmくらいの全体の釣果の3%も釣れているらしいです。

どういうことかというと、このデータ数は301なので、平均60cmのヒラメが10匹も船道で出たことになります。

船道はランカーポイント。

次に大きいサイズが釣れたのが多いのは「地形の変化なし」。

意外ですが、次を見るとなんとなく特徴に気付くと思います。

次は「堤防横」がサイズが大きいです。

即ち、この分析からは、堤防ヒラメはサイズが大きいと言えるという事です。

そしてその次にサイズを分けられているのは「時間」

前回のブログでも紹介した通り、堤防では時間はあまり関係なく、「サーフ」では時間に強相関していることを示しました。

ということは14時前に殆ど釣れているヒラメというのはサイズが小さい、即ちサーフでのヒラメ、という事になります。

これを見ると、70%のヒラメは14時前に釣れている模様。






今回はブログの訂正をchatGPTにやらせてみたんだけど、バッサリとカットしやがって自分が面白いと思っている数式の説明を釣りブログには難解だからという理由で削除されてしまった。


以下はchatGPTによる自分の意見を分かりやすくしてもらった文章。


データ分析により、堤防で釣れたヒラメのサイズが大きいことがわかりましたが、これだけでは堤防に大きなヒラメしかいないのか、またはサーフで釣れる大きなヒラメと同じ確率で釣れるのかは不明です。両方の場所で大きなヒラメが同じ確率で釣れる可能性もありますが、サーフでは小さなヒラメが多く釣れる傾向があるかもしれません。この疑問を解決するためには、さらに詳細なデータ分析が求められます。


ということらしいです。

chatGPTは素晴らしいけど、自分の文章はそれはそれで面白いと思って自分で書いているので、こんなまとまった文章は自分じゃ絶対に書かない。

自分はサーフで小さいヒラメが釣れるのはシラスの影響だろうと思うし、それが波で打ち寄せられる性質があるためで、漁港では波が無い為にシラスが少ないからサイズがデカいと言えるかもしれない。

その考えだと漁港=デカいヒラメなのか、それともサーフでも大きいヒラメが釣れる確率は同じなのかもしれない。

ただ、小さいサイズのヒラメはサーフには多いわけだ。

そういうわけで、是非機械学習をやってみてください。

chatGPTを使って勉強すればそこそこ簡単にできます。

コメントを見る