Menu
noborders3.com

信州からの投げ釣り

ChatGPTで全投稿の釣果データを一覧化
2025/12/16

ChatGPTで全投稿の釣果データを一覧化

ずいぶん長く続けているこのブログ。一度、記載されている釣果をまとめてみたかったんですよね。
膨大な量の各投稿ページの解析について、ChatGPTやGeminiなどAIサービス単体での完結は困難だったけど、Python(プログラミング言語)を使うことで簡単にできました。

作業を超シンプルに説明すると、「ChatGPTに教えてもらいながら、Pythonを使って全てのブログ記事を自動で解析し、釣果データを一覧化する」というものです。

ChatGPTによるPythonコード作成

以下は、今回の作業のプロンプトです。

https://noborders3.com

私が運営しているこの投げ釣りブログに掲載されているすべての投稿記事を解析し、各記事から釣果情報を抽出して、一覧(データベース用リスト)を作成したい。

【解析対象】
・ブログ内のすべての投稿記事(年代問わず)

【抽出したい項目】
・日付
・場所
・天候
・魚種
・匹数
・サイズ
・海岸からの距離(色数など)

【抽出ルール】
・場所は、可能な限り「ピンポイントの地名(○○海岸、○○浜、○○漁港など)」を優先
・魚種は、実際に釣れた魚のみを対象(「ばらした」「掛かったが取れなかった」など、釣れていない表現は除外)
・魚種の記載が複数ある場合は、釣果として成立しているものをすべて抽出する
・数値が無い場合でも、「ポロポロ」「良型」「ピン」などの定性的表現は抽出対象とする
・該当情報が無い項目は空欄でよい

私はWeb系言語ぐらいしかわからなくてPythonは全くの素人だけど、チャッピーがその方法を指示してくれるので、コピペ作業です。

"場所","天候","魚種"など、どんな内容を抽出してリストにしたいかを考えて、チャッピーにPythonのコードを作成してもらい、py形式で保存します。

そのファイルをPowerShellなどで実行するだけ。xlsxとcsvでリストが吐き出されます。

>> 全体版PDFはコチラ ※未調整の自動生成結果

こんな感じです。
何が凄いって、そもそも釣果をデータベース化することなぞ一切考えずに書きなぐっているブログなので、表現がめちゃくちゃなのに、それを項目の値として抽出できている。すげぇw
しかも、このブログは手打ちコーディングなので、昔の投稿ほど文書構造もぐちゃぐちゃなのに、ちゃんと拾うべき情報を精査している。精度はPythonコードの修正で、より正確に調整できる。

もし、ちゃんとしたデータベースコンテンツを作りたいのであれば、このリストを参考に、記事の曖昧な表現を潰していくだけでかなりの完成度になるなぁ。
たぶんやんないけどw

コメントする