過去のゴルフスコアのデータは、スマートフォンで記録しているが、Golf Network・GDO・楽天ゴルフの3つ、何故乗り換えたのかはよく覚えていないけど、有料化や使いやすさからかもしれないが、これらのデータを1本化してデーターベース化して、自前のスコア管理アプリを作成する。
GDO以外は、Webサイトでデータを閲覧できるがデータ化しずらいし、エクスポートには対応していないので、スコアの詳細画面をスクリーンショットを撮って、それを Claude API を使用し画像処理してデーター化する。
Anthropic APIは画像をテキストに置き換えるサービスではなく、AIが画像を「見て理解して」質問に答えたり、データを抽出したりするサービス。
スコアカードの画像をPythonでBase64に変換
Claude APIに「この画像のFW方向を読み取ってJSON形式で返して」と依頼
ClaudeがAIとして画像を解析してJSONを返す
そのJSONをDBに保存
OCR(文字認識)とは違い、ClaudeはAIとして画像全体を理解するので、矢印の方向や○の位置なども判断が可能。
Claude APIとは何か:Claude APIの最大の特徴は、高度なOCR(光学文字認識)と視覚的推論能力を兼ね備えている点です。レシートや名刺といった日常的なドキュメントから、複雑なグラフやUI画面まで、幅広い画像タイプに対応。
つまり単純な「テキスト置換」ではなく、AIが画像を見て内容を理解・判断して答えるサービス。今回のゴルフアプリでは「矢印が左向き→left」「○がある→fairway」といったAIによる判断をさせる。
ゴルフスコアをClaude API で、読み込む時の注意事項
IN OUT 西 東等のコース情報も取得する
2グリーンがあるゴルフ場は、グリーン情報も取得する
ホール番号も取得する
数字・漢字の取得精度は高いので、ハーフの小計、合計も取得すれば、チェックが可能
矢印や丸印の取得はやや精度が低い
GDOアプリのスコアは、フェアウェイキープ欄とパーオン欄が別個にあるので、それを指示する
IN OUT 西 東等のコース情報も取得する
2グリーンがあるゴルフ場は、グリーン情報も取得する
ホール番号も取得する
数字・漢字の取得精度は高いので、ハーフの小計、合計も取得すれば、チェックが可能
矢印や丸印の取得はやや精度が低い
GDOアプリのスコアは、フェアウェイキープ欄とパーオン欄が別個にあるので、それを指示する