2025年7月25日金曜日

📘 Anago-rhythm システム設計書(v.1.0)


1. 概要

「Anago-rhythm」は、Google Gemini API(モデル:Gemini 2.5 Flash)を活用して、PDF形式の日本語建築見積書を解析・構造化・金額検算するAIベースのWebアプリケーションです。
完全なクライアント処理により、ユーザーの見積書をサーバーへ送信することなく、安心して利用できます。


2. 主な機能

  • PDF見積書をドラッグ&ドロップでアップロード
  • PDF.js によるテキスト抽出(ブラウザ内処理)
  • Gemini 2.5 Flash API に構造解析リクエスト送信
  • 階層構造の可視化(React + Tailwind CSS)
  • 金額誤差や集計ミスの検出とハイライト表示
  • Gemini APIキーの保存(初回のみ、localStorage利用)
  • Firestore による利用回数カウント・Proユーザー判定

3. 技術スタック

種別使用技術
フロントエンドReact + TypeScript + Vite
UI設計Tailwind CSS
AI解析Google Gemini 2.5 Flash
処理構成クライアントオンリー構成(サーバーレス)
デプロイ先Vercel(一般公開URL)
PDF処理PDF.js
ストレージlocalStorage(APIキーのみ)

4. Gemini API利用(2025年7月時点)

ライブラリ:@google/generative-ai v1.9.0
モデル名:gemini-pro

💰 料金目安

項目単価備考
入力(prompt)$0.000125 / 1,000 tokens約1ページ=2,000 tokens
出力(response)$0.000375 / 1,000 tokens約1回答=2,000〜4,000 tokens

🔍 試算例

1見積書(20ページ程度):合計 40,000〜60,000 tokens → 約 $0.02〜$0.06/件


5. セキュリティとプライバシー

  • APIキーはローカルにのみ保存(localStorage)
  • PDFファイルは外部送信されず、完全なブラウザ内処理
  • Firestoreには、メールアドレスと利用回数のみ記録
  • Gemini APIは Google のエンタープライズ仕様により、送信データを学習対象としない

※ Vercel自体にはパスワード保護機能はありません。別途ベーシック認証の実装が必要です(現状未対応)。


6. 処理フロー図(テキストベース)

PDF アップロード
   ↓
PDF.js によるテキスト抽出
   ↓
Gemini API にプロンプト送信(構造解析リクエスト)
   ↓
JSON形式で解析結果を受信
   ↓
金額階層と小計・合計構造を構築
   ↓
検算ロジックにより整合性チェック
   ↓
React UIで表示(NG箇所に赤枠・強調)

※ 折りたたみ機能は非対応(全階層展開表示)


7. OCR処理済PDFの作成

スキャンPDFはそのままではAI処理不可。事前にOCR処理が必須です。

🧭 手順(Adobe Acrobat Pro)

  1. PDFをAcrobatで開く
  2. 右側の「スキャンとOCR」ツールを選択
  3. 「このファイルを認識」を実行(言語:日本語)
  4. 文字が選択できる状態にして保存
  5. 本アプリにアップロード

8. 法的免責・利用上の注意

  • 本アプリは AI を用いた自動検証結果を表示するものであり、正確性や網羅性を保証しません
  • 検証結果に基づく判断・請求・契約等は、すべて利用者の責任で行ってください
  • 運営者は、誤解析・誤認識によって生じたいかなる損害に対しても、一切責任を負いません

9. 利用条件・課金モデル

  • 無料プラン:初回3回まで利用可(要APIキー設定)
  • Proプラン:月額5,000円(Stripeよる自動管理)

10. お問い合わせ先

contact.anago.rhythm@gmail.com


Gemini 2.5 Flash APIキーの取得方法 Gemini 2.5 Flash APIキーの取得方法 このガイドでは、GoogleのGemini 2.5 Flash ...