📘 Anago-rhythm システム設計書(v.1.0)
1. 概要
「Anago-rhythm」は、Google Gemini API(モデル:Gemini 2.5 Flash)を活用して、PDF形式の日本語建築見積書を解析・構造化・金額検算するAIベースのWebアプリケーションです。
完全なクライアント処理により、ユーザーの見積書をサーバーへ送信することなく、安心して利用できます。
2. 主な機能
- PDF見積書をドラッグ&ドロップでアップロード
- PDF.js によるテキスト抽出(ブラウザ内処理)
- Gemini 2.5 Flash API に構造解析リクエスト送信
- 階層構造の可視化(React + Tailwind CSS)
- 金額誤差や集計ミスの検出とハイライト表示
- Gemini APIキーの保存(初回のみ、localStorage利用)
- Firestore による利用回数カウント・Proユーザー判定
3. 技術スタック
種別 | 使用技術 |
---|---|
フロントエンド | React + TypeScript + Vite |
UI設計 | Tailwind CSS |
AI解析 | Google Gemini 2.5 Flash |
処理構成 | クライアントオンリー構成(サーバーレス) |
デプロイ先 | Vercel(一般公開URL) |
PDF処理 | PDF.js |
ストレージ | localStorage(APIキーのみ) |
4. Gemini API利用(2025年7月時点)
ライブラリ:@google/generative-ai v1.9.0
モデル名:gemini-pro
💰 料金目安
項目 | 単価 | 備考 |
---|---|---|
入力(prompt) | $0.000125 / 1,000 tokens | 約1ページ=2,000 tokens |
出力(response) | $0.000375 / 1,000 tokens | 約1回答=2,000〜4,000 tokens |
🔍 試算例
1見積書(20ページ程度):合計 40,000〜60,000 tokens → 約 $0.02〜$0.06/件
5. セキュリティとプライバシー
- APIキーはローカルにのみ保存(localStorage)
- PDFファイルは外部送信されず、完全なブラウザ内処理
- Firestoreには、メールアドレスと利用回数のみ記録
- Gemini APIは Google のエンタープライズ仕様により、送信データを学習対象としない
※ Vercel自体にはパスワード保護機能はありません。別途ベーシック認証の実装が必要です(現状未対応)。
6. 処理フロー図(テキストベース)
PDF アップロード ↓ PDF.js によるテキスト抽出 ↓ Gemini API にプロンプト送信(構造解析リクエスト) ↓ JSON形式で解析結果を受信 ↓ 金額階層と小計・合計構造を構築 ↓ 検算ロジックにより整合性チェック ↓ React UIで表示(NG箇所に赤枠・強調)
※ 折りたたみ機能は非対応(全階層展開表示)
7. OCR処理済PDFの作成
スキャンPDFはそのままではAI処理不可。事前にOCR処理が必須です。
🧭 手順(Adobe Acrobat Pro)
- PDFをAcrobatで開く
- 右側の「スキャンとOCR」ツールを選択
- 「このファイルを認識」を実行(言語:日本語)
- 文字が選択できる状態にして保存
- 本アプリにアップロード
8. 法的免責・利用上の注意
- 本アプリは AI を用いた自動検証結果を表示するものであり、正確性や網羅性を保証しません
- 検証結果に基づく判断・請求・契約等は、すべて利用者の責任で行ってください
- 運営者は、誤解析・誤認識によって生じたいかなる損害に対しても、一切責任を負いません
9. 利用条件・課金モデル
- 無料プラン:初回3回まで利用可(要APIキー設定)
- Proプラン:月額5,000円(Stripeよる自動管理)
10. お問い合わせ先
contact.anago.rhythm@gmail.com