経費精算の月末、PDF の請求書・領収書を 1 枚ずつ Excel に手入力していた時間を、まとめて Claude に渡して数十秒で構造化データに変える 仮想シミュレーション実験。自分の手で 10 枚の仮想 PDF を生成して、AI が「使える出力」を返すまでの段取りと、想定したつまずきがまったく起きなかった事実を、すべて記録した。
⌛ 想定所要時間:8 分 🔰 難易度:★★☆☆☆(Claude.ai のドラッグ&ドロップだけで完結) ⚠️ つまずきポイント:想定したつまずきは起きなかった(2026年5月の Claude では、ほぼプロンプト設計だけで決まる)
月末、PDF が 10 枚たまっていた
会社員にとって、月末の経費精算は厄介な仕事だ。Web 受発注のサブスク、出張の交通費、消耗品、書籍購入、ベンダーからの請求書 ── どれもブラウザでダウンロードした PDF のままパソコンに溜まっていく。月末に「さあやるか」と Excel を開いて、PDF を 1 枚ずつ開き、会社名・日付・金額を手入力する。10 枚もあれば、それだけで 1 時間が消える。
「請求書を 10 枚まとめて、Excel に貼れる表にして」と AI に頼んだら、どうなるか。
実体験のないシミュレーションだが、自分の手で仮想の PDF 10 枚を作り、Claude.ai に渡し、出力を Excel に貼って、月次集計の手前まで持っていけるか、ひと通りやってみた。
結論を先に書く。想定していた『3 つのつまずき』は、ひとつも起きなかった。Claude Opus 4.7(2026年5月時点)は、10 枚すべてから 6 項目を、税込金額の判別も通貨判別も含めて、完璧に抽出して返してきた。
1. 何を試したか ── 仮想 PDF 10 枚の設計
実体験ではなく シミュレーション で進めた理由は 2 つある。第一に、自分の取引先名や金額が画面に出てしまう問題を避けたかった。第二に、AI の限界を見るために、意図的に多様な PDF を組み込みたかった。
仮想請求書 10 枚の内訳は以下の通り。
| 種類 | 枚数 | 想定シーン |
|---|---|---|
| 標準フォーマット(タイトル中央、明細表) | 5 | 一般的な日本式請求書 |
| 別レイアウト(社名左、「INVOICE」右) | 2 | 海外風モダンレイアウト |
| 英語フォーマット(USD) | 1 | 海外サブスクの領収書(Cloudflow Pro など) |
| スキャン画像化された PDF | 2 | 紙の請求書を取り込んだ前提(微回転 + ノイズ入り) |
PDF 生成は Python の reportlab ライブラリで自動化した。生成スクリプトは articles/generate_fake_invoices_21.py として公開している(7 種類の架空会社名 × 10 種類の架空項目 × ランダム日付で組み立てている)。
なお、Python は 仮想 PDF を事前に作る ためだけに使った。これから紹介する「実務で AI に PDF を渡す手順」自体には Python は要らない ── ブラウザだけで完結する。
2. AI に渡す前の準備 ── 何を揃えれば動くか
必要なものは少ない。
- Claude.ai のアカウント(Pro または Max プラン推奨)
- 無料プランでも添付 PDF を扱えるが、1 メッセージあたりのファイル数に上限がある
- Pro 以上なら 10 枚一気にドラッグ&ドロップ可能
- 対象の PDF 10 枚(本記事では仮想生成スクリプトを公開、後述)
- Excel または Google Sheets(出力を貼り付ける先)
実務での抽出ステップは ブラウザだけで完結する。コマンドライン、Python、その他のツール一切不要(仮想 PDF を作った先ほどの Python はこの工程では使わない)。
「PDF を AI に直接渡せる」 ── これだけで、紙のスキャン PDF も含めて処理対象に入る。OCR ソフトウェアを別途用意する必要は、もうない。
3. 実演 ── PDF → Markdown 表の変換フロー
操作は 4 ステップ。
- Claude.ai の「新しいチャット」を開く
- 10 枚の PDF をまとめてドラッグ&ドロップ(チャット入力欄の上にサムネイルが並ぶ)
- 次のプロンプトを送信:
これら 10 枚の請求書 PDF から、以下の項目を抽出して
Markdown の表形式で出力してください:
- 発行日
- 発行者(会社名)
- 宛先
- 明細(商品名 or サービス名)
- 金額(税込)
- 通貨
抽出できなかった項目は「不明」と書いてください。
表の各行 = 1 枚の PDF に対応させてください。
合計 10 行になるはずです。
- 30 秒ほどの「Thinking」のあと、Claude が Markdown 表で返答してくる。それをコピーして Excel に貼り付ける(Excel の「貼り付けオプション → テキストとして貼り付け」で表が自動展開される)
実際の出力(2026-05-13 実演)
| # | ファイル名 | 発行日 | 発行者(会社名) | 宛先 | 明細(抜粋) | 金額(税込) | 通貨 |
|---|---|---|---|---|---|---|---|
| 1 | invoice_01_1001.pdf | 2026/04/05 | 株式会社ナナミ商事 | (仮想) | コンサルティング(2時間) ほか 3 件 | ¥192,500 | JPY |
| 2 | invoice_01_1002.pdf | 2026/04/03 | ハルカクラフト合同会社 | (仮想) | セミナー登壇料 ほか 3 件 | ¥275,000 | JPY |
| 3 | invoice_01_1003.pdf | 2026/05/08 | ミドリオフィスサプライ株式会社 | (仮想) | 資料作成(20p) ほか 3 件 | ¥253,000 | JPY |
| 4 | invoice_01_1004.pdf | 2026/05/09 | サクラインターナショナル株式会社 | (仮想) | Webサイト保守費 ほか 2 件 | ¥198,000 | JPY |
| 5 | invoice_01_1005.pdf | 2026/04/12 | ホシゾラデザインスタジオ | (仮想) | コンサルティング ほか 2 件 | ¥170,500 | JPY |
| 6 | invoice_02_2001.pdf | 2026/05/13 | ツバキコンサルティング株式会社 | (仮想) | Webサイト保守費 ほか 2 件 | ¥196,900 | JPY |
| 7 | invoice_02_2002.pdf | 2026/05/23 | コハクリサーチ合同会社 | (仮想) | 資料作成(20p) ほか 2 件 | ¥220,000 | JPY |
| 8 | invoice_03_english.pdf | 2026-05-01 | Cloudflow Inc. | (仮想) | Cloudflow Pro (Monthly), Extra Storage | $34.00 | USD |
| 9 | invoice_04_scan_3001.pdf | 2026/04/03 | サクラインターナショナル株式会社 | (仮想) | システム開発 ほか 1 件 | ¥198,000 | JPY |
| 10 | invoice_04_scan_3002.pdf | 2026/04/15 | ホシゾラデザインスタジオ | (仮想) | 撮影費 ほか 1 件 | ¥143,000 | JPY |
(宛先列は、仮想 PDF に書かれた架空の宛先を「(仮想)」と表記しています。発行者・金額・明細は Claude の抽出をそのまま記載。)
生成スクリプトの正解値と全 10 行を照合 → 正答率 10/10(100%)。
4. 「壁」がなかった ── 何が効いていたのか
書く前は、最低でも以下 3 つの「つまずき」が起きると予想していた。
| 想定した壁 | 実際 |
|---|---|
| スキャン画像 PDF の文字認識精度が下がる | 起きなかった(2枚とも正確に抽出) |
| 税込と税抜の表記揺れで金額がブレる | 起きなかった(税込を明示指示で 100% 一致) |
| 外貨と日本円の混在で集計ミス | 起きなかった(USD を分けて出力) |
予想外、というより 想定が古かった。2026 年 5 月時点の Claude Opus 4.7 は、マルチモーダル画像認識が「ノイズ + 微回転 + 多言語混在」を込みで処理できるレベルに到達している。スキャン画像はもう「弱点」ではない。
代わりに、結果を分けた要因は プロンプト設計 にあった。
- 「金額(税込)」と明示 したから、Claude は税抜小計と混同しなかった
- 「通貨」列を分ける よう指示したから、USD と JPY を混在させなかった
- 「合計 10 行になるはずです」 と上限を伝えたから、抜け漏れなく 10 行で返した
「ファイル名」列は、こちらが要求していなかったのに Claude が自発的に追加していた。どの行がどの PDF か追跡しやすくするための配慮だ。AI のこういう細かな自走は、毎回新しい発見になる。
5. 月次経費精算への転用 ── 実務に落とすための 3 つの判断軸
仮想 10 枚での成功を、実務にそのまま持ち込めるか。私が見たかぎり、判断は 3 つの軸で決まる。
軸 1:機密性 取引先名・金額が Anthropic 社のサーバーを経由する。会社のセキュリティ規定で外部 AI 利用が禁止されていれば、ここで止まる。自分の経費精算で使うか、会社の業務で使うか は最初に確認する。
軸 2:量とフォーマット 月 5 枚以下なら手入力で十分。月 20 枚を超えるならコストパフォーマンスが立つ。さらに 同じベンダーから定期的に来る請求書 なら、Claude のプロンプトを使い回せるので効率は倍になる。
軸 3:データの読みやすさ 仮想 PDF は機械生成だったので、文字レイヤーが綺麗だった。手書き が混じる、枠線がガタガタ のスキャン、多重表 が入った請求書では結果が変わる可能性がある。最初は 3-5 枚で試し、結果を目視照合してから本番投入するのが安全。
連作「AIで仕事の繰り返しを止める」のレシピ集として、本記事は レシピ#3 に位置づける。第17記事「mdcta」、第20記事「LINE 朝刊」と並んで、ハブページ AIで仕事の繰り返しを止める ── 自動化レシピ集へ から辿れるようにした。
終わりに
100 回繰り返す前に、自動化する側に回る。これは Markdown CTA(第17記事)や LINE 朝刊配信(第20記事)で繰り返し試してきた発想だが、PDF の山という「触りにくい入力形式」も AI にとってはただの『普通の入力』 だった。
私たちが「整理しなきゃ」と思っていたものは、AI 側からはむしろ「整理されている素材」なのかもしれない。月末の 1 時間が、30 秒の Thinking と 1 分のコピペに変わる。その差分が、月 1 時間、年 12 時間。新しいレシピを試す時間 に変えていきたい。
『AI×思考の技法』
“Claude や ChatGPT を「考える相棒」として使うときの基礎”
続編記事
- 🎯 連作ハブ: AIで仕事の繰り返しを止める ── 自動化レシピ集
- Claude Code導入とWordPress立ち上げ
- WordPress初期設定編
- Claude Codeに丸投げで固定ページ4本作った話
- なぜ私はWordPressの投稿画面を開かなくなったのか
- A8.netで新サイト追加 → Xサーバー提携 → バナー設置までの一日
- 非エンジニアがGA4とSearch Consoleを導入した日
- Claude Designでデザイン強化したら3箇所崩れた日
- GA4の最初のデータを見たら、ドイツからアクセスがあった日
- アクティブユーザー27人の正体を確かめに行った日
- Amazon書籍リンクを過去5記事に貼った日
- AdSense申請をAIに丸投げしたら〈ヘッド用〉と〈ヘッダー用〉を取り違えた日
- 副業ブログ初月のコスト、サーバー代じゃなかった
- DMM生成AI CAMPの無料セミナーを予約する前に
- 自分を消した4日後、GA4を開いた日 — 27人はどこへ行ったのか
- 14人の正体を追って、GA4の市区町村まで掘った日 ── 答えは Iowa の Google データセンターだった
- 「みんなの為になる記事を書きたい」とAIに相談したら、5方向から答えが返ってきた日
- 同じ作業を100回繰り返す前に、自動化する側に回った日 ── Markdown のマーカー1個で Amazon+楽天 CTA が完成する仕組み
- 「AIで仕事の繰り返しを止める」固定ページを作った日 ── 自動化レシピ集の入口ができた
- 「毎朝のテスラ株のニュースをLINEに届けて」とAIに頼んだら、エリートアナリストの分析つきで届くようになった日

