【実録】請求書 PDF 10 枚を Claude に渡したら、30 秒で Excel が返ってきた日

PDF→Excel、AI 一発。 — 請求書 10 枚を Claude に丸投げ、10/10 完璧抽出、月末の 1 時間が 1 分に。第21回アイキャッチ画像。AIワークフローカテゴリー、自動化レシピ#3。 AIワークフロー
非エンジニアAIラボ - 第21回(DAY 19)

経費精算の月末、PDF の請求書・領収書を 1 枚ずつ Excel に手入力していた時間を、まとめて Claude に渡して数十秒で構造化データに変える 仮想シミュレーション実験。自分の手で 10 枚の仮想 PDF を生成して、AI が「使える出力」を返すまでの段取りと、想定したつまずきがまったく起きなかった事実を、すべて記録した。

⌛ 想定所要時間:8 分 🔰 難易度:★★☆☆☆(Claude.ai のドラッグ&ドロップだけで完結) ⚠️ つまずきポイント:想定したつまずきは起きなかった(2026年5月の Claude では、ほぼプロンプト設計だけで決まる)


月末、PDF が 10 枚たまっていた

会社員にとって、月末の経費精算は厄介な仕事だ。Web 受発注のサブスク、出張の交通費、消耗品、書籍購入、ベンダーからの請求書 ── どれもブラウザでダウンロードした PDF のままパソコンに溜まっていく。月末に「さあやるか」と Excel を開いて、PDF を 1 枚ずつ開き、会社名・日付・金額を手入力する。10 枚もあれば、それだけで 1 時間が消える。

請求書を 10 枚まとめて、Excel に貼れる表にして」と AI に頼んだら、どうなるか。

実体験のないシミュレーションだが、自分の手で仮想の PDF 10 枚を作り、Claude.ai に渡し、出力を Excel に貼って、月次集計の手前まで持っていけるか、ひと通りやってみた。

結論を先に書く。想定していた『3 つのつまずき』は、ひとつも起きなかった。Claude Opus 4.7(2026年5月時点)は、10 枚すべてから 6 項目を、税込金額の判別も通貨判別も含めて、完璧に抽出して返してきた。


1. 何を試したか ── 仮想 PDF 10 枚の設計

実体験ではなく シミュレーション で進めた理由は 2 つある。第一に、自分の取引先名や金額が画面に出てしまう問題を避けたかった。第二に、AI の限界を見るために、意図的に多様な PDF を組み込みたかった

仮想請求書 10 枚の内訳は以下の通り。

種類枚数想定シーン
標準フォーマット(タイトル中央、明細表)5一般的な日本式請求書
別レイアウト(社名左、「INVOICE」右)2海外風モダンレイアウト
英語フォーマット(USD)1海外サブスクの領収書(Cloudflow Pro など)
スキャン画像化された PDF2紙の請求書を取り込んだ前提(微回転 + ノイズ入り)

PDF 生成は Python の reportlab ライブラリで自動化した。生成スクリプトは articles/generate_fake_invoices_21.py として公開している(7 種類の架空会社名 × 10 種類の架空項目 × ランダム日付で組み立てている)。

なお、Python は 仮想 PDF を事前に作る ためだけに使った。これから紹介する「実務で AI に PDF を渡す手順」自体には Python は要らない ── ブラウザだけで完結する。


2. AI に渡す前の準備 ── 何を揃えれば動くか

必要なものは少ない。

  • Claude.ai のアカウント(Pro または Max プラン推奨)
  • 無料プランでも添付 PDF を扱えるが、1 メッセージあたりのファイル数に上限がある
  • Pro 以上なら 10 枚一気にドラッグ&ドロップ可能
  • 対象の PDF 10 枚(本記事では仮想生成スクリプトを公開、後述)
  • Excel または Google Sheets(出力を貼り付ける先)

実務での抽出ステップは ブラウザだけで完結する。コマンドライン、Python、その他のツール一切不要(仮想 PDF を作った先ほどの Python はこの工程では使わない)。

PDF を AI に直接渡せる」 ── これだけで、紙のスキャン PDF も含めて処理対象に入る。OCR ソフトウェアを別途用意する必要は、もうない。


3. 実演 ── PDF → Markdown 表の変換フロー

操作は 4 ステップ。

  1. Claude.ai の「新しいチャット」を開く
  2. 10 枚の PDF をまとめてドラッグ&ドロップ(チャット入力欄の上にサムネイルが並ぶ)
  3. 次のプロンプトを送信:
これら 10 枚の請求書 PDF から、以下の項目を抽出して
Markdown の表形式で出力してください:
- 発行日
- 発行者(会社名)
- 宛先
- 明細(商品名 or サービス名)
- 金額(税込)
- 通貨

抽出できなかった項目は「不明」と書いてください。
表の各行 = 1 枚の PDF に対応させてください。
合計 10 行になるはずです。
  1. 30 秒ほどの「Thinking」のあと、Claude が Markdown 表で返答してくる。それをコピーして Excel に貼り付ける(Excel の「貼り付けオプション → テキストとして貼り付け」で表が自動展開される)

実際の出力(2026-05-13 実演)

#ファイル名発行日発行者(会社名)宛先明細(抜粋)金額(税込)通貨
1invoice_01_1001.pdf2026/04/05株式会社ナナミ商事(仮想)コンサルティング(2時間) ほか 3 件¥192,500JPY
2invoice_01_1002.pdf2026/04/03ハルカクラフト合同会社(仮想)セミナー登壇料 ほか 3 件¥275,000JPY
3invoice_01_1003.pdf2026/05/08ミドリオフィスサプライ株式会社(仮想)資料作成(20p) ほか 3 件¥253,000JPY
4invoice_01_1004.pdf2026/05/09サクラインターナショナル株式会社(仮想)Webサイト保守費 ほか 2 件¥198,000JPY
5invoice_01_1005.pdf2026/04/12ホシゾラデザインスタジオ(仮想)コンサルティング ほか 2 件¥170,500JPY
6invoice_02_2001.pdf2026/05/13ツバキコンサルティング株式会社(仮想)Webサイト保守費 ほか 2 件¥196,900JPY
7invoice_02_2002.pdf2026/05/23コハクリサーチ合同会社(仮想)資料作成(20p) ほか 2 件¥220,000JPY
8invoice_03_english.pdf2026-05-01Cloudflow Inc.(仮想)Cloudflow Pro (Monthly), Extra Storage$34.00USD
9invoice_04_scan_3001.pdf2026/04/03サクラインターナショナル株式会社(仮想)システム開発 ほか 1 件¥198,000JPY
10invoice_04_scan_3002.pdf2026/04/15ホシゾラデザインスタジオ(仮想)撮影費 ほか 1 件¥143,000JPY

(宛先列は、仮想 PDF に書かれた架空の宛先を「(仮想)」と表記しています。発行者・金額・明細は Claude の抽出をそのまま記載。)

生成スクリプトの正解値と全 10 行を照合 → 正答率 10/10(100%)


4. 「壁」がなかった ── 何が効いていたのか

書く前は、最低でも以下 3 つの「つまずき」が起きると予想していた。

想定した壁実際
スキャン画像 PDF の文字認識精度が下がる起きなかった(2枚とも正確に抽出)
税込と税抜の表記揺れで金額がブレる起きなかった(税込を明示指示で 100% 一致)
外貨と日本円の混在で集計ミス起きなかった(USD を分けて出力)

予想外、というより 想定が古かった。2026 年 5 月時点の Claude Opus 4.7 は、マルチモーダル画像認識が「ノイズ + 微回転 + 多言語混在」を込みで処理できるレベルに到達している。スキャン画像はもう「弱点」ではない。

代わりに、結果を分けた要因は プロンプト設計 にあった。

  • 「金額(税込)」と明示 したから、Claude は税抜小計と混同しなかった
  • 「通貨」列を分ける よう指示したから、USD と JPY を混在させなかった
  • 「合計 10 行になるはずです」 と上限を伝えたから、抜け漏れなく 10 行で返した

「ファイル名」列は、こちらが要求していなかったのに Claude が自発的に追加していた。どの行がどの PDF か追跡しやすくするための配慮だ。AI のこういう細かな自走は、毎回新しい発見になる。


5. 月次経費精算への転用 ── 実務に落とすための 3 つの判断軸

仮想 10 枚での成功を、実務にそのまま持ち込めるか。私が見たかぎり、判断は 3 つの軸で決まる。

軸 1:機密性 取引先名・金額が Anthropic 社のサーバーを経由する。会社のセキュリティ規定で外部 AI 利用が禁止されていれば、ここで止まる。自分の経費精算で使うか、会社の業務で使うか は最初に確認する。

軸 2:量とフォーマット 月 5 枚以下なら手入力で十分。月 20 枚を超えるならコストパフォーマンスが立つ。さらに 同じベンダーから定期的に来る請求書 なら、Claude のプロンプトを使い回せるので効率は倍になる。

軸 3:データの読みやすさ 仮想 PDF は機械生成だったので、文字レイヤーが綺麗だった。手書き が混じる、枠線がガタガタ のスキャン、多重表 が入った請求書では結果が変わる可能性がある。最初は 3-5 枚で試し、結果を目視照合してから本番投入するのが安全。

連作「AIで仕事の繰り返しを止める」のレシピ集として、本記事は レシピ#3 に位置づける。第17記事「mdcta」、第20記事「LINE 朝刊」と並んで、ハブページ AIで仕事の繰り返しを止める ── 自動化レシピ集へ から辿れるようにした。


終わりに

100 回繰り返す前に、自動化する側に回る。これは Markdown CTA(第17記事)や LINE 朝刊配信(第20記事)で繰り返し試してきた発想だが、PDF の山という「触りにくい入力形式」も AI にとってはただの『普通の入力』 だった。

私たちが「整理しなきゃ」と思っていたものは、AI 側からはむしろ「整理されている素材」なのかもしれない。月末の 1 時間が、30 秒の Thinking と 1 分のコピペに変わる。その差分が、月 1 時間、年 12 時間。新しいレシピを試す時間 に変えていきたい。

📚 関連書籍で深掘りしたい方へ
『AI×思考の技法』
“Claude や ChatGPT を「考える相棒」として使うときの基礎”
書籍『AIを使って考えるための全技術 ── 「最高の発想」を一瞬で生み出す56の技法』表紙
Amazonで中身とレビューを見る ▶
楽天市場でポイント還元を見る ▶
※Amazonアソシエイト・楽天アフィリエイト・PR

続編記事

タイトルとURLをコピーしました