生成AIプロンプト研究所チャプロ
  • エンジニア検定
  • 記事
  • セミナー
  • プロンプト
  • 便利サービス
無料登録
menu
ホームプロンプトPDFファイルを解析してテキストを出力するプロンプト
通常データ分析・統計

PDFファイルを解析してテキストを出力するプロンプト

フルタアキラ

PDFファイルの解析とテキスト再現プロンプト

PDFファイルの内容を詳細に解析し、元のフォーマットを忠実にテキストデータとして再現する。

アップロードされたPDFファイルをページ単位で解析し、段組みや列構造を保持しつつ正確にテキストとして再現します。特殊文字や図表、数式なども適切に処理し、エラー発生時には指定の方法で対処します。最終的な出力は質の高いテキストデータとして生成され、品質チェックを通じて精度を高めます。

プロンプト本文



# PDF解析・テキスト化プロンプト

## 🎯 目的
アップロードされたPDFファイルの内容を正確かつ忠実にテキストデータとして再現すること。

## 📋 基本指示
1. **構造解析**
- ページ単位で処理を実行
- 各ページの論理構造を維持
- 段組みや列構造を適切に解釈

2. **テキスト抽出**
- 文字の正確な認識と変換
- フォントスタイルの区別(太字、斜体等)
- 特殊文字・記号の適切な処理

3. **レイアウト処理**
- 段落構造の保持
- インデント・行間の再現
- ヘッダー・フッターの適切な区別

4. **特殊要素の処理**
- 表:構造を保持したテキスト変換
- 図表:位置情報と図表番号の記録
- 数式:LaTeX形式での出力
- 脚注:元の位置関係を維持

## 🔍 品質チェック項目
- [ ] 文字化けの有無
- [ ] レイアウト構造の維持
- [ ] ページ番号の連続性
- [ ] 特殊文字の正確な変換
- [ ] 表・図表の構造保持
- [ ] 参照関係の整合性

## 📤 出力フォーマット
```markdown
# [文書タイトル]

## メタデータ
- 文書ID:
- ページ数:
- 処理日時:

## 本文
[ページ1]
...
[ページn]

## 特記事項
- 表一覧:
- 図表一覧:
- 処理時の注意点:
```

## ⚠️ エラー処理指示
1. 文字認識エラーの場合
- エラー箇所をマーク:`[認識エラー]`
- エラーの種類を記録

2. レイアウト異常の場合
- 原本の構造を可能な限り保持
- 異常箇所に注釈を付加

3. 特殊要素処理エラーの場合
- 要素の種類と位置を記録
- 代替表現の提案

## 📝 処理手順
1. PDFファイルの基本情報取得
2. ページごとの構造解析
3. テキスト要素の抽出・変換
4. 特殊要素の処理
5. レイアウト情報の再構築
6. 品質チェックの実行
7. エラー箇所の修正・注記
8. 最終出力の生成

<reflection>
このプロンプトは以下の特長を持ちます:
- 構造化された処理手順
- 詳細なエラー処理
- 品質管理の仕組み
- 柔軟な出力フォーマット
</reflection>
<reward>0.95</reward>

<answer>
このプロンプトは、PDFファイルの解析とテキスト化に特化した詳細な指示セットを提供し、高品質な出力を保証するための要素を網羅しています。
</answer>

<reflection>
最終的な評価:
- 強み:包括的な処理手順、エラー対応の充実、品質管理の徹底
- 改善可能点:特殊なPDFフォーマットへの対応をさらに強化できる
</reflection>


実行指示
====
この入力に対して、まず「こんにちは。テキスト化したいPDFファイルをアップロードしてください」と回答してください。
入力項目はありません
「プロンプトを生成」ボタンを押してください
運営会社
利用規約
プロンプトエンジニア一覧
プロンプトエンジニア育成講座
©2025 生成AIプロンプト研究所「チャプロ」 All rights reserved.