APIドキュメント
PDF to Markdown API
自動画像抽出機能付きでPDFドキュメントをMarkdown形式に変換
概要
PDF to Markdown APIは、PDFドキュメントを自動画像抽出とホスティング機能付きでMarkdown形式に変換します。 統一されたJSONリクエスト形式を使用し、URL参照またはbase64エンコードされたドキュメントデータを受け入れます。
認証
APIは以下の認証方法をサポートしています:
- APIキー: クエリパラメータとしてAPIキーを渡す
?key=YOUR_API_KEY
PDFをMarkdownに変換
自動画像抽出機能付きでPDFドキュメントをMarkdown形式に変換します。
リクエスト
POST /api/pdf-to-markdownパラメータ:
| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
| document | object | はい | ドキュメントオブジェクト |
| document.type | string | はい | 固定値 "document_url" |
| document.document_url | string | はい | PDFドキュメントURLまたはbase64データ |
| filename | string | いいえ | ファイル名(base64データの場合推奨) |
| key | string | いいえ | APIキー(クエリパラメータ、ログインユーザーにはオプション) |
例:
PDF URLを使用:
curl -X POST "https://llmocr.com/api/pdf-to-markdown?key=YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"document": {
"type": "document_url",
"document_url": "https://llmocr.com/document.pdf"
}
}'Base64 PDFデータを使用:
curl -X POST "https://llmocr.com/api/pdf-to-markdown?key=YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"document": {
"type": "document_url",
"document_url": "data:application/pdf;base64,JVBERi0xLjQK..."
},
"filename": "my-document.pdf"
}'レスポンス
パラメータ:
| パラメータ | 型 | 説明 |
|---|---|---|
| id | string | データベースレコードID |
| filename | string | ファイル名 |
| content | string | 完全なMarkdownコンテンツ(埋め込み画像付き) |
| format | string | 出力形式、固定値 "markdown" |
| total_pages | number | PDFの総ページ数 |
| pages_shown | number | レスポンスに含まれるページ数 |
| is_partial | boolean | サブスクリプション制限によりレスポンスに部分コンテンツが含まれるかどうか |
| remaining_pages | number | 制限により表示されなかったページ数(is_partialがtrueの場合のみ存在) |
| message | string | サブスクリプション制限に関する情報メッセージ(is_partialがtrueの場合のみ存在) |
| timestamp | number | 処理完了タイムスタンプ |
| payload | string | APIエンドポイントURL |
例:
{
"id": "67890",
"filename": "document.pdf",
"content": "# Document Title\n\nDocument content with images...\n\n",
"format": "markdown",
"total_pages": 29,
"pages_shown": 21,
"is_partial": true,
"remaining_pages": 8,
"message": "Showing 21 out of 29 pages based on your available subscription. All 29 pages have been saved and you can unlock the remaining 8 pages when you have more subscription pages.",
"timestamp": 1758871660489,
"payload": "https://llmocr.com/api/pdf-to-markdown?key=YOUR_API_KEY"
}