APIドキュメント

クイックスタート

APIキーを取得して、数分でドキュメントの変換を開始します。

始める →

PDF to Markdown API

自動画像抽出機能付きでPDFドキュメントをMarkdown形式に変換

概要

PDF to Markdown APIは、PDFドキュメントを自動画像抽出とホスティング機能付きでMarkdown形式に変換します。 統一されたJSONリクエスト形式を使用し、URL参照またはbase64エンコードされたドキュメントデータを受け入れます。

認証

APIは以下の認証方法をサポートしています:

  • APIキー: クエリパラメータとしてAPIキーを渡す ?key=YOUR_API_KEY

PDFをMarkdownに変換

自動画像抽出機能付きでPDFドキュメントをMarkdown形式に変換します。

リクエスト

POST /api/pdf-to-markdown

パラメータ:

パラメータ必須説明
documentobjectはいドキュメントオブジェクト
document.typestringはい固定値 "document_url"
document.document_urlstringはいPDFドキュメントURLまたはbase64データ
filenamestringいいえファイル名(base64データの場合推奨)
keystringいいえAPIキー(クエリパラメータ、ログインユーザーにはオプション)

例:

PDF URLを使用:

curl -X POST "https://llmocr.com/api/pdf-to-markdown?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "document_url",
      "document_url": "https://llmocr.com/document.pdf"
    }
  }'

Base64 PDFデータを使用:

curl -X POST "https://llmocr.com/api/pdf-to-markdown?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "document_url",
      "document_url": "data:application/pdf;base64,JVBERi0xLjQK..."
    },
    "filename": "my-document.pdf"
  }'

レスポンス

パラメータ:

パラメータ説明
idstringデータベースレコードID
filenamestringファイル名
contentstring完全なMarkdownコンテンツ(埋め込み画像付き)
formatstring出力形式、固定値 "markdown"
total_pagesnumberPDFの総ページ数
pages_shownnumberレスポンスに含まれるページ数
is_partialbooleanサブスクリプション制限によりレスポンスに部分コンテンツが含まれるかどうか
remaining_pagesnumber制限により表示されなかったページ数(is_partialがtrueの場合のみ存在)
messagestringサブスクリプション制限に関する情報メッセージ(is_partialがtrueの場合のみ存在)
timestampnumber処理完了タイムスタンプ
payloadstringAPIエンドポイントURL

例:

{
  "id": "67890",
  "filename": "document.pdf",
  "content": "# Document Title\n\nDocument content with images...\n\n![image](https://storage.llmocr.com/image.jpg)",
  "format": "markdown",
  "total_pages": 29,
  "pages_shown": 21,
  "is_partial": true,
  "remaining_pages": 8,
  "message": "Showing 21 out of 29 pages based on your available subscription. All 29 pages have been saved and you can unlock the remaining 8 pages when you have more subscription pages.",
  "timestamp": 1758871660489,
  "payload": "https://llmocr.com/api/pdf-to-markdown?key=YOUR_API_KEY"
}
PDF to Markdown API - LLMOCR Developer Guide