API PDF a Markdown

Convierte documentos PDF a formato Markdown con extracción automática de imágenes

Resumen

La API PDF a Markdown convierte documentos PDF a formato Markdown con extracción automática de imágenes y alojamiento. Utiliza un formato de solicitud JSON unificado, aceptando referencias URL o datos de documento codificados en base64.

Autenticación

La API admite dos métodos de autenticación:

  • Clave API: Pase su clave API como parámetro de consulta ?key=SU_CLAVE_API

Convertir PDF a Markdown

Convierte un documento PDF a formato Markdown con extracción automática de imágenes.

Solicitud

POST /api/pdf-to-markdown

Parámetros:

ParámetroTipoRequeridoDescripción
documentobjectObjeto documento
document.typestringValor fijo "document_url"
document.document_urlstringURL del documento PDF o datos base64
filenamestringNoNombre de archivo (recomendado para datos base64)
keystringNoClave API (parámetro de consulta, opcional para usuarios registrados)

Ejemplos:

Usando URL de PDF:

curl -X POST "https://llmocr.com/api/pdf-to-markdown?key=SU_CLAVE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "document_url",
      "document_url": "https://llmocr.com/document.pdf"
    }
  }'

Usando Datos PDF Base64:

curl -X POST "https://llmocr.com/api/pdf-to-markdown?key=SU_CLAVE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "document_url",
      "document_url": "data:application/pdf;base64,JVBERi0xLjQK..."
    },
    "filename": "mi-documento.pdf"
  }'

Respuesta

Parámetros:

ParámetroTipoDescripción
idstringID de registro en la base de datos
filenamestringNombre de archivo
contentstringContenido Markdown completo (con imágenes incrustadas)
formatstringFormato de salida, fijo como "markdown"
total_pagesnumberNúmero total de páginas en el PDF
pages_shownnumberNúmero de páginas incluidas en la respuesta
is_partialbooleanSi la respuesta contiene contenido parcial debido a límites de suscripción
remaining_pagesnumberNúmero de páginas no mostradas debido a límites (solo presente cuando is_partial es true)
messagestringMensaje informativo sobre límites de suscripción (solo presente cuando is_partial es true)
timestampnumberMarca de tiempo de finalización del procesamiento
payloadstringURL del endpoint API

Ejemplo:

{
  "id": "67890",
  "filename": "document.pdf",
  "content": "# Título del Documento\n\nContenido del documento con imágenes...\n\n![imagen](https://storage.llmocr.com/image.jpg)",
  "format": "markdown",
  "total_pages": 29,
  "pages_shown": 21,
  "is_partial": true,
  "remaining_pages": 8,
  "message": "Mostrando 21 de 29 páginas según su suscripción disponible. Las 29 páginas han sido guardadas y puede desbloquear las 8 páginas restantes cuando tenga más páginas de suscripción.",
  "timestamp": 1758871660489,
  "payload": "https://llmocr.com/api/pdf-to-markdown?key=SU_CLAVE_API"
}
API PDF a Markdown - LLMOCR Developer Guide