Documentación API
API PDF a Markdown
Convierte documentos PDF a formato Markdown con extracción automática de imágenes
Resumen
La API PDF a Markdown convierte documentos PDF a formato Markdown con extracción automática de imágenes y alojamiento. Utiliza un formato de solicitud JSON unificado, aceptando referencias URL o datos de documento codificados en base64.
Autenticación
La API admite dos métodos de autenticación:
- Clave API: Pase su clave API como parámetro de consulta
?key=SU_CLAVE_API
Convertir PDF a Markdown
Convierte un documento PDF a formato Markdown con extracción automática de imágenes.
Solicitud
POST /api/pdf-to-markdownParámetros:
| Parámetro | Tipo | Requerido | Descripción |
|---|---|---|---|
| document | object | Sí | Objeto documento |
| document.type | string | Sí | Valor fijo "document_url" |
| document.document_url | string | Sí | URL del documento PDF o datos base64 |
| filename | string | No | Nombre de archivo (recomendado para datos base64) |
| key | string | No | Clave API (parámetro de consulta, opcional para usuarios registrados) |
Ejemplos:
Usando URL de PDF:
curl -X POST "https://llmocr.com/api/pdf-to-markdown?key=SU_CLAVE_API" \
-H "Content-Type: application/json" \
-d '{
"document": {
"type": "document_url",
"document_url": "https://llmocr.com/document.pdf"
}
}'Usando Datos PDF Base64:
curl -X POST "https://llmocr.com/api/pdf-to-markdown?key=SU_CLAVE_API" \
-H "Content-Type: application/json" \
-d '{
"document": {
"type": "document_url",
"document_url": "data:application/pdf;base64,JVBERi0xLjQK..."
},
"filename": "mi-documento.pdf"
}'Respuesta
Parámetros:
| Parámetro | Tipo | Descripción |
|---|---|---|
| id | string | ID de registro en la base de datos |
| filename | string | Nombre de archivo |
| content | string | Contenido Markdown completo (con imágenes incrustadas) |
| format | string | Formato de salida, fijo como "markdown" |
| total_pages | number | Número total de páginas en el PDF |
| pages_shown | number | Número de páginas incluidas en la respuesta |
| is_partial | boolean | Si la respuesta contiene contenido parcial debido a límites de suscripción |
| remaining_pages | number | Número de páginas no mostradas debido a límites (solo presente cuando is_partial es true) |
| message | string | Mensaje informativo sobre límites de suscripción (solo presente cuando is_partial es true) |
| timestamp | number | Marca de tiempo de finalización del procesamiento |
| payload | string | URL del endpoint API |
Ejemplo:
{
"id": "67890",
"filename": "document.pdf",
"content": "# Título del Documento\n\nContenido del documento con imágenes...\n\n",
"format": "markdown",
"total_pages": 29,
"pages_shown": 21,
"is_partial": true,
"remaining_pages": 8,
"message": "Mostrando 21 de 29 páginas según su suscripción disponible. Las 29 páginas han sido guardadas y puede desbloquear las 8 páginas restantes cuando tenga más páginas de suscripción.",
"timestamp": 1758871660489,
"payload": "https://llmocr.com/api/pdf-to-markdown?key=SU_CLAVE_API"
}