API de Reconocimiento de Texto

Resumen

La API de Reconocimiento de Texto extrae texto de archivos de imagen con alta precisión, específicamente optimizada para reconocimiento de texto en chino e inglés. Devuelve el texto reconocido en formato de texto plano, lo que la hace ideal para documentos diarios, capturas de pantalla y tareas generales de extracción de texto.

Esta API utiliza un formato de solicitud JSON unificado, aceptando referencias URL o datos de imagen codificados en base64.

Autenticación

La API admite dos métodos de autenticación:

Clave API: Pase su clave API como parámetro de consulta ?key=SU_CLAVE_API

Extraer Texto de Imagen

Extrae texto de un archivo de imagen utilizando tecnología de reconocimiento de texto de alta precisión, optimizada para idiomas chino e inglés.

Solicitud

POST /api/text-recognition

Parámetros:

Parámetro	Tipo	Requerido	Descripción
document	object	Sí	Objeto documento
document.type	string	Sí	Valor fijo "image_url"
document.image_url	string	Sí	URL de imagen o datos base64
filename	string	No	Nombre de archivo (recomendado para datos base64)
key	string	No	Clave API (parámetro de consulta, opcional para usuarios registrados)

Idiomas Soportados:

Chino (中文)
Inglés (English)

Ejemplos:

Usando URL de Imagen:

curl -X POST "https://llmocr.com/api/text-recognition?key=SU_CLAVE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "https://llmocr.com/image.jpg"
    }
  }'

Usando Datos de Imagen Base64:

curl -X POST "https://llmocr.com/api/text-recognition?key=SU_CLAVE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAYABgAAD..."
    },
    "filename": "document.jpg"
  }'

Respuesta

Respuesta Exitosa (200):

{
  "id": "12345",
  "filename": "document.jpg",
  "content": "Este es el contenido de texto extraído de la imagen.\n\n这是从图像中提取的文本内容。",
  "format": "text",
  "timestamp": 1640995200000,
  "payload": "https://llmocr.com/api/text-recognition?key=SU_CLAVE_API"
}

Campos de Respuesta:

Campo	Tipo	Descripción
id	string	Identificador único para el documento procesado
filename	string	Nombre de archivo original de la imagen procesada
content	string	Contenido de texto extraído en formato de texto plano
format	string	Formato de salida (siempre "text" para esta API)
timestamp	number	Marca de tiempo de procesamiento en milisegundos
payload	string	Endpoint API utilizado para el procesamiento

Respuestas de Error:

Código de Estado	Descripción
400	Solicitud Incorrecta - Parámetros de entrada inválidos
401	No Autorizado - Clave API inválida o faltante
403	Prohibido - Cuota o permisos insuficientes
429	Demasiadas Solicitudes - Límite de velocidad excedido
500	Error Interno del Servidor - Fallo en el procesamiento

Formato de Respuesta de Error:

{
  "statusText": "Descripción del error"
}

Formatos de Imagen Soportados

JPEG (.jpg, .jpeg)
PNG (.png)
GIF (.gif)
WebP (.webp)

Límites de Velocidad

Nivel gratuito: 30 solicitudes por mes
Nivel básico: 1,000 solicitudes por mes
Nivel pro: 5,000 solicitudes por mes
Nivel ultra: Solicitudes ilimitadas

Requisitos de Imagen

Tamaño máximo de archivo: 10MB
Resolución mínima: 100x100 píxeles
Resolución máxima: 4000x4000 píxeles
Formatos soportados: JPEG, PNG, GIF, WebP

Mejores Prácticas

Calidad de Imagen: Use imágenes de alta resolución con texto claro para mejor precisión
Contraste de Texto: Asegure buen contraste entre texto y fondo
Orientación de Imagen: Asegúrese de que el texto esté correctamente orientado (no rotado)
Tamaño de Archivo: Optimice el tamaño de imagen para procesamiento más rápido manteniendo la calidad
Manejo de Errores: Siempre implemente manejo adecuado de errores para respuestas API

Ejemplos de SDK

JavaScript/Node.js

const response = await fetch('https://llmocr.com/api/text-recognition?key=SU_CLAVE_API', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    document: {
      type: 'image_url',
      image_url: 'https://example.com/image.jpg'
    }
  })
});
 
const result = await response.json();
console.log(result.content);

Python

import requests
 
url = "https://llmocr.com/api/text-recognition"
params = {"key": "SU_CLAVE_API"}
data = {
    "document": {
        "type": "image_url",
        "image_url": "https://example.com/image.jpg"
    }
}
 
response = requests.post(url, params=params, json=data)
result = response.json()
print(result["content"])

LLMOCR

Documentación API

Inicio rápido