API de Reconocimiento de Texto

Reconocimiento de texto de alta precisión centrado en chino e inglés, devuelve resultados en formato de texto plano, adecuado para documentos diarios y capturas de pantalla

Resumen

La API de Reconocimiento de Texto extrae texto de archivos de imagen con alta precisión, específicamente optimizada para reconocimiento de texto en chino e inglés. Devuelve el texto reconocido en formato de texto plano, lo que la hace ideal para documentos diarios, capturas de pantalla y tareas generales de extracción de texto.

Esta API utiliza un formato de solicitud JSON unificado, aceptando referencias URL o datos de imagen codificados en base64.

Autenticación

La API admite dos métodos de autenticación:

  • Clave API: Pase su clave API como parámetro de consulta ?key=SU_CLAVE_API

Extraer Texto de Imagen

Extrae texto de un archivo de imagen utilizando tecnología de reconocimiento de texto de alta precisión, optimizada para idiomas chino e inglés.

Solicitud

POST /api/text-recognition

Parámetros:

ParámetroTipoRequeridoDescripción
documentobjectObjeto documento
document.typestringValor fijo "image_url"
document.image_urlstringURL de imagen o datos base64
filenamestringNoNombre de archivo (recomendado para datos base64)
keystringNoClave API (parámetro de consulta, opcional para usuarios registrados)

Idiomas Soportados:

  • Chino (中文)
  • Inglés (English)

Ejemplos:

Usando URL de Imagen:

curl -X POST "https://llmocr.com/api/text-recognition?key=SU_CLAVE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "https://llmocr.com/image.jpg"
    }
  }'

Usando Datos de Imagen Base64:

curl -X POST "https://llmocr.com/api/text-recognition?key=SU_CLAVE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAYABgAAD..."
    },
    "filename": "document.jpg"
  }'

Respuesta

Respuesta Exitosa (200):

{
  "id": "12345",
  "filename": "document.jpg",
  "content": "Este es el contenido de texto extraído de la imagen.\n\n这是从图像中提取的文本内容。",
  "format": "text",
  "timestamp": 1640995200000,
  "payload": "https://llmocr.com/api/text-recognition?key=SU_CLAVE_API"
}

Campos de Respuesta:

CampoTipoDescripción
idstringIdentificador único para el documento procesado
filenamestringNombre de archivo original de la imagen procesada
contentstringContenido de texto extraído en formato de texto plano
formatstringFormato de salida (siempre "text" para esta API)
timestampnumberMarca de tiempo de procesamiento en milisegundos
payloadstringEndpoint API utilizado para el procesamiento

Respuestas de Error:

Código de EstadoDescripción
400Solicitud Incorrecta - Parámetros de entrada inválidos
401No Autorizado - Clave API inválida o faltante
403Prohibido - Cuota o permisos insuficientes
429Demasiadas Solicitudes - Límite de velocidad excedido
500Error Interno del Servidor - Fallo en el procesamiento

Formato de Respuesta de Error:

{
  "statusText": "Descripción del error"
}

Formatos de Imagen Soportados

  • JPEG (.jpg, .jpeg)
  • PNG (.png)
  • GIF (.gif)
  • WebP (.webp)

Límites de Velocidad

  • Nivel gratuito: 30 solicitudes por mes
  • Nivel básico: 1,000 solicitudes por mes
  • Nivel pro: 5,000 solicitudes por mes
  • Nivel ultra: Solicitudes ilimitadas

Requisitos de Imagen

  • Tamaño máximo de archivo: 10MB
  • Resolución mínima: 100x100 píxeles
  • Resolución máxima: 4000x4000 píxeles
  • Formatos soportados: JPEG, PNG, GIF, WebP

Mejores Prácticas

  1. Calidad de Imagen: Use imágenes de alta resolución con texto claro para mejor precisión
  2. Contraste de Texto: Asegure buen contraste entre texto y fondo
  3. Orientación de Imagen: Asegúrese de que el texto esté correctamente orientado (no rotado)
  4. Tamaño de Archivo: Optimice el tamaño de imagen para procesamiento más rápido manteniendo la calidad
  5. Manejo de Errores: Siempre implemente manejo adecuado de errores para respuestas API

Ejemplos de SDK

JavaScript/Node.js

const response = await fetch('https://llmocr.com/api/text-recognition?key=SU_CLAVE_API', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    document: {
      type: 'image_url',
      image_url: 'https://example.com/image.jpg'
    }
  })
});
 
const result = await response.json();
console.log(result.content);

Python

import requests
 
url = "https://llmocr.com/api/text-recognition"
params = {"key": "SU_CLAVE_API"}
data = {
    "document": {
        "type": "image_url",
        "image_url": "https://example.com/image.jpg"
    }
}
 
response = requests.post(url, params=params, json=data)
result = response.json()
print(result["content"])
API de Reconocimiento de Texto - LLMOCR Developer Guide