텍스트 인식 API

개요

텍스트 인식 API는 이미지 파일에서 텍스트를 추출할 수 있으며, 중국어와 영어 텍스트 인식에 특화되어 높은 정확도의 인식 효과를 제공합니다. API는 순수 텍스트 형식으로 인식 결과를 반환하며, 일상 문서, 스크린샷 및 일반 텍스트 추출 작업에 매우 적합합니다.

통일된 JSON 요청 형식을 사용하며 URL 참조 또는 base64 인코딩된 이미지 데이터를 지원합니다.

인증

API는 다음 인증 방법을 지원합니다:

API 키: 쿼리 매개변수를 통해 API 키 전달 ?key=YOUR_API_KEY

이미지에서 텍스트 추출

고정밀 텍스트 인식 기술을 사용하여 이미지 파일에서 텍스트를 추출하며, 중국어와 영어에 특화되어 있습니다.

요청

POST /api/text-recognition

매개변수:

매개변수	유형	필수	설명
document	object	예	문서 객체
document.type	string	예	고정값 "image_url"
document.image_url	string	예	이미지 URL 또는 base64 데이터
filename	string	아니오	파일명(base64 데이터 사용 시 권장)
key	string	아니오	API 키(쿼리 매개변수, 로그인 사용자 선택 사항)

지원 언어:

중국어(中文)
영어(English)

예제:

이미지 URL 사용:

curl -X POST "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "https://llmocr.com/image.jpg"
    }
  }'

Base64 이미지 데이터 사용:

curl -X POST "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAYABgAAD..."
    },
    "filename": "document.jpg"
  }'

응답

성공 응답 (200):

{
  "id": "12345",
  "filename": "document.jpg",
  "content": "이미지에서 추출한 텍스트 내용입니다.\n\nThis is the extracted text content from the image.",
  "format": "text",
  "timestamp": 1640995200000,
  "payload": "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY"
}

응답 필드:

필드	유형	설명
id	string	처리된 문서의 고유 식별자
filename	string	처리된 이미지의 원본 파일명
content	string	순수 텍스트 형식으로 추출된 텍스트 내용
format	string	출력 형식(이 API는 항상 "text")
timestamp	number	처리 타임스탬프(밀리초)
payload	string	처리에 사용된 API 엔드포인트

오류 응답:

상태 코드	설명
400	잘못된 요청 - 유효하지 않은 입력 매개변수
401	인증되지 않음 - 유효하지 않거나 누락된 API 키
403	접근 금지 - 할당량 부족 또는 권한 부족
429	요청 과다 - 속도 제한 초과
500	내부 서버 오류 - 처리 실패

오류 응답 형식:

{
  "statusText": "오류 설명"
}

지원 이미지 형식

JPEG (.jpg, .jpeg)
PNG (.png)
GIF (.gif)
WebP (.webp)

속도 제한

무료 버전: 월 30회 요청
베이직 버전: 월 1,000회 요청
프로 버전: 월 5,000회 요청
울트라 버전: 무제한 요청

이미지 요구사항

최대 파일 크기: 10MB
최소 해상도: 100x100 픽셀
최대 해상도: 4000x4000 픽셀
지원 형식: JPEG, PNG, GIF, WebP

모범 사례

이미지 품질: 더 나은 정확도를 위해 고해상도 이미지를 사용하고 텍스트가 선명한지 확인하세요
텍스트 대비: 텍스트와 배경 간의 대비가 좋은지 확인하세요
이미지 방향: 텍스트 방향이 올바른지 확인하세요(회전되지 않음)
파일 크기: 처리 속도를 높이기 위해 품질을 유지하면서 이미지 크기를 최적화하세요
오류 처리: 항상 API 응답에 대한 적절한 오류 처리를 구현하세요

SDK 예제

JavaScript/Node.js

const response = await fetch('https://llmocr.com/api/text-recognition?key=YOUR_API_KEY', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    document: {
      type: 'image_url',
      image_url: 'https://example.com/image.jpg'
    }
  })
});
 
const result = await response.json();
console.log(result.content);

Python

import requests
 
url = "https://llmocr.com/api/text-recognition"
params = {"key": "YOUR_API_KEY"}
data = {
    "document": {
        "type": "image_url",
        "image_url": "https://example.com/image.jpg"
    }
}
 
response = requests.post(url, params=params, json=data)
result = response.json()
print(result["content"])

LLMOCR

API 문서

빠른 시작

개요

인증