텍스트 인식 API

중국어와 영어에 중점을 둔 고정밀 텍스트 인식으로 순수 텍스트 형식으로 결과를 반환하며 일상 문서 및 스크린샷에 적합합니다

개요

텍스트 인식 API는 이미지 파일에서 텍스트를 추출할 수 있으며, 중국어와 영어 텍스트 인식에 특화되어 높은 정확도의 인식 효과를 제공합니다. API는 순수 텍스트 형식으로 인식 결과를 반환하며, 일상 문서, 스크린샷 및 일반 텍스트 추출 작업에 매우 적합합니다.

통일된 JSON 요청 형식을 사용하며 URL 참조 또는 base64 인코딩된 이미지 데이터를 지원합니다.

인증

API는 다음 인증 방법을 지원합니다:

  • API 키: 쿼리 매개변수를 통해 API 키 전달 ?key=YOUR_API_KEY

이미지에서 텍스트 추출

고정밀 텍스트 인식 기술을 사용하여 이미지 파일에서 텍스트를 추출하며, 중국어와 영어에 특화되어 있습니다.

요청

POST /api/text-recognition

매개변수:

매개변수유형필수설명
documentobject문서 객체
document.typestring고정값 "image_url"
document.image_urlstring이미지 URL 또는 base64 데이터
filenamestring아니오파일명(base64 데이터 사용 시 권장)
keystring아니오API 키(쿼리 매개변수, 로그인 사용자 선택 사항)

지원 언어:

  • 중국어(中文)
  • 영어(English)

예제:

이미지 URL 사용:

curl -X POST "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "https://llmocr.com/image.jpg"
    }
  }'

Base64 이미지 데이터 사용:

curl -X POST "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAYABgAAD..."
    },
    "filename": "document.jpg"
  }'

응답

성공 응답 (200):

{
  "id": "12345",
  "filename": "document.jpg",
  "content": "이미지에서 추출한 텍스트 내용입니다.\n\nThis is the extracted text content from the image.",
  "format": "text",
  "timestamp": 1640995200000,
  "payload": "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY"
}

응답 필드:

필드유형설명
idstring처리된 문서의 고유 식별자
filenamestring처리된 이미지의 원본 파일명
contentstring순수 텍스트 형식으로 추출된 텍스트 내용
formatstring출력 형식(이 API는 항상 "text")
timestampnumber처리 타임스탬프(밀리초)
payloadstring처리에 사용된 API 엔드포인트

오류 응답:

상태 코드설명
400잘못된 요청 - 유효하지 않은 입력 매개변수
401인증되지 않음 - 유효하지 않거나 누락된 API 키
403접근 금지 - 할당량 부족 또는 권한 부족
429요청 과다 - 속도 제한 초과
500내부 서버 오류 - 처리 실패

오류 응답 형식:

{
  "statusText": "오류 설명"
}

지원 이미지 형식

  • JPEG (.jpg, .jpeg)
  • PNG (.png)
  • GIF (.gif)
  • WebP (.webp)

속도 제한

  • 무료 버전: 월 30회 요청
  • 베이직 버전: 월 1,000회 요청
  • 프로 버전: 월 5,000회 요청
  • 울트라 버전: 무제한 요청

이미지 요구사항

  • 최대 파일 크기: 10MB
  • 최소 해상도: 100x100 픽셀
  • 최대 해상도: 4000x4000 픽셀
  • 지원 형식: JPEG, PNG, GIF, WebP

모범 사례

  1. 이미지 품질: 더 나은 정확도를 위해 고해상도 이미지를 사용하고 텍스트가 선명한지 확인하세요
  2. 텍스트 대비: 텍스트와 배경 간의 대비가 좋은지 확인하세요
  3. 이미지 방향: 텍스트 방향이 올바른지 확인하세요(회전되지 않음)
  4. 파일 크기: 처리 속도를 높이기 위해 품질을 유지하면서 이미지 크기를 최적화하세요
  5. 오류 처리: 항상 API 응답에 대한 적절한 오류 처리를 구현하세요

SDK 예제

JavaScript/Node.js

const response = await fetch('https://llmocr.com/api/text-recognition?key=YOUR_API_KEY', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    document: {
      type: 'image_url',
      image_url: 'https://example.com/image.jpg'
    }
  })
});
 
const result = await response.json();
console.log(result.content);

Python

import requests
 
url = "https://llmocr.com/api/text-recognition"
params = {"key": "YOUR_API_KEY"}
data = {
    "document": {
        "type": "image_url",
        "image_url": "https://example.com/image.jpg"
    }
}
 
response = requests.post(url, params=params, json=data)
result = response.json()
print(result["content"])
텍스트 인식 API - LLMOCR Developer Guide