고급 인식 API

고정밀 텍스트 인식 및 위치 감지로 텍스트 내용을 추출하고 각 텍스트 블록의 상세 좌표 정보를 제공합니다

개요

고급 인식 API는 고정밀 텍스트 인식 및 상세 위치 정보를 제공합니다. 표준 텍스트 인식과 달리 이 API는 추출된 텍스트 내용뿐만 아니라 회전 사각형 및 4점 좌표를 포함한 각 텍스트 블록의 정확한 좌표도 반환합니다.

이 API는 통일된 JSON 요청 형식을 사용하며 URL 참조 또는 base64 인코딩된 이미지 데이터를 허용합니다.

인증

API는 다음 인증 방법을 지원합니다:

  • API 키: 쿼리 매개변수를 통해 API 키 전달 ?key=YOUR_API_KEY

텍스트 및 위치 데이터 추출

이미지 파일에서 텍스트를 추출하고 회전 사각형 및 4점 좌표를 포함한 각 텍스트 블록의 상세 위치 정보를 가져옵니다.

요청

POST /api/advanced-recognition

매개변수:

매개변수유형필수설명
documentobject문서 객체
document.typestring고정값 "image_url"
document.image_urlstring이미지 URL 또는 base64 데이터
filenamestring아니오파일명(base64 데이터 사용 시 권장)
keystring아니오API 키(쿼리 매개변수, 로그인 사용자 선택 사항)

예제:

이미지 URL 사용:

curl -X POST "https://llmocr.com/api/advanced-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "https://llmocr.com/image.jpg"
    }
  }'

Base64 이미지 데이터 사용:

curl -X POST "https://llmocr.com/api/advanced-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEA..."
    },
    "filename": "document.jpg"
  }'

응답

매개변수:

매개변수유형설명
idstring데이터베이스 레코드 ID
filenamestring파일명
contentstring추출된 텍스트 내용(모든 텍스트 블록이 줄바꿈으로 연결됨)
ocrResultobject위치 정보가 포함된 상세 OCR 결과
formatstring출력 형식, 고정값 "json"
timestampnumber처리 완료 타임스탬프
payloadstringAPI 엔드포인트 URL

ocrResult.words_info 구조:

words_info 배열의 각 항목에는 다음이 포함됩니다:

필드유형설명
textstring텍스트 블록의 텍스트 내용
locationnumber[]4점 좌표 [x1,y1,x2,y2,x3,y3,x4,y4](좌상 → 우상 → 우하 → 좌하)
rotate_rectnumber[]회전 사각형 [center_x, center_y, width, height, angle], 각도 범위: [-90, 90]

예제:

{
  "id": "12345",
  "filename": "document.jpg",
  "content": "첫 번째 줄 텍스트\n두 번째 줄 텍스트",
  "ocrResult": {
    "words_info": [
      {
        "text": "첫 번째 줄 텍스트",
        "location": [150, 80, 400, 80, 400, 120, 150, 120],
        "rotate_rect": [275, 100, 250, 40, 0]
      },
      {
        "text": "두 번째 줄 텍스트",
        "location": [150, 150, 400, 150, 400, 190, 150, 190],
        "rotate_rect": [275, 170, 250, 40, 0]
      }
    ]
  },
  "format": "json",
  "timestamp": 1640995200000,
  "payload": "https://llmocr.com/api/advanced-recognition?key=YOUR_API_KEY"
}
고급 인식 API - LLMOCR Developer Guide