API 문서
고급 인식 API
고정밀 텍스트 인식 및 위치 감지로 텍스트 내용을 추출하고 각 텍스트 블록의 상세 좌표 정보를 제공합니다
개요
고급 인식 API는 고정밀 텍스트 인식 및 상세 위치 정보를 제공합니다. 표준 텍스트 인식과 달리 이 API는 추출된 텍스트 내용뿐만 아니라 회전 사각형 및 4점 좌표를 포함한 각 텍스트 블록의 정확한 좌표도 반환합니다.
이 API는 통일된 JSON 요청 형식을 사용하며 URL 참조 또는 base64 인코딩된 이미지 데이터를 허용합니다.
인증
API는 다음 인증 방법을 지원합니다:
- API 키: 쿼리 매개변수를 통해 API 키 전달
?key=YOUR_API_KEY
텍스트 및 위치 데이터 추출
이미지 파일에서 텍스트를 추출하고 회전 사각형 및 4점 좌표를 포함한 각 텍스트 블록의 상세 위치 정보를 가져옵니다.
요청
POST /api/advanced-recognition매개변수:
| 매개변수 | 유형 | 필수 | 설명 |
|---|---|---|---|
| document | object | 예 | 문서 객체 |
| document.type | string | 예 | 고정값 "image_url" |
| document.image_url | string | 예 | 이미지 URL 또는 base64 데이터 |
| filename | string | 아니오 | 파일명(base64 데이터 사용 시 권장) |
| key | string | 아니오 | API 키(쿼리 매개변수, 로그인 사용자 선택 사항) |
예제:
이미지 URL 사용:
curl -X POST "https://llmocr.com/api/advanced-recognition?key=YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"document": {
"type": "image_url",
"image_url": "https://llmocr.com/image.jpg"
}
}'Base64 이미지 데이터 사용:
curl -X POST "https://llmocr.com/api/advanced-recognition?key=YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"document": {
"type": "image_url",
"image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEA..."
},
"filename": "document.jpg"
}'응답
매개변수:
| 매개변수 | 유형 | 설명 |
|---|---|---|
| id | string | 데이터베이스 레코드 ID |
| filename | string | 파일명 |
| content | string | 추출된 텍스트 내용(모든 텍스트 블록이 줄바꿈으로 연결됨) |
| ocrResult | object | 위치 정보가 포함된 상세 OCR 결과 |
| format | string | 출력 형식, 고정값 "json" |
| timestamp | number | 처리 완료 타임스탬프 |
| payload | string | API 엔드포인트 URL |
ocrResult.words_info 구조:
words_info 배열의 각 항목에는 다음이 포함됩니다:
| 필드 | 유형 | 설명 |
|---|---|---|
| text | string | 텍스트 블록의 텍스트 내용 |
| location | number[] | 4점 좌표 [x1,y1,x2,y2,x3,y3,x4,y4](좌상 → 우상 → 우하 → 좌하) |
| rotate_rect | number[] | 회전 사각형 [center_x, center_y, width, height, angle], 각도 범위: [-90, 90] |
예제:
{
"id": "12345",
"filename": "document.jpg",
"content": "첫 번째 줄 텍스트\n두 번째 줄 텍스트",
"ocrResult": {
"words_info": [
{
"text": "첫 번째 줄 텍스트",
"location": [150, 80, 400, 80, 400, 120, 150, 120],
"rotate_rect": [275, 100, 250, 40, 0]
},
{
"text": "두 번째 줄 텍스트",
"location": [150, 150, 400, 150, 400, 190, 150, 190],
"rotate_rect": [275, 170, 250, 40, 0]
}
]
},
"format": "json",
"timestamp": 1640995200000,
"payload": "https://llmocr.com/api/advanced-recognition?key=YOUR_API_KEY"
}