다국어 텍스트 인식 API

이미지에서 여러 언어의 텍스트를 추출하며 아랍어, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어, 스페인어, 베트남어 등을 지원합니다

개요

다국어 텍스트 인식 API는 이미지 파일에서 여러 언어의 텍스트를 추출할 수 있으며 아랍어, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어, 스페인어, 베트남어 등 다양한 언어 인식을 지원합니다. 통일된 JSON 요청 형식을 사용하며 URL 참조 또는 base64 인코딩된 이미지 데이터를 지원합니다.

인증

API는 다음 인증 방법을 지원합니다:

  • API 키: 쿼리 매개변수를 통해 API 키 전달 ?key=YOUR_API_KEY

이미지에서 다국어 텍스트 추출

다국어 텍스트 인식 기술을 사용하여 이미지 파일에서 텍스트를 추출하며 여러 언어 인식을 지원합니다.

요청

POST /api/multilingual-text-recognition

매개변수:

매개변수유형필수설명
documentobject문서 객체
document.typestring고정값 "image_url"
document.image_urlstring이미지 URL 또는 base64 데이터
filenamestring아니오파일명(base64 데이터 사용 시 권장)
keystring아니오API 키(쿼리 매개변수, 로그인 사용자 선택 사항)

지원 언어:

  • 아랍어 (العربية)
  • 프랑스어 (Français)
  • 독일어 (Deutsch)
  • 이탈리아어 (Italiano)
  • 일본어 (日本語)
  • 한국어 (한국어)
  • 포르투갈어 (Português)
  • 러시아어 (Русский)
  • 스페인어 (Español)
  • 베트남어 (Tiếng Việt)

예제:

이미지 URL 사용:

curl -X POST "https://llmocr.com/api/multilingual-text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "https://llmocr.com/image.jpg"
    }
  }'

Base64 이미지 데이터 사용:

curl -X POST "https://llmocr.com/api/multilingual-text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEA..."
    },
    "filename": "my-image.jpg"
  }'

응답

매개변수:

매개변수유형설명
idstring데이터베이스 레코드 ID
filenamestring파일명
contentstring이미지에서 추출한 다국어 텍스트 내용(순수 텍스트 형식)
formatstring출력 형식, 고정값 "text"
timestampnumber처리 완료 타임스탬프
payloadstringAPI 엔드포인트 URL

예제:

{
  "id": "67891",
  "filename": "foreign-text.jpg",
  "content": "Bonjour! Comment allez-vous?\n\nこんにちは、元気ですか?\n\nHola, ¿cómo estás?\n\nGuten Tag! Wie geht es Ihnen?",
  "format": "text",
  "timestamp": 1640995200000,
  "payload": "https://llmocr.com/api/multilingual-text-recognition?key=YOUR_API_KEY"
}
다국어 텍스트 인식 API - LLMOCR Developer Guide