APIドキュメント

クイックスタート

APIキーを取得して、数分でドキュメントの変換を開始します。

始める →

Text Recognition API

中国語と英語に焦点を当てた高精度テキスト認識。純粋なテキスト形式で結果を返し、日常のドキュメントやスクリーンショットに適しています

概要

Text Recognition APIは、画像ファイルからテキストを高精度で抽出し、特に中国語と英語のテキスト認識に最適化されています。認識されたテキストをプレーンテキスト形式で返すため、日常のドキュメント、スクリーンショット、一般的なテキスト抽出タスクに最適です。

このAPIは統一されたJSONリクエスト形式を使用し、URL参照またはbase64エンコードされた画像データを受け入れます。

認証

APIは以下の認証方法をサポートしています:

  • APIキー: クエリパラメータとしてAPIキーを渡す ?key=YOUR_API_KEY

画像からテキストを抽出

中国語と英語に最適化された高精度テキスト認識技術を使用して、画像ファイルからテキストを抽出します。

リクエスト

POST /api/text-recognition

パラメータ:

パラメータ必須説明
documentobjectはいドキュメントオブジェクト
document.typestringはい固定値 "image_url"
document.image_urlstringはい画像URLまたはbase64データ
filenamestringいいえファイル名(base64データの場合推奨)
keystringいいえAPIキー(クエリパラメータ、ログインユーザーにはオプション)

サポート言語:

  • 中国語(中文)
  • 英語(English)

例:

画像URLを使用:

curl -X POST "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "https://llmocr.com/image.jpg"
    }
  }'

Base64画像データを使用:

curl -X POST "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAYABgAAD..."
    },
    "filename": "document.jpg"
  }'

レスポンス

成功レスポンス(200):

{
  "id": "12345",
  "filename": "document.jpg",
  "content": "This is the extracted text content from the image.\n\n这是从图像中提取的文本内容。",
  "format": "text",
  "timestamp": 1640995200000,
  "payload": "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY"
}

レスポンスフィールド:

フィールド説明
idstring処理されたドキュメントの一意の識別子
filenamestring処理された画像の元のファイル名
contentstringプレーンテキスト形式で抽出されたテキストコンテンツ
formatstring出力形式(このAPIでは常に "text")
timestampnumber処理タイムスタンプ(ミリ秒)
payloadstring処理に使用されたAPIエンドポイント

エラーレスポンス:

ステータスコード説明
400不正なリクエスト - 無効な入力パラメータ
401認証エラー - 無効または欠落しているAPIキー
403禁止 - クォータまたは権限が不足
429リクエストが多すぎます - レート制限を超過
500内部サーバーエラー - 処理に失敗

エラーレスポンス形式:

{
  "statusText": "エラーの説明"
}

サポートされている画像形式

  • JPEG (.jpg, .jpeg)
  • PNG (.png)
  • GIF (.gif)
  • WebP (.webp)

レート制限

  • 無料プラン: 月30リクエスト
  • ベーシックプラン: 月1,000リクエスト
  • プロプラン: 月5,000リクエスト
  • ウルトラプラン: 無制限リクエスト

画像要件

  • 最大ファイルサイズ: 10MB
  • 最小解像度: 100x100ピクセル
  • 最大解像度: 4000x4000ピクセル
  • サポート形式: JPEG、PNG、GIF、WebP

ベストプラクティス

  1. 画像品質: より高い精度のために、明確なテキストを含む高解像度画像を使用
  2. テキストコントラスト: テキストと背景の間に良好なコントラストを確保
  3. 画像の向き: テキストが適切に配置されていることを確認(回転していない)
  4. ファイルサイズ: 品質を維持しながら処理速度を向上させるために画像サイズを最適化
  5. エラーハンドリング: APIレスポンスに対して常に適切なエラーハンドリングを実装

SDK例

JavaScript/Node.js

const response = await fetch('https://llmocr.com/api/text-recognition?key=YOUR_API_KEY', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    document: {
      type: 'image_url',
      image_url: 'https://example.com/image.jpg'
    }
  })
});
 
const result = await response.json();
console.log(result.content);

Python

import requests
 
url = "https://llmocr.com/api/text-recognition"
params = {"key": "YOUR_API_KEY"}
data = {
    "document": {
        "type": "image_url",
        "image_url": "https://example.com/image.jpg"
    }
}
 
response = requests.post(url, params=params, json=data)
result = response.json()
print(result["content"])
Text Recognition API - LLMOCR Developer Guide