Text Recognition API

概要

Text Recognition APIは、画像ファイルからテキストを高精度で抽出し、特に中国語と英語のテキスト認識に最適化されています。認識されたテキストをプレーンテキスト形式で返すため、日常のドキュメント、スクリーンショット、一般的なテキスト抽出タスクに最適です。

このAPIは統一されたJSONリクエスト形式を使用し、URL参照またはbase64エンコードされた画像データを受け入れます。

認証

APIは以下の認証方法をサポートしています：

APIキー: クエリパラメータとしてAPIキーを渡す ?key=YOUR_API_KEY

画像からテキストを抽出

中国語と英語に最適化された高精度テキスト認識技術を使用して、画像ファイルからテキストを抽出します。

リクエスト

POST /api/text-recognition

パラメータ:

パラメータ	型	必須	説明
document	object	はい	ドキュメントオブジェクト
document.type	string	はい	固定値 "image_url"
document.image_url	string	はい	画像URLまたはbase64データ
filename	string	いいえ	ファイル名（base64データの場合推奨）
key	string	いいえ	APIキー（クエリパラメータ、ログインユーザーにはオプション）

サポート言語:

中国語（中文）
英語（English）

例:

画像URLを使用:

curl -X POST "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "https://llmocr.com/image.jpg"
    }
  }'

Base64画像データを使用:

curl -X POST "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "document": {
      "type": "image_url",
      "image_url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAYABgAAD..."
    },
    "filename": "document.jpg"
  }'

レスポンス

成功レスポンス（200）:

{
  "id": "12345",
  "filename": "document.jpg",
  "content": "This is the extracted text content from the image.\n\n这是从图像中提取的文本内容。",
  "format": "text",
  "timestamp": 1640995200000,
  "payload": "https://llmocr.com/api/text-recognition?key=YOUR_API_KEY"
}

レスポンスフィールド:

フィールド	型	説明
id	string	処理されたドキュメントの一意の識別子
filename	string	処理された画像の元のファイル名
content	string	プレーンテキスト形式で抽出されたテキストコンテンツ
format	string	出力形式（このAPIでは常に "text"）
timestamp	number	処理タイムスタンプ（ミリ秒）
payload	string	処理に使用されたAPIエンドポイント

エラーレスポンス:

ステータスコード	説明
400	不正なリクエスト - 無効な入力パラメータ
401	認証エラー - 無効または欠落しているAPIキー
403	禁止 - クォータまたは権限が不足
429	リクエストが多すぎます - レート制限を超過
500	内部サーバーエラー - 処理に失敗

エラーレスポンス形式:

{
  "statusText": "エラーの説明"
}

サポートされている画像形式

JPEG (.jpg, .jpeg)
PNG (.png)
GIF (.gif)
WebP (.webp)

レート制限

無料プラン: 月30リクエスト
ベーシックプラン: 月1,000リクエスト
プロプラン: 月5,000リクエスト
ウルトラプラン: 無制限リクエスト

画像要件

最大ファイルサイズ: 10MB
最小解像度: 100x100ピクセル
最大解像度: 4000x4000ピクセル
サポート形式: JPEG、PNG、GIF、WebP

ベストプラクティス

画像品質: より高い精度のために、明確なテキストを含む高解像度画像を使用
テキストコントラスト: テキストと背景の間に良好なコントラストを確保
画像の向き: テキストが適切に配置されていることを確認（回転していない）
ファイルサイズ: 品質を維持しながら処理速度を向上させるために画像サイズを最適化
エラーハンドリング: APIレスポンスに対して常に適切なエラーハンドリングを実装

SDK例

JavaScript/Node.js

const response = await fetch('https://llmocr.com/api/text-recognition?key=YOUR_API_KEY', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    document: {
      type: 'image_url',
      image_url: 'https://example.com/image.jpg'
    }
  })
});
 
const result = await response.json();
console.log(result.content);

Python

import requests
 
url = "https://llmocr.com/api/text-recognition"
params = {"key": "YOUR_API_KEY"}
data = {
    "document": {
        "type": "image_url",
        "image_url": "https://example.com/image.jpg"
    }
}
 
response = requests.post(url, params=params, json=data)
result = response.json()
print(result["content"])

LLMOCR

APIドキュメント

クイックスタート

概要

認証