画像 Token リアルタイム計算機
画像の解像度(幅と高さ)を調整すると、OpenAI、Claude、Gemini の公式アルゴリズムに従って消費トークン数がリアルタイム計算されます。
LLM(GPT-5.5, Claude, DeepSeek)の呼び出しコストが公式より 30% - 50% 安くなります。マルチモーダル(Veo 3.1, Flux Pro)生成費用は 60%以上 安くなります!
単一のAPIキーで、テキスト、画像生成、動画生成(Runway, Veo 3.1, Kling)、音楽生成(Suno)、音声認識を統合します。複数の開発者アカウントを開設する必要はありません。
OpenAI / Anthropic の公式リクエスト形式と完全な互換性があります。既存コードの base_url 和 api_key を変更するだけで、シームレスに移行できます。
開発者統合ガイド (Cursor, Claude Code, SDK)
画像課金のよくある質問
Q: OpenAI の画像トークンはどのように計算されますか?
OpenAI では、標清 (Low) と 高清 (High) の2つのモードがあります。Low モードは画像あたり一律 85 トークンです。High モードでは、短辺が 768px、長辺が 2048px 以下になるようにアスペクト比を維持してリサイズされた後、512x512px のタイルに分割され、各タイルに 170 トークンが課され、最後に 85 トークンの基本料が加算されます。
Q: なぜ高解像度画像の入力は料金が高くなるのですか?
マルチモーダルAI(GPT-4o や Gemini)では、画像は「アテンションタイル」に分割されるためです。4Kなどの超高解像度画像は十数個のタイルに分割され、1枚で2,000トークン以上(テキスト数千文字分に相当)を消費することがあります。事前に最適な解像度に縮小することで、API利用料を約 80% 節約できます。
主要モデルの画像分割ルール
各AIプロバイダーは全く異なる画像エンコード式を採用しています。これらを理解することはアプリ設計の最適化に直結します:
- OpenAI (o1 / o3 / GPT-4o): 512x512タイル分割。例えば、1024x1024px の高精細画像は 2x2 = 4 タイルに分割され、計 `4 * 170 + 85 = 765` トークンが課されます。
- Anthropic (Claude 3.5 / 3.7): 数式 `(幅 * 高さ) / 750` による近似計算です。例えば、1024x1024px の場合、消費トークン数は約 1400 トークンになります。
- Google (Gemini 2.5 / 3.5): 画像のいずれかの辺が 384px を超える場合、768x768 のタイルに分割され、1タイルあたり固定 258 トークンを消費します。