Las palabras son unidades humanas
Las palabras ayudan a leer y escribir, pero no suelen ser la unidad que usan las APIs de IA para facturar.
Tokens vs palabras
Las palabras son fáciles de contar para las personas, pero los modelos de IA suelen procesar el texto como tokens. Pega tu texto para comparar caracteres, palabras, tokens estimados y coste potencial.
Calculadora
Pega un prompt, elige un perfil de precio de ejemplo y estima el coste por ejecución, por día y por mes.
Los tokens de entrada son lo que envías al modelo de IA. Los tokens de salida son lo que devuelve el modelo. Los proveedores suelen cobrarlos por separado.
Los precios son manuales por ahora. Ejemplo: si tu proveedor cobra $2 input y $10 output por 1M tokens, introduce 2 y 10.
El uso energético es una estimación aproximada. Depende del modelo, hardware, proveedor, eficiencia del datacenter, carga y región.
Las palabras ayudan a leer y escribir, pero no suelen ser la unidad que usan las APIs de IA para facturar.
Un artículo de 500 palabras, un JSON de 500 palabras y un bloque de código de 500 palabras pueden producir conteos de tokens y costes distintos.
Un token puede ser una palabra, parte de una palabra, puntuación, espacios, código o formato.
Idioma, puntuación, código, markdown, JSON y estructura del mensaje pueden cambiar la estimación.
El coste de IA suele basarse en tokens de entrada y salida, no en palabras. PromptMeter muestra todo junto.
La prosa simple suele ser más fácil de estimar. Texto técnico, código, JSON y markdown pueden usar más tokens porque símbolos y estructura también cuentan.
Inglés, español, alemán, chino y japonés pueden tokenizar de forma diferente. Trata cada estimación por idioma como aproximada.
| Tipo de contenido | Comportamiento de tokens | Notas |
|---|---|---|
| Prosa simple | Suele estar cerca de la estimación general | Varía por idioma y puntuación |
| Texto técnico | A menudo algo más denso | Siglas y símbolos pueden cambiar el conteo |
| Código | A menudo más denso | Llaves, operadores e indentación importan |
| JSON | A menudo más denso | Claves, comillas y estructura repetida añaden tokens |
| Markdown | Variable | Listas, encabezados y formato afectan las estimaciones |
Estas tablas son orientativas, no mediciones oficiales de tokenizadores.
| Idioma/escritura | Por qué puede variar |
|---|---|
| Inglés | Suele estar cerca de estimaciones comunes de tokens |
| Español/francés/italiano/portugués | Acentos, palabras más largas y puntuación pueden desplazar la estimación |
| Alemán/neerlandés/polaco/ruso | Palabras compuestas y morfología pueden cambiar el conteo |
| Chino/japonés/coreano | Las escrituras basadas en caracteres se comportan distinto a estimaciones basadas en palabras |
| Código/texto estructurado | La estructura puede importar más que el idioma natural |
Estas tablas son orientativas, no mediciones oficiales de tokenizadores.
| Tipo de texto | Por qué contar palabras puede engañar | Mejor estimación |
|---|---|---|
| Prosa simple | Las palabras pueden aproximarse a estimaciones comunes, pero idioma y puntuación importan | Estimar tokens directamente |
| Código | Operadores, llaves, indentación e identificadores cortos cuentan aunque haya pocas palabras | Usar una estimación de tokens con supuestos de código |
| JSON | Claves, comillas, llaves, comas y estructura repetida añaden tokens | Estimar tokens de entrada y salida por separado |
| Markdown | Encabezados, listas, enlaces y tablas añaden tokens de formato | Comparar caracteres, palabras y tokens estimados |
| Respuestas largas | La facturación depende de tokens generados, no de las palabras enviadas al principio | Usar una estimación de coste de tokens de salida |
El coste depende de tokens de entrada y salida, no solo del número de palabras.
FAQ
No. Algunas palabras son un token, otras se dividen en varios, y la puntuación o el formato también pueden contar.
Los proveedores suelen cobrar el uso de API por tokens. Más tokens de entrada o salida suelen aumentar el coste.
Sí. Modelos y tokenizadores distintos pueden contar el mismo texto de forma diferente, por eso son estimaciones.
A menudo sí. Claves, puntuación, llaves, corchetes, indentación y campos repetidos pueden aumentar la densidad de tokens.