Empieza por la unidad de uso
Define si tu estimación empieza por usuario, request, llamada IA o paso de workflow. Una acción de usuario puede activar una llamada al modelo o varias por detrás.
Guía de coste API
Los costes de API de IA pueden crecer rápido cuando aumentan usuarios, requests, longitud de respuesta y workflows con varias llamadas. Esta guía explica cómo estimar costes antes de lanzar o escalar una app.
Estima costes API con PromptMeter
Define si tu estimación empieza por usuario, request, llamada IA o paso de workflow. Una acción de usuario puede activar una llamada al modelo o varias por detrás.
Empieza con usuarios al día, requests por usuario y días al mes. Estos tres números convierten una estimación de prompt en una estimación de uso de producto.
Los tokens de entrada incluyen prompt de usuario, instrucciones reutilizables, contexto, ejemplos, documentos copiados y texto recuperado que se envía al modelo.
Los tokens de salida dependen de longitud de respuesta, salida estructurada, JSON, tablas, resúmenes y si el workflow pide una respuesta breve o detalle completo.
coste por request = coste de tokens de entrada + coste de tokens de salida. Usa precios manuales de entrada y salida por 1M tokens y verifícalos con tu proveedor.
coste mensual = coste por request x requests al día x días al mes. Es el puente básico entre una llamada IA y un presupuesto mensual.
Agentes, RAG, clasificadores, resumidores y prompts encadenados pueden multiplicar el coste porque un request de usuario puede ejecutar varias llamadas al modelo.
Compara proyecto pequeño, SaaS MVP, app en crecimiento, uso viral y herramienta enterprise/interna antes de que llegue el tráfico.
Una estimación simple puede no incluir embeddings, base de datos vectorial, reintentos, descuentos por caché, descuentos batch, observabilidad o detalles de pricing por proveedor.
Estima usuarios, requests, tokens de entrada, tokens de salida, pricing del proveedor, uso 10x y 100x, y revisa supuestos cada mes.
| Input | Qué significa | Por qué importa |
|---|---|---|
| Usuarios/día | Cuántos usuarios activos usan la app | Impulsa el volumen total |
| Requests/usuario/día | Con qué frecuencia cada usuario activa IA | Impulsa el número de requests |
| Llamadas IA/request | Cuántas llamadas al modelo ocurren por acción de usuario | Multiplica el coste |
| Tokens de entrada/llamada | Lo que envías al modelo | Impulsa el coste de entrada |
| Tokens de salida/llamada | Lo que devuelve el modelo | Impulsa el coste de salida |
| Escenario | Qué revisar |
|---|---|
| Proyecto pequeño | ¿El tramo gratis o de bajo coste aguanta el tráfico inicial? |
| SaaS MVP | ¿Qué pasa si crecen los usuarios activos diarios? |
| App en crecimiento | ¿Los workflows con varias llamadas multiplican el coste? |
| App viral | ¿Los picos de uso siguen siendo asumibles? |
| Herramienta enterprise/interna | ¿Cuál es el coste por empleado o equipo? |
FAQ
Empieza con usuarios, requests, llamadas IA por request, tokens de entrada, tokens de salida y precios del proveedor por 1M tokens. Después escala a uso diario y mensual.
Los tokens de salida los genera el modelo y suelen tener precio separado. Respuestas largas, JSON, tablas y workflows de varios pasos pueden hacer que la salida domine el coste.
No. PromptMeter usa precios manuales o de ejemplo para que introduzcas el pricing actual del proveedor y lo verifiques antes de decidir.
Actualízala antes de lanzar, después de cambiar modelo o formato de respuesta, cuando crezca el uso y al menos cada mes en productos activos.
Puede excluir embeddings, bases de datos vectoriales, reintentos, descuentos por caché o batch, monitorización, almacenamiento y reglas específicas de facturación.