Nota: El cálculo es aproximado basado en datos públicos. Los precios pueden cambiar, consulte los sitios web oficiales.
Esta calculadora le permite estimar el costo de usar el modelo NVIDIA Llama 3.3 Nemotron Super 49B V1.5.
El modelo Llama 3.3 Nemotron Super 49B V1.5 es un modelo de razonamiento/chat de 49 mil millones de parámetros centrado en el inglés, derivado de Llama-3.3-70B-Instruct de Meta con un contexto de 128K. Está post-entrenado para flujos de trabajo de agentes (RAG, llamada a herramientas) a través de SFT en matemáticas, código, ciencia y chat de múltiples turnos, seguido de múltiples etapas de RL. Utiliza optimización de preferencia consciente de recompensas (RPO) para alineación, RL con recompensas verificables (RLVR) para razonamiento paso a paso, y DPO iterativo para refinar el comportamiento de uso de herramientas.
Los costos se basan en los siguientes precios por cada millón de tokens:
- Tokens de entrada: $0.1
- Tokens de salida: $0.4
El tamaño del contexto del modelo es de 131,072 tokens.
La fórmula para calcular el costo total es:
Costo Total = (Tokens de Entrada / 1,000,000) * Costo por Millón de Tokens de Entrada + (Tokens de Salida / 1,000,000) * Costo por Millón de Tokens de Salida) * Número de Solicitudes
Ejemplo de cálculo:
Si desea procesar 500,000 tokens de entrada y generar 200,000 tokens de salida en 10 solicitudes:
- Costo de entrada: (500,000 / 1,000,000) * $0.1 * 10 = $0.5
- Costo de salida: (200,000 / 1,000,000) * $0.4 * 10 = $0.8
- Costo total: $0.5 (entrada) + $0.8 (salida) = $1.3
Ingrese el número de tokens de entrada y salida, así como el número de solicitudes, para obtener una estimación del costo.