Como controlo o consumo?
Crie chaves por projeto, defina budget por chave e acompanhe uso no console antes de aumentar volume.
IA generativa
Use modelos por API familiar, crie chaves no console, defina budget e acompanhe consumo em real junto dos seus apps e bancos.
A experiência de IA segue a mesma lógica da plataforma: criar chave, integrar por base URL, medir consumo e evoluir o uso com previsibilidade.
Consulte os modelos disponíveis, janela de contexto, concorrência e limites de consumo antes de levar para produção. A documentação técnica mantém os parâmetros e erros atualizados para integrações mais sensíveis.
Casos em que faz sentido manter API de IA, budget e consumo no mesmo console dos apps e bancos.
Use quando você quer integrar IA ao produto sem separar infraestrutura, chave, budget e consumo em outro console.
Conecte sistemas internos, atendimento e automações usando uma API familiar.
Extraia, classifique e transforme texto com acompanhamento de consumo em real.
Uma sequência curta para criar chave, trocar a base URL e observar consumo antes de escalar uso.
Fluxo de API key por projeto, com budget para limitar uso e reduzir surpresa de consumo.
Use a compatibilidade OpenAI com base_url da Zenifra e o modelo disponível no console.
Acompanhe chamadas, custos e limites antes de expandir para fluxos críticos.
Decisões que ajudam a separar ambientes, limitar orçamento e entender limites atuais da API.
Escolha o modelo disponível para o caso de uso e confirme limitações atuais.
Controle de consumo por chave ajuda a separar ambientes e integrações.
Verifique janela de contexto e limites antes de workloads mais sensíveis.
Use chaves separadas para desenvolvimento, staging e produção.
Teste com a mesma interface que você já usa em projetos OpenAI-compatible: troque a base URL, use sua chave da Zenifra e envie a primeira requisição.
curl https://ai.zenifra.com/v1/chat/completions \
-H "Authorization: Bearer $ZENIFRA_AI_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model":"zenifra/qwen3.6-35b-a3b","messages":[{"role":"user","content":"Olá, quem é você?"}]}' \
| jq -r '.choices[0].message.content'import OpenAI from 'openai'
const client = new OpenAI({
apiKey: process.env.ZENIFRA_AI_API_KEY,
baseURL: 'https://ai.zenifra.com/v1',
})
const completion = await client.chat.completions.create({
model: 'zenifra/qwen3.6-35b-a3b',
messages: [
{ role: 'user', content: 'Olá, quem é você?' },
],
})
console.log(completion.choices[0].message.content)import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["ZENIFRA_AI_API_KEY"],
base_url="https://ai.zenifra.com/v1",
)
completion = client.chat.completions.create(
model="zenifra/qwen3.6-35b-a3b",
messages=[
{"role": "user", "content": "Olá, quem é você?"},
],
)
print(completion.choices[0].message.content)Crie chaves por projeto, defina budget por chave e acompanhe consumo para manter previsibilidade antes de escalar o uso.
Respostas curtas para decidir se a API de IA já encaixa no seu fluxo.
Crie chaves por projeto, defina budget por chave e acompanhe uso no console antes de aumentar volume.
Na maioria dos casos, basta usar cliente compatível com OpenAI e alterar baseURL, modelo e API key.