Criar assistente
Assistentes
Criar assistente
Criar um novo assistente de IA com configuração especificada.
POST
Criar assistente
Este endpoint permite criar um novo assistente de IA com opções abrangentes de configuração.
Modos de Motor
A API suporta três modos de motor, cada um com diferentes capacidades:| Modo | Descrição | Campos Obrigatórios |
|---|---|---|
pipeline | Pipeline tradicional STT → LLM → TTS | llm_model_id |
multimodal | IA multimodal em tempo real | multimodal_model_id |
dualplex | Cérebro multimodal + voz TTS personalizada | multimodal_model_id |
Corpo da Requisição
Campos Obrigatórios Principais
O nome do assistente (máx. 255 caracteres)
O ID da voz a ser usado para o assistente. Use o endpoint Get Voices com o parâmetro
mode para obter vozes compatíveis para seu modo de motor.O ID do idioma para o assistente. Use o endpoint Get Languages para obter idiomas disponíveis.
O tipo do assistente. Opções:
inbound, outboundO modo do motor. Opções:
pipeline, multimodal, dualplexO fuso horário para o assistente (ex.: “Europe/Bucharest”, “America/New_York”)
A mensagem inicial que o assistente falará quando a ligação iniciar (máx. 200 caracteres)
O prompt do sistema que define o comportamento e personalidade do assistente
Campos Específicos do Modo
O ID do modelo LLM a ser usado. Obrigatório para modo
pipeline.Use o endpoint Get Models para obter modelos disponíveis.O ID do modelo multimodal. Obrigatório para modos
multimodal e dualplex.Use o endpoint Get Models para obter modelos multimodais disponíveis.ID do modelo LLM de fallback para chamadas de ferramenta em modos multimodal/dualplex. Opcional.
Sensibilidade de detecção de turno para modos multimodal/dualplex (0-1). Padrão: auto
Idiomas Secundários
Array de IDs de idiomas adicionais que o assistente pode falar. O assistente detectará automaticamente e mudará de idioma.
Configurações da Base de Conhecimento
O ID da base de conhecimento para anexar a este assistente
Como usar a base de conhecimento. Opções:
function_call- IA chama uma função para buscar (obrigatório para multimodal/dualplex)prompt- Conhecimento é injetado no prompt (apenas pipeline)
Número de Telefone
O ID de um número de telefone para atribuir ao assistente. Deve pertencer à sua conta.
Ferramentas Personalizadas Durante Chamada
Array de IDs de ferramentas personalizadas durante chamada para anexar. Cada ferramenta deve pertencer à sua conta.
Ferramentas Integradas
Array de ferramentas integradas para ativar. Cada ferramenta tem um
type e campos específicos da ferramenta.Configurações de Voz e TTS
Se ativar a síntese de texto para fala emocional
Configuração de estabilidade da voz (0-1). Maior = voz mais consistente
Configuração de similaridade da voz (0-1). Maior = mais próxima da voz original
Multiplicador de velocidade da fala (0.7-1.2)
Configuração de temperatura do LLM (0-1). Menor = mais determinístico
ID personalizado do provedor TTS. Auto-selecionado baseado no idioma se não fornecido. Use o endpoint Get Synthesizer Providers para descobrir provedores disponíveis.
ID personalizado do provedor STT. Auto-selecionado baseado no idioma se não fornecido. Apenas modo pipeline. Use o endpoint Get Transcriber Providers para descobrir provedores disponíveis.
Configurações de Comportamento da Ligação
Se permitir interrupções do chamador.
Se usar áudio de preenchimento durante processamento (ex.: “hm”, “deixe-me verificar”).
Perfis personalizados de palavras de preenchimento por categoria. Se não fornecido, padrões são definidos baseados no idioma do assistente. Cada categoria é um array de frases curtas.
positive: Palavras de preenchimento para respostas positivas/afirmativas (ex.: “Ótimo!”, “Perfeito!”)negative: Palavras de preenchimento para respostas negativas/neutras (ex.: “Hmm.”, “Mhm.”)question: Palavras de preenchimento ao processar uma pergunta (ex.: “Hmm.”, “Deixe-me pensar.”)neutral: Palavras de preenchimento para reconhecimentos neutros (ex.: “Ok.”, “Entendo.”)
Se gravar a ligação
Se ativar o cancelamento de ruído
Se verdadeiro, o assistente aguarda o cliente falar primeiro
Configurações de Tempo
Duração máxima da ligação em segundos (20-1200)
Duração máxima de silêncio antes do re-engajamento em segundos (1-360)
Silêncio máximo no início da ligação antes de encerrar (1-120 segundos). Opcional.
Tempo máximo de toque antes de desistir (1-60 segundos)
Configurações de Re-engajamento
Intervalo de re-engajamento em segundos (7-600)
Prompt personalizado para mensagens de re-engajamento (máx. 1000 caracteres)Exemplo:
"Você ainda está aí? Tem alguma outra pergunta?"Configurações de Correio de Voz
Se encerrar a ligação quando correio de voz for detectado
Mensagem para deixar no correio de voz antes de desligar (máx. 1000 caracteres)
Detecção de Endpoint
Tipo de detecção de atividade de voz. Opções:
vad, aiNível de sensibilidade do endpoint (0-5)
Nível de sensibilidade de interrupção (0-5)
Palavras mínimas antes da interrupção ser permitida (0-10). Defina para habilitar.
Som Ambiente
Som ambiente de fundo. Opções:
off, office, city, forest, crowded_room, cafe, natureNível de volume do som ambiente (0-1)
Configuração de Webhook
Se as notificações de webhook estão ativadas
A URL do webhook para notificações pós-ligação. Obrigatório se
is_webhook_active for verdadeiro.Se enviar webhooks apenas em ligações completadas (não falhas/sem resposta)
Se incluir URL de gravação no payload do webhook
Avaliação Pós-Ligação
Se ativar avaliação pós-ligação por IA
Definição do esquema para extração de dados pós-ligação
Variáveis
Pares chave-valor de variáveis personalizadas acessíveis em prompts via
{{nome_variavel}}Configurações de Conversa Finalizada
Minutos de inatividade do chat antes da conversa ser considerada finalizada (1-1440)
Se permitir reativar a conversa após ela terminar por inatividade
URL do webhook chamada quando uma conversa de chat termina por inatividade. Separada do webhook principal de chamadas.
Exemplos de Requisição
Assistente Modo Pipeline
Assistente Modo Multimodal
Assistente Modo Dualplex
Resposta
Mensagem de sucesso confirmando a criação do assistente
Notas
- Todos os campos obrigatórios devem ser fornecidos para criação bem-sucedida do assistente
- Use o endpoint Get Voices com parâmetro
modepara obter vozes compatíveis - Para modos multimodal/dualplex,
knowledgebase_modedeve serfunction_call - Para modos multimodal/dualplex,
allow_interruptionsestá sempre ativo - Fillers estão disponíveis apenas no modo pipeline
- O assistente é criado com status
inactivepor padrão

