Skip to main content
Última atualização: 1 de setembro de 2025
Obter ótimos resultados geralmente se resume a escolher as configurações corretas do motor. Use esta lista de verificação ao configurar um assistente:

1. Escolha um Modo

ModoPor que escolhê-lo?Observações
Dualplex (Beta)Troca de turnos rápida + vozes premium/clonadasPadrão recomendado. Combine com Gemini Flash 2.0/2.5 ou GPT‑5 Realtime.
Speech-to-Speech (Multimodal)Troca de turnos mais rápida e fluxo mais naturalModelo recomendado: GPT‑5 Realtime.
PipelineControle máximo sobre voz e respostas longasModelo recomendado: GPT‑5 Mini. Se você selecionar Pipeline, continue para a etapa Transcritor abaixo.
Quer saber mais sobre as diferenças entre os modos? Leia o guia Modos do assistente.
Experimente os três modos: grave o mesmo cenário em cada um e compare o tempo de resposta e a satisfação do chamador.

2. Escolha um Transcritor (apenas Pipeline)

TranscritorPrecisãoLatênciaMelhor para
Azure⭐⭐⭐⭐⏱️⏱️⏱️ (mais lento)Quando você precisa da mais alta fidelidade de transcrição.
Gladia⭐⭐⭐⏱️ (mais rápido)Boa opção completa para a maioria dos idiomas.
Deepgram⭐⭐⭐⏱️ (mais rápido)Outra escolha sólida—teste qual tem melhor desempenho para seu idioma e configuração de áudio.
Dica: Diferentes idiomas, sotaques ou ruídos de fundo podem afetar cada motor de forma diferente. Execute um teste A/B rápido e mantenha o melhor desempenho.

3. Selecione um Modelo LLM

ModeloPontos fortesCompensações
GPT-5 MiniRaciocínio equilibrado com baixa latênciaPode ser mais lento que os modelos em tempo real para trocas rápidas de turnos.
GPT-5 RealtimeProjetado para trocas de voz de latência ultra baixaMelhor para Speech-to-Speech e Dualplex.
GPT-4oRaciocínio forte e compreensão multimodalLatência mais alta.
Gemini Flash 2.0 / 2.5Ultra-rápido para trocas de voz em Dualplex/MultimodalExcelente para minimizar a latência percebida.
Se a velocidade é crítica, use GPT‑5 Realtime (ótimo para Speech-to-Speech) ou Gemini Flash 2.0/2.5 (ótimo com Dualplex). Para raciocínio mais rico, use GPT-4o ou GPT-5 Mini e compense a latência usando áudios de preenchimento.

4. Cancelamento de Ruído

Se os chamadores estiverem em viva-voz ou em um ambiente silencioso, mantenha o cancelamento de ruído ATIVADO. Se o volume de chamadas for baixo ou algumas palavras estiverem “cortadas”, DESATIVE para que o transcritor receba a forma de onda completa.
Se seu assistente não está ouvindo você bem, você pode tentar desativar o cancelamento de ruído.

5. Temporizadores de Conversação

ParâmetroRecomendadoPor quê
Reengajamento≈ 30 sDá aos chamadores tempo suficiente para pensar. Valores mais baixos podem parecer agressivos.
Duração máxima de silêncio≈ 60 sEvita desligamentos prematuros enquanto ainda encerra chamadas verdadeiramente silenciosas.
Teste valores diferentes em chamadas reais—muito baixo pode interromper, muito alto deixa lacunas estranhas.

6. Mensagem Inicial

ModoComo é usadoMelhor prática
PipelineLido exatamente como escrito (convertido por TTS).Escreva a saudação literalmente: “Olá, aqui é Alex da …”.
DualplexLido exatamente como escrito (renderizado via ElevenLabs TTS).Escreva a saudação literalmente, depois selecione sua voz clonada.
Speech-to-SpeechInterpretado como um prompt pelo modelo.Inclua instruções como “Cumprimente o cliente e diga …” ou adicione diga exatamente: para garantir saída literal.

7. Som ambiente

Habilitado por padrão, o som ambiente é um recurso que adiciona ruído de fundo à voz do assistente.
Se o assistente não está ouvindo você bem, você pode tentar desativar o som ambiente ou diminuir o volume.

8. Controles deslizantes de ponto final

Controle quando seu assistente começa a falar com o controle deslizante de sensibilidade de ponto final na parte inferior das configurações do assistente.
ConfiguraçãoEfeitoUse quando
Sensibilidade mais baixaAssistente responde mais rápido depois que o chamador para de falarVocê quer conversas rápidas e ágeis
Sensibilidade mais altaAssistente espera mais tempo antes de responderChamadores dão respostas mais longas e detalhadas
Dica profissional: Se seu assistente corta os chamadores no meio da frase, aumente a sensibilidade. Se as respostas parecerem lentas, diminua.

9. Debug usando transcrição de chamada

Se você estiver tendo problemas com seu assistente, pode usar a transcrição de chamada para depurar o problema.
  1. Vá para a página de Histórico de chamadas.
  2. Clique na última chamada que você testou
  3. A transcrição da chamada será mostrada incluindo chamadas de função e seus parâmetros.

10. Ainda tem dúvidas?

Se você tiver alguma dúvida, entre em contato com nossa equipe de suporte através do widget de chat dentro do aplicativo.
Teste diferentes configurações com chamadas reais—o equilíbrio certo depende do seu fluxo de conversação e padrões de comportamento do chamador.

Precisa de uma lista completa de cada opção e controle deslizante? Consulte a referência completa de configurações do assistente.