Melhores práticas do assistente

Última atualização: 1 de setembro de 2025

Obter ótimos resultados geralmente se resume a escolher as configurações corretas do motor. Use esta lista de verificação ao configurar um assistente:

1. Escolha um Modo

Modo	Por que escolhê-lo?	Observações
Dualplex (Beta)	Troca de turnos rápida + vozes premium/clonadas	Padrão recomendado. Combine com Gemini Flash 2.0/2.5 ou GPT‑5 Realtime.
Speech-to-Speech (Multimodal)	Troca de turnos mais rápida e fluxo mais natural	Modelo recomendado: GPT‑5 Realtime.
Pipeline	Controle máximo sobre voz e respostas longas	Modelo recomendado: GPT‑5 Mini. Se você selecionar Pipeline, continue para a etapa Transcritor abaixo.

Quer saber mais sobre as diferenças entre os modos? Leia o guia Modos do assistente.

Experimente os três modos: grave o mesmo cenário em cada um e compare o tempo de resposta e a satisfação do chamador.

2. Escolha um Transcritor (apenas Pipeline)

Transcritor	Precisão	Latência	Melhor para
Azure	⭐⭐⭐⭐	⏱️⏱️⏱️ (mais lento)	Quando você precisa da mais alta fidelidade de transcrição.
Gladia	⭐⭐⭐	⏱️ (mais rápido)	Boa opção completa para a maioria dos idiomas.
Deepgram	⭐⭐⭐	⏱️ (mais rápido)	Outra escolha sólida—teste qual tem melhor desempenho para seu idioma e configuração de áudio.

Dica: Diferentes idiomas, sotaques ou ruídos de fundo podem afetar cada motor de forma diferente. Execute um teste A/B rápido e mantenha o melhor desempenho.

3. Selecione um Modelo LLM

Modelo	Pontos fortes	Compensações
GPT-5 Mini	Raciocínio equilibrado com baixa latência	Pode ser mais lento que os modelos em tempo real para trocas rápidas de turnos.
GPT-5 Realtime	Projetado para trocas de voz de latência ultra baixa	Melhor para Speech-to-Speech e Dualplex.
GPT-4o	Raciocínio forte e compreensão multimodal	Latência mais alta.
Gemini Flash 2.0 / 2.5	Ultra-rápido para trocas de voz em Dualplex/Multimodal	Excelente para minimizar a latência percebida.

Se a velocidade é crítica, use GPT‑5 Realtime (ótimo para Speech-to-Speech) ou Gemini Flash 2.0/2.5 (ótimo com Dualplex). Para raciocínio mais rico, use GPT-4o ou GPT-5 Mini e compense a latência usando áudios de preenchimento.

4. Cancelamento de Ruído

Se os chamadores estiverem em viva-voz ou em um ambiente silencioso, mantenha o cancelamento de ruído ATIVADO. Se o volume de chamadas for baixo ou algumas palavras estiverem “cortadas”, DESATIVE para que o transcritor receba a forma de onda completa.

Se seu assistente não está ouvindo você bem, você pode tentar desativar o cancelamento de ruído.

5. Temporizadores de Conversação

Parâmetro	Recomendado	Por quê
Reengajamento	`≈ 30 s`	Dá aos chamadores tempo suficiente para pensar. Valores mais baixos podem parecer agressivos.
Duração máxima de silêncio	`≈ 60 s`	Evita desligamentos prematuros enquanto ainda encerra chamadas verdadeiramente silenciosas.

Teste valores diferentes em chamadas reais—muito baixo pode interromper, muito alto deixa lacunas estranhas.

6. Mensagem Inicial

Modo	Como é usado	Melhor prática
Pipeline	Lido exatamente como escrito (convertido por TTS).	Escreva a saudação literalmente: “Olá, aqui é Alex da …”.
Dualplex	Lido exatamente como escrito (renderizado via ElevenLabs TTS).	Escreva a saudação literalmente, depois selecione sua voz clonada.
Speech-to-Speech	Interpretado como um prompt pelo modelo.	Inclua instruções como “Cumprimente o cliente e diga …” ou adicione `diga exatamente:` para garantir saída literal.

7. Som ambiente

Habilitado por padrão, o som ambiente é um recurso que adiciona ruído de fundo à voz do assistente.

Se o assistente não está ouvindo você bem, você pode tentar desativar o som ambiente ou diminuir o volume.

8. Controles deslizantes de ponto final

Controle quando seu assistente começa a falar com o controle deslizante de sensibilidade de ponto final na parte inferior das configurações do assistente.

Configuração	Efeito	Use quando
Sensibilidade mais baixa	Assistente responde mais rápido depois que o chamador para de falar	Você quer conversas rápidas e ágeis
Sensibilidade mais alta	Assistente espera mais tempo antes de responder	Chamadores dão respostas mais longas e detalhadas

Dica profissional: Se seu assistente corta os chamadores no meio da frase, aumente a sensibilidade. Se as respostas parecerem lentas, diminua.

9. Debug usando transcrição de chamada

Se você estiver tendo problemas com seu assistente, pode usar a transcrição de chamada para depurar o problema.

Vá para a página de Histórico de chamadas.
Clique na última chamada que você testou
A transcrição da chamada será mostrada incluindo chamadas de função e seus parâmetros.

10. Ainda tem dúvidas?

Se você tiver alguma dúvida, entre em contato com nossa equipe de suporte através do widget de chat dentro do aplicativo.

Teste diferentes configurações com chamadas reais—o equilíbrio certo depende do seu fluxo de conversação e padrões de comportamento do chamador.

Precisa de uma lista completa de cada opção e controle deslizante? Consulte a referência completa de configurações do assistente.

Modos do Assistente Prompts do Sistema

​1. Escolha um Modo

​2. Escolha um Transcritor (apenas Pipeline)

​3. Selecione um Modelo LLM

​4. Cancelamento de Ruído

​5. Temporizadores de Conversação

​6. Mensagem Inicial

​7. Som ambiente

​8. Controles deslizantes de ponto final

​9. Debug usando transcrição de chamada

​10. Ainda tem dúvidas?

1. Escolha um Modo

2. Escolha um Transcritor (apenas Pipeline)

3. Selecione um Modelo LLM

4. Cancelamento de Ruído

5. Temporizadores de Conversação

6. Mensagem Inicial

7. Som ambiente

8. Controles deslizantes de ponto final

9. Debug usando transcrição de chamada

10. Ainda tem dúvidas?