Case study · Voice LLM
Pili Voice — la llamada que se escribe sola.
Call-center asistido por voz LLM para Migro. Telnyx contesta, ElevenLabs habla en español natural, Whisper transcribe y Claude resume — todo en directo, durante la llamada. Al colgar, el CRM ya tiene el caso estructurado.
Llamada entrante
+34 919 27 64 12
Lima, PE · primera llamada
Transcripción en directo
Rol
Builder · Voice AI
Año
2024 — present
Stack core
Telnyx · ElevenLabs
Modelos
Whisper · Claude
Idiomas
ES · EN · PT
01 · El problema
El intake telefónico es el cuello de botella oculto.
Una llamada de inmigración bien hecha dura 15 minutos. Después, el agente humano necesita 5 más para meter los datos en el CRM. Multiplica por 30 llamadas al día. Eso son 2,5 horas perdidas cada día, por agente, solo en transcripción.
15min
Por llamada
Tiempo medio de un intake real con dudas y ramas.
+5min
Post-llamada
El agente vuelca la conversación al CRM de memoria.
0min
Con Pili Voice
Pili contesta, conversa y deja el CRM lleno antes de colgar.
02 · Cómo funciona
Cinco piezas. Un solo pipeline.
Cada llamada entrante pasa por un pipeline tipado. Las cinco piezas hablan entre ellas por websocket — todo ocurre en directo, mientras el cliente todavía está al teléfono.
Telnyx
contesta · número ES
ElevenLabs
voz · ES neutro
Whisper
transcribe live
Claude
razona · resume
CRM record
estructurado
Durante la llamada
- →Streaming bidireccional: Pili escucha y habla en paralelo, sin pausas robóticas.
- →Function calling tipado: si el caller dice "soy peruano", Pili llama a
set_nationality()sobre el backend. - →Conversation memory: Pili no se olvida lo que dijiste hace 8 minutos.
- →Escalado a humano: si el caso pinta complejo, Pili agenda llamada con abogado real.
Al colgar
- ✓Resumen de 4 líneas escrito por Claude — lo que pidió, lo que le ofrecimos, próximos pasos, riesgo.
- ✓Datos estructurados en el CRM: nacionalidad, destino, situación legal, urgencia.
- ✓Transcripción completa guardada con timestamps y speaker tags.
- ✓Audio archivado en S3, cifrado, con retention policy GDPR.
03 · Ejemplo real
Una llamada → un caso listo.
Lo que el agente humano ve en el CRM automáticamente al terminar la llamada. Sin teclear nada. Los campos con la etiqueta AI los extrajo Pili durante la conversación.
Transcripción · resumida
12:34 · 14:51PILI · 12:34:08
Hola, soy Pili de Migro. ¿En qué te puedo ayudar hoy?
CALLER · 12:34:15
Hola, estoy en Lima y quiero mudarme a Madrid el año que viene. Tengo nacionalidad peruana y mi pareja es española.
PILI · 12:34:42
Perfecto. Por tu situación, lo más probable es que apliques a residencia por pareja de hecho con español. ¿Están casados o registrados como pareja de hecho?
CALLER · 12:35:02
Estamos casados desde 2023, pero ella se mudó a España hace 6 meses.
…14 minutos más…
Cero teclas humanas
04 · Voice safety
Las llamadas con LLM se rompen feo si las dejas solas.
Pili Voice incluye desde el día uno la fontanería que la mayoría de demos omite. Es lo que separa una demo en TikTok de algo que puede coger una llamada real con un trámite legal de por medio.
Hallucination guard
Pili NO inventa requisitos legales. Si no sabe, escala a humano.
Audit trail
Cada decisión queda registrada con prompt, output y function calls.
Cost ceiling
Tope de gasto por llamada y por día — Pili cuelga si lo va a romper.
Kill switch
Un endpoint apaga todo el fleet en menos de 5 segundos.
05 · Outcomes
El intake se mueve solo.
Pili Voice corre 24/7 sobre la línea española de Migro. La misma arquitectura está disponible para clientes — tu producto, tu voz, tu CRM.
15min
→ 0 min de admin
24/7
Línea cubierta
3
Idiomas · ES · EN · PT
100%
Llamadas en CRM
<1s
Latencia de respuesta
GDPR
Audio cifrado · retention
Siguiente case study
Pili · la empresa agéntica · Sandra y la flota