Monté una IA que llama por teléfono mejor que el becario del call center
18-mar-2026 11:46
#1
|
Qué pasa Shurs He montado una plataforma de agentes de voz con IA que automatizan llamadas telefónicas. Se llama Vocals ⚡ La idea de Vocals nació después de cerrar mi anterior startup. Mientras cerraba, varios contactos de BPOs y call centers me pedían ayuda para automatizar llamadas con IA. Me puse a investigar y vi que las soluciones que había eran carísimas, te atan a un solo proveedor y no te dan control sobre nada. Entonces pensé: 👉 ¿Y si montas una plataforma donde las empresas puedan mezclar los mejores proveedores de voz, IA y síntesis en tiempo real? 👉 ¿Y si encima pueden usar sus propias API keys y pagar solo por lo que consumen? Así surgió Vocals: orquestación de agentes de voz con IA, sin lock-in y a una fracción del coste de un call center. 🔹 ¿Qué coño hace exactamente? Imagina que tienes una empresa y necesitas hacer 6.000 llamadas al día (encuestas de satisfacción, recuperar carritos abandonados, confirmar citas, atención al cliente…). Con un call center tradicional necesitas 12 agentes a €25/hora. Con Vocals:
🔹 ¿Y cómo suena? No es el típico robot de mierda que te llama del banco. Estamos hablando de voces naturales con ElevenLabs o Fish Audio, comprensión real con Gemini o Claude, y detección de barge-in (si interrumpes, la IA se calla y escucha). A la gente le cuesta distinguir si habla con una persona o con Vocals. 🔹 ¿Para quién es?
🔹 Números actuales
🔹 Oferta especial Forocoches 🎁 No voy a regalar cuentas porque esto no es una app consumer, pero si tienes una empresa (o trabajas en una) y quieres probar Vocals, escríbeme un PM y te doy acceso PRO durante 1 mes gratis para que lo pruebes con llamadas reales. Si eres autónomo con un negocio que mueve llamadas, también. Me interesa el feedback real. 🔹 En desarrollo continuo 🛠️ Vocals está en evolución constante. Estamos añadiendo más proveedores, mejorando latencias, y preparando integraciones con CRMs. Tu feedback es clave, cualquier idea es bienvenida, podéis hacerlo aquí mismo en el hilo. Automatiza tus llamadas! 👉 Pásate por http://www.usevocals.com |
18-mar-2026 12:11
#3
|
Pues para ser honesto: las barreras de entrada técnicas no son brutales. Si eres un buen ingeniero, puedes montar un pipeline STT → LLM → TTS en un fin de semana. Lo que NO puedes montar en un fin de semana es: Que funcione en producción con llamadas reales. Una cosa es hacer una demo chula y otra es que suene bien en una línea telefónica con audio mulaw a 8kHz, con ruido de fondo, con gente que interrumpe a la IA a mitad de frase y con picos de miles de llamadas simultáneas. Ahí es donde se jode el 90% de los proyectos. La integración real con telefonía. Twilio, SIP trunks, Asterisk, AudioSocket, codecs de audio, resampling en tiempo real, detección de contestadores automáticos… no es sexy, pero es lo que hace que funcione de verdad. El ecosistema de proveedores. Tenemos 10+ proveedores integrados (Deepgram, OpenAI, ElevenLabs, Claude, Gemini, Qwen…). Cada uno con su API distinta, su formato de streaming, sus particularidades. Mantener eso funcionando y que el cliente pueda cambiar entre ellos en caliente es un dolor de cabeza que pocos quieren comerse. La confianza de las empresas. Los BPOs y call centers no te dan su tráfico de llamadas porque tengas un MVP bonito. Necesitan ver llamadas procesadas sin fallos, SLAs, analytics, y alguien que coja el teléfono si algo peta a las 3AM. ¿Se puede replicar? Sí, con tiempo y pasta. ¿Lo va a hacer alguien mañana? Probablemente no, porque los que tienen la pasta (VAPI, Retell) ya están y cobran mucho más caro, y los que podrían hacerlo técnicamente prefieren montar otra app de IA más fácil de vender. Además, creo que hay una parte importante en la distribución, ya tenemos algunos clientes que pagan y andamos con pilotos para traer más clientes. Tenemos que hacer implementación, que no es lo más escalable, pero a corto plazo nos ayuda a hacer lock in de clientes. |
18-mar-2026 12:28
#4
|
Pues para ser honesto: las barreras de entrada técnicas no son brutales. Si eres un buen ingeniero, puedes montar un pipeline STT → LLM → TTS en un fin de semana. Lo que NO puedes montar en un fin de semana es:
Que funcione en producción con llamadas reales. Una cosa es hacer una demo chula y otra es que suene bien en una línea telefónica con audio mulaw a 8kHz, con ruido de fondo, con gente que interrumpe a la IA a mitad de frase y con picos de miles de llamadas simultáneas. Ahí es donde se jode el 90% de los proyectos. La integración real con telefonía. Twilio, SIP trunks, Asterisk, AudioSocket, codecs de audio, resampling en tiempo real, detección de contestadores automáticos… no es sexy, pero es lo que hace que funcione de verdad. El ecosistema de proveedores. Tenemos 10+ proveedores integrados (Deepgram, OpenAI, ElevenLabs, Claude, Gemini, Qwen…). Cada uno con su API distinta, su formato de streaming, sus particularidades. Mantener eso funcionando y que el cliente pueda cambiar entre ellos en caliente es un dolor de cabeza que pocos quieren comerse. La confianza de las empresas. Los BPOs y call centers no te dan su tráfico de llamadas porque tengas un MVP bonito. Necesitan ver llamadas procesadas sin fallos, SLAs, analytics, y alguien que coja el teléfono si algo peta a las 3AM. ¿Se puede replicar? Sí, con tiempo y pasta. ¿Lo va a hacer alguien mañana? Probablemente no, porque los que tienen la pasta (VAPI, Retell) ya están y cobran mucho más caro, y los que podrían hacerlo técnicamente prefieren montar otra app de IA más fácil de vender. Además, creo que hay una parte importante en la distribución, ya tenemos algunos clientes que pagan y andamos con pilotos para traer más clientes. Tenemos que hacer implementación, que no es lo más escalable, pero a corto plazo nos ayuda a hacer lock in de clientes. Justamente he trabajado en un proyecto de esto para una big tech, con equipos de research en varios paises y toda la pesca. Un pez gordo nos dijo que de hecho la mayor competencia son las startups, pero veo muy dificil poder llegar a la escala que manejamos por la infraestructura brutal que tenemos. Ya menjas clientes? Cuantos sois en el equipo? Revenue esperado? Buscais vender la empresa? Imagino que tu target son clientes que no sean grandes ya que los grandes utilizan softwares de contact centers muy complejos que empiezan a integrar esto en una escala corporate muy grande que esta lejos de una startup salvo que tenga mucha inversion incial (y mucho riesgo) Justo ahora me voy a meter en otra startup, si no te pedia si buscabas socios |
Editado: 18-mar-2026 12:34 -
18-mar-2026 12:51
#5
|
No tienes problemas con el tema de alucinaciones y precios? Nosotros teniamos otro caso de uso y usabamos modelos de MT que son mas sencillos y no teniamos problemas de alucinacion, aunque otros equipos implementaban tu mismo caso de uso
Justamente he trabajado en un proyecto de esto para una big tech, con equipos de research en varios paises y toda la pesca. Un pez gordo nos dijo que de hecho la mayor competencia son las startups, pero veo muy dificil poder llegar a la escala que manejamos por la infraestructura brutal que tenemos. Ya menjas clientes? Cuantos sois en el equipo? Revenue esperado? Buscais vender la empresa? Imagino que tu target son clientes que no sean grandes ya que los grandes utilizan softwares de contact centers muy complejos que empiezan a integrar esto en una escala corporate muy grande que esta lejos de una startup salvo que tenga mucha inversion incial (y mucho riesgo) Justo ahora me voy a meter en otra startup, si no te pedia si buscabas socios Pues las alucinaciones dependen más de los guardrails que le metas al LLM, al final están más o menos capados con un pre-prompt que les pasamos, hemos ido haciendo pruebas y de momento no alucina mucho, pero nunca digas nunca. Piensa que al final solo somos el orchestrator y trabajamos con diferentes proveedores, así que mucho peso depende en esos proveedores. Manejo ahora 3 clientes de pago con unos 15k de revenue, pero no es MRR como tal aunque renueven mes a mes (no pagan a través de la plataforma). En la plataforma self served hay unos 25 usuarios ahora pero solo 1 de pago, los otros están en freemium, acabo de abrir los registros esta misma semana y aun no he hecho nada de marketing. Yo ahora estoy concentrado en clientes mid market, porque los grandes como dices tiran de infras más tochas o diréctamente con soluciones de ElevenLabs porque quizás no les importa tanto el coste. Pero estamos con algun cliente mid que si lo cerramos ya nos aumenta bastante el revenue, a ver como van los próximos días / semanas. Si que como comentaba antes tenemos la "ventaja" que podemos perder tiempo en implementaciones que otros más grandes no quieren hacer. Me gustaría llegar a 50k antes de Junio y 100k pronto en mrr. Aun no tengo claro si seguir el camino de VC, bootstrapeo o venta, estoy sospesando opciones, en mi anterior startup fui por el camino VC y tengo que acabar de plantear si ese es el camino que quiero seguir. Creo que de momento haremos algo pequeño con BA's. Ahora somos 2 en el equipo. El primer hiring quiero sobretodo que esté en distribución / GTM. Te mando DM |
18-mar-2026 14:43
#7
|
Qué pasa Shurs
He montado una plataforma de agentes de voz con IA que automatizan llamadas telefónicas. Se llama Vocals La idea de Vocals nació después de cerrar mi anterior startup. Mientras cerraba, varios contactos de BPOs y call centers me pedían ayuda para automatizar llamadas con IA. Me puse a investigar y vi que las soluciones que había eran carísimas, te atan a un solo proveedor y no te dan control sobre nada. Entonces pensé: ¿Y si montas una plataforma donde las empresas puedan mezclar los mejores proveedores de voz, IA y síntesis en tiempo real? ¿Y si encima pueden usar sus propias API keys y pagar solo por lo que consumen? Así surgió Vocals: orquestación de agentes de voz con IA, sin lock-in y a una fracción del coste de un call center. ¿Qué coño hace exactamente? Imagina que tienes una empresa y necesitas hacer 6.000 llamadas al día (encuestas de satisfacción, recuperar carritos abandonados, confirmar citas, atención al cliente…). Con un call center tradicional necesitas 12 agentes a €25/hora. Con Vocals:
¿Y cómo suena? No es el típico robot de mierda que te llama del banco. Estamos hablando de voces naturales con ElevenLabs o Fish Audio, comprensión real con Gemini o Claude, y detección de barge-in (si interrumpes, la IA se calla y escucha). A la gente le cuesta distinguir si habla con una persona o con Vocals. ¿Para quién es?
Números actuales
Oferta especial Forocoches No voy a regalar cuentas porque esto no es una app consumer, pero si tienes una empresa (o trabajas en una) y quieres probar Vocals, escríbeme un PM y te doy acceso PRO durante 1 mes gratis para que lo pruebes con llamadas reales. Si eres autónomo con un negocio que mueve llamadas, también. Me interesa el feedback real. En desarrollo continuo ️ Vocals está en evolución constante. Estamos añadiendo más proveedores, mejorando latencias, y preparando integraciones con CRMs. Tu feedback es clave, cualquier idea es bienvenida, podéis hacerlo aquí mismo en el hilo. Automatiza tus llamadas! Pásate por http://www.usevocals.com |