Monté una IA que llama por teléfono mejor que el becario del call center

Motociclado
ForoCoches: Usuario
#1
Qué pasa Shurs


He montado una plataforma de agentes de voz con IA que automatizan llamadas telefónicas. Se llama Vocals
La idea de Vocals nació después de cerrar mi anterior startup. Mientras cerraba, varios contactos de BPOs y call centers me pedían ayuda para automatizar llamadas con IA. Me puse a investigar y vi que las soluciones que había eran carísimas, te atan a un solo proveedor y no te dan control sobre nada.


Entonces pensé:
👉 ¿Y si montas una plataforma donde las empresas puedan mezclar los mejores proveedores de voz, IA y síntesis en tiempo real?
👉 ¿Y si encima pueden usar sus propias API keys y pagar solo por lo que consumen?


Así surgió Vocals: orquestación de agentes de voz con IA, sin lock-in y a una fracción del coste de un call center.




🔹 ¿Qué coño hace exactamente?
Imagina que tienes una empresa y necesitas hacer 6.000 llamadas al día (encuestas de satisfacción, recuperar carritos abandonados, confirmar citas, atención al cliente…). Con un call center tradicional necesitas 12 agentes a €25/hora. Con Vocals:
  • La IA llama, escucha, entiende y responde como una persona real
  • Tú eliges qué proveedores usar: Deepgram, OpenAI, ElevenLabs, Claude, Gemini… los mejores del mercado
  • Cambias de proveedor en tiempo real desde un dashboard, sin tocar código
  • Pagas desde $0.04/minuto. Sí, cuatro céntimos
Resultado real con un cliente: de €2.400/día en agentes humanos a €60/día con Vocals. 97% de reducción de costes.


🔹 ¿Y cómo suena?
No es el típico robot de mierda que te llama del banco. Estamos hablando de voces naturales con ElevenLabs o Fish Audio, comprensión real con Gemini o Claude, y detección de barge-in (si interrumpes, la IA se calla y escucha). A la gente le cuesta distinguir si habla con una persona o con Vocals.




🔹 ¿Para quién es?
  • Call centers / BPOs: automatizar encuestas, seguimiento post-venta, cobros
  • E-commerce: recuperar carritos abandonados llamando al cliente y enviándole link de pago por WhatsApp
  • Hoteles: atender llamadas entrantes 24/7 en varios idiomas, gestionar reservas
  • Cualquier empresa con volumen de llamadas: citas médicas, recordatorios, verificación de identidad…




🔹 Números actuales
  • +200K llamadas procesadas en producción
  • Todo construido con backend Python, frontend React e integraciones con 10+ proveedores de IA
  • Bootstrapped con pasta propia


🔹 Oferta especial Forocoches 🎁
No voy a regalar cuentas porque esto no es una app consumer, pero si tienes una empresa (o trabajas en una) y quieres probar Vocals, escríbeme un PM y te doy acceso PRO durante 1 mes gratis para que lo pruebes con llamadas reales.
Si eres autónomo con un negocio que mueve llamadas, también. Me interesa el feedback real.




🔹 En desarrollo continuo 🛠️
Vocals está en evolución constante. Estamos añadiendo más proveedores, mejorando latencias, y preparando integraciones con CRMs. Tu feedback es clave, cualquier idea es bienvenida, podéis hacerlo aquí mismo en el hilo.


Automatiza tus llamadas!


👉 Pásate por http://www.usevocals.com
Martin23
ForoCoches: Miembro
#2
¿Cuántas barreras de entrada hay para montar este negocio y qué te diferencia?
Motociclado
ForoCoches: Usuario
#3
Pues para ser honesto: las barreras de entrada técnicas no son brutales. Si eres un buen ingeniero, puedes montar un pipeline STT → LLM → TTS en un fin de semana. Lo que NO puedes montar en un fin de semana es:


Que funcione en producción con llamadas reales. Una cosa es hacer una demo chula y otra es que suene bien en una línea telefónica con audio mulaw a 8kHz, con ruido de fondo, con gente que interrumpe a la IA a mitad de frase y con picos de miles de llamadas simultáneas. Ahí es donde se jode el 90% de los proyectos.


La integración real con telefonía. Twilio, SIP trunks, Asterisk, AudioSocket, codecs de audio, resampling en tiempo real, detección de contestadores automáticos… no es sexy, pero es lo que hace que funcione de verdad.


El ecosistema de proveedores. Tenemos 10+ proveedores integrados (Deepgram, OpenAI, ElevenLabs, Claude, Gemini, Qwen…). Cada uno con su API distinta, su formato de streaming, sus particularidades. Mantener eso funcionando y que el cliente pueda cambiar entre ellos en caliente es un dolor de cabeza que pocos quieren comerse.


La confianza de las empresas. Los BPOs y call centers no te dan su tráfico de llamadas porque tengas un MVP bonito. Necesitan ver llamadas procesadas sin fallos, SLAs, analytics, y alguien que coja el teléfono si algo peta a las 3AM.


¿Se puede replicar? Sí, con tiempo y pasta. ¿Lo va a hacer alguien mañana? Probablemente no, porque los que tienen la pasta (VAPI, Retell) ya están y cobran mucho más caro, y los que podrían hacerlo técnicamente prefieren montar otra app de IA más fácil de vender.


Además, creo que hay una parte importante en la distribución, ya tenemos algunos clientes que pagan y andamos con pilotos para traer más clientes. Tenemos que hacer implementación, que no es lo más escalable, pero a corto plazo nos ayuda a hacer lock in de clientes.





Cita de Martin23
¿Cuántas barreras de entrada hay para montar este negocio y qué te diferencia?
Sagarret
ForoCoches: Miembro
#4
Cita de Motociclado
Pues para ser honesto: las barreras de entrada técnicas no son brutales. Si eres un buen ingeniero, puedes montar un pipeline STT → LLM → TTS en un fin de semana. Lo que NO puedes montar en un fin de semana es:


Que funcione en producción con llamadas reales. Una cosa es hacer una demo chula y otra es que suene bien en una línea telefónica con audio mulaw a 8kHz, con ruido de fondo, con gente que interrumpe a la IA a mitad de frase y con picos de miles de llamadas simultáneas. Ahí es donde se jode el 90% de los proyectos.


La integración real con telefonía. Twilio, SIP trunks, Asterisk, AudioSocket, codecs de audio, resampling en tiempo real, detección de contestadores automáticos… no es sexy, pero es lo que hace que funcione de verdad.


El ecosistema de proveedores. Tenemos 10+ proveedores integrados (Deepgram, OpenAI, ElevenLabs, Claude, Gemini, Qwen…). Cada uno con su API distinta, su formato de streaming, sus particularidades. Mantener eso funcionando y que el cliente pueda cambiar entre ellos en caliente es un dolor de cabeza que pocos quieren comerse.


La confianza de las empresas. Los BPOs y call centers no te dan su tráfico de llamadas porque tengas un MVP bonito. Necesitan ver llamadas procesadas sin fallos, SLAs, analytics, y alguien que coja el teléfono si algo peta a las 3AM.


¿Se puede replicar? Sí, con tiempo y pasta. ¿Lo va a hacer alguien mañana? Probablemente no, porque los que tienen la pasta (VAPI, Retell) ya están y cobran mucho más caro, y los que podrían hacerlo técnicamente prefieren montar otra app de IA más fácil de vender.


Además, creo que hay una parte importante en la distribución, ya tenemos algunos clientes que pagan y andamos con pilotos para traer más clientes. Tenemos que hacer implementación, que no es lo más escalable, pero a corto plazo nos ayuda a hacer lock in de clientes.
No tienes problemas con el tema de alucinaciones y precios? Nosotros teniamos otro caso de uso y usabamos modelos de MT que son mas sencillos y no teniamos problemas de alucinacion, aunque otros equipos implementaban tu mismo caso de uso

Justamente he trabajado en un proyecto de esto para una big tech, con equipos de research en varios paises y toda la pesca. Un pez gordo nos dijo que de hecho la mayor competencia son las startups, pero veo muy dificil poder llegar a la escala que manejamos por la infraestructura brutal que tenemos.


Ya menjas clientes? Cuantos sois en el equipo? Revenue esperado? Buscais vender la empresa? Imagino que tu target son clientes que no sean grandes ya que los grandes utilizan softwares de contact centers muy complejos que empiezan a integrar esto en una escala corporate muy grande que esta lejos de una startup salvo que tenga mucha inversion incial (y mucho riesgo)

Justo ahora me voy a meter en otra startup, si no te pedia si buscabas socios
Motociclado
ForoCoches: Usuario
#5
Cita de Sagarret
No tienes problemas con el tema de alucinaciones y precios? Nosotros teniamos otro caso de uso y usabamos modelos de MT que son mas sencillos y no teniamos problemas de alucinacion, aunque otros equipos implementaban tu mismo caso de uso

Justamente he trabajado en un proyecto de esto para una big tech, con equipos de research en varios paises y toda la pesca. Un pez gordo nos dijo que de hecho la mayor competencia son las startups, pero veo muy dificil poder llegar a la escala que manejamos por la infraestructura brutal que tenemos.


Ya menjas clientes? Cuantos sois en el equipo? Revenue esperado? Buscais vender la empresa? Imagino que tu target son clientes que no sean grandes ya que los grandes utilizan softwares de contact centers muy complejos que empiezan a integrar esto en una escala corporate muy grande que esta lejos de una startup salvo que tenga mucha inversion incial (y mucho riesgo)

Justo ahora me voy a meter en otra startup, si no te pedia si buscabas socios



Pues las alucinaciones dependen más de los guardrails que le metas al LLM, al final están más o menos capados con un pre-prompt que les pasamos, hemos ido haciendo pruebas y de momento no alucina mucho, pero nunca digas nunca. Piensa que al final solo somos el orchestrator y trabajamos con diferentes proveedores, así que mucho peso depende en esos proveedores.


Manejo ahora 3 clientes de pago con unos 15k de revenue, pero no es MRR como tal aunque renueven mes a mes (no pagan a través de la plataforma). En la plataforma self served hay unos 25 usuarios ahora pero solo 1 de pago, los otros están en freemium, acabo de abrir los registros esta misma semana y aun no he hecho nada de marketing.


Yo ahora estoy concentrado en clientes mid market, porque los grandes como dices tiran de infras más tochas o diréctamente con soluciones de ElevenLabs porque quizás no les importa tanto el coste. Pero estamos con algun cliente mid que si lo cerramos ya nos aumenta bastante el revenue, a ver como van los próximos días / semanas. Si que como comentaba antes tenemos la "ventaja" que podemos perder tiempo en implementaciones que otros más grandes no quieren hacer.


Me gustaría llegar a 50k antes de Junio y 100k pronto en mrr. Aun no tengo claro si seguir el camino de VC, bootstrapeo o venta, estoy sospesando opciones, en mi anterior startup fui por el camino VC y tengo que acabar de plantear si ese es el camino que quiero seguir. Creo que de momento haremos algo pequeño con BA's. Ahora somos 2 en el equipo. El primer hiring quiero sobretodo que esté en distribución / GTM.


Te mando DM
NewtScamander
ForoCoches: Miembro
#6
Te felicito shur, tiene muy buena pinta.
alanoide
Massive Killing Capacity
#7
Cita de Motociclado
Qué pasa Shurs


He montado una plataforma de agentes de voz con IA que automatizan llamadas telefónicas. Se llama Vocals
La idea de Vocals nació después de cerrar mi anterior startup. Mientras cerraba, varios contactos de BPOs y call centers me pedían ayuda para automatizar llamadas con IA. Me puse a investigar y vi que las soluciones que había eran carísimas, te atan a un solo proveedor y no te dan control sobre nada.


Entonces pensé:
¿Y si montas una plataforma donde las empresas puedan mezclar los mejores proveedores de voz, IA y síntesis en tiempo real?
¿Y si encima pueden usar sus propias API keys y pagar solo por lo que consumen?


Así surgió Vocals: orquestación de agentes de voz con IA, sin lock-in y a una fracción del coste de un call center.




¿Qué coño hace exactamente?
Imagina que tienes una empresa y necesitas hacer 6.000 llamadas al día (encuestas de satisfacción, recuperar carritos abandonados, confirmar citas, atención al cliente…). Con un call center tradicional necesitas 12 agentes a €25/hora. Con Vocals:
  • La IA llama, escucha, entiende y responde como una persona real
  • Tú eliges qué proveedores usar: Deepgram, OpenAI, ElevenLabs, Claude, Gemini… los mejores del mercado
  • Cambias de proveedor en tiempo real desde un dashboard, sin tocar código
  • Pagas desde $0.04/minuto. Sí, cuatro céntimos
Resultado real con un cliente: de €2.400/día en agentes humanos a €60/día con Vocals. 97% de reducción de costes.


¿Y cómo suena?
No es el típico robot de mierda que te llama del banco. Estamos hablando de voces naturales con ElevenLabs o Fish Audio, comprensión real con Gemini o Claude, y detección de barge-in (si interrumpes, la IA se calla y escucha). A la gente le cuesta distinguir si habla con una persona o con Vocals.




¿Para quién es?
  • Call centers / BPOs: automatizar encuestas, seguimiento post-venta, cobros
  • E-commerce: recuperar carritos abandonados llamando al cliente y enviándole link de pago por WhatsApp
  • Hoteles: atender llamadas entrantes 24/7 en varios idiomas, gestionar reservas
  • Cualquier empresa con volumen de llamadas: citas médicas, recordatorios, verificación de identidad…



Números actuales
  • +200K llamadas procesadas en producción
  • Todo construido con backend Python, frontend React e integraciones con 10+ proveedores de IA
  • Bootstrapped con pasta propia

Oferta especial Forocoches
No voy a regalar cuentas porque esto no es una app consumer, pero si tienes una empresa (o trabajas en una) y quieres probar Vocals, escríbeme un PM y te doy acceso PRO durante 1 mes gratis para que lo pruebes con llamadas reales.
Si eres autónomo con un negocio que mueve llamadas, también. Me interesa el feedback real.




En desarrollo continuo
Vocals está en evolución constante. Estamos añadiendo más proveedores, mejorando latencias, y preparando integraciones con CRMs. Tu feedback es clave, cualquier idea es bienvenida, podéis hacerlo aquí mismo en el hilo.


Automatiza tus llamadas!


Pásate por http://www.usevocals.com
me interesa mucho tengo un call center propio y un proyecto que os puede servir de conejillo de indias si lo haceis bien, manda mp y hablamos a ver como nos ayudáis a personalizarlo, ya que tenemos api y crm propios
Motociclado
ForoCoches: Usuario
#8
Cita de alanoide
me interesa mucho tengo un call center propio y un proyecto que os puede servir de conejillo de indias si lo haceis bien, manda mp y hablamos a ver como nos ayudáis a personalizarlo, ya que tenemos api y crm propios

buena pinta! ahora mismo te escribo
← A Empleo / Emprendimiento