Por qué los grandes inversores escuchan a las startups de IA de voz

Por qué los grandes inversores escuchan a las startups de IA de voz

  • Autor de la entrada:
  • Categoría de la entrada:AI Startups
Compartir esta informacion

Por qué los grandes inversores están atentos a las startups de inteligencia artificial de voz

La inteligencia artificial (IA) se ha convertido en el sector tecnológico más candente de la actualidad, con flujos de capital de riesgo entrando en startups del área a niveles sin precedentes. Dentro de este vasto escenario, las startups de IA de voz han emergido como un punto destacado, captando la atención de inversores a nivel global, según datos de Crunchbase.

En los últimos 12 a 18 meses, varias empresas dedicadas a la IA de voz han visto cómo sus valoraciones se han triplicado, lo que señala una demanda de mercado en aceleración y un valor percibido a largo plazo. Un ejemplo notable es ElevenLabs, una startup de Brooklyn que ofrece software de IA para replicar voces en docenas de idiomas. ElevenLabs alcanzó el estatus de unicornio con una ronda Serie B de 80 millones de dólares en enero de 2024 y vio su valoración crecer a 3.3 mil millones de dólares un año después, gracias a una Serie C de 180 millones de dólares, dirigida por Iconiq Capital y Andreessen Horowitz.

Apoyo para opciones de liquidez

El 8 de septiembre, ElevenLabs anunció la venta de acciones secundarias para brindar opciones de liquidez a los empleados mediante una oferta que duplicaría su valoración a 6.6 mil millones de dólares. Carles Reina, de ElevenLabs, reveló en LinkedIn que la empresa había superado los 200 millones de dólares en ingresos anuales recurrentes en solo dos años y medio.

Apetito por adquisiciones

El segmento de voz sigue siendo atractivo para adquisiciones ambiciosas. En julio, Meta adquirió PlayAI, una startup que utiliza IA para generar voces similares a las humanas. Esta adquisición resalta la importancia de integrar tecnologías de creación de voz natural en las estrategias de empresas tecnológicas grandes.

Tom Hulme, socio gerente en GV, sostiene que las empresas emergentes de IA de voz son candidatas a adquisiciones ya que construir capacidades como reconocimiento de voz o IA conversacional desde cero puede tomar años. Por ello, las compañías suelen optar por adquirir tecnología y equipos probados para acelerar su desarrollo.

Crecimiento controlado

La inversión creciente en IA de voz se justifica por la rápida confluencia de tecnologías desarrolladas como modelos de lenguaje a gran escala y reconocimiento de voz en tiempo real. La precisión del reconocimiento de voz ha alcanzado niveles similares a los humanos, y los modelos de lenguaje grandes son mejores entendiendo contexto e intención.

GV ha invertido en varias empresas de IA de voz como Nothing, Neuralink, Vocode y Synthesia. Estas startups comparten la visión de hacer que las interacciones humanas con las máquinas sean más naturales y fluidas.

Conexiones con los clientes

Las startups de IA de voz continúan recibiendo financiamiento de riesgo, especialmente en el área de atención al cliente. Loman AI, por ejemplo, es un sistema telefónico basado en IA para restaurantes que ha recaudado 3.5 millones de dólares en ronda semilla. Maven AGI, otra empresa, ha recaudado 50 millones de dólares para desarrollar agentes de IA para soporte al cliente, destacando así la creciente importancia de las soluciones de voz en la atención al cliente.

Un «control remoto universal» para el mundo digital

AssemblyAI es un ejemplo de una empresa que ofrece tecnología a otras compañías de IA para ayudarles a expandir sus ofertas. Con cerca de 160 millones de dólares recaudados, su tecnología se utiliza en sectores como el de asistencia sanitaria, donde transcribe conversaciones entre médicos y pacientes, y en plataformas de video para generar subtítulos y transcripciones.

La tecnología de AssemblyAI ha visto un crecimiento del uso de más del 250% anual, y su CEO, Dylan Fox, prevé que un gran uso en el futuro serán agentes de voz en tiempo real con quienes se pueda interactuar fácilmente.

La voz como interfaz universal

Para Tom Hulme de GV, uno de los desarrollos más emocionantes en el crecimiento de la IA de voz es que estamos volviendo a la forma de comunicación más natural del ser humano. La voz y el lenguaje natural representan el «hack de accesibilidad» definitivo, democratizando el acceso a toda persona que pueda pensar y comunicarse, convirtiendo la voz en un tipo de control remoto universal para el mundo digital.