AethexAI levanta US$ 3 milhões em pre-seed para resolver um problema real: fazer IA de voz funcionar onde a latência é alta, os dialetos são muitos e ninguém mais quer ir.
O problema que ninguém via
Suporte ao cliente e atendimento estão entre os setores mais quentes em IA de voz neste momento. Mas construir um produto que soe humano e responda sem atraso perceptível revela-se muito mais difícil em alguns mercados do que em outros — e a maioria dos grandes players não foi pensada para a África e o Oriente Médio.
AethexAI, uma startup fundada no ano passado para fechar essa lacuna, captou US$ 3 milhões em rodada pre-seed liderada pela 4DX Ventures, com participação da Enza Capital, Dorm Room Fund, Mojo Ventures e Stanford GSB 26 Fund. Entre os investidores individuais estão professores de Stanford, executivos de telecom e pesquisadores de IA da Anthropic.
🚨 Vagas abertas para o nosso grupo de ofertas que vai te fazer economizar MUITO!
Em vez de usar ferramentas de orquestração existentes como Vapi e LiveKit, a empresa construiu seu próprio modelo pequeno e camada de orquestração do zero para lidar com os dialetos locais de inglês, francês e árabe falados em seus mercados-alvo. A startup também está lançando sua plataforma para empresas experimentarem a tecnologia, além de APIs e SDKs para desenvolvedores.
Duas trajetórias que convergem
A startup foi fundada por Mariama Diallo e Ayooluwa Odemuyiwa. A CEO Diallo trabalhou no Goldman Sachs e depois ingressou na ModelML, apoiada pela Y Combinator, como responsável por produto e crescimento. O CTO Odemuyiwa formou-se no Caltech, trabalhou na Meta e cursou Stanford Business School antes de cofundar a empresa.
Os dois queriam construir algo para mercados emergentes e começaram a procurar oportunidades. O que encontraram não foi animador: no Egito, um call center automatizou uma parcela significativa de suas chamadas, mas reverteu o sistema por causa de resultados ruins. Vários centros de suporte na África relataram que encontrar e contratar engenheiros para automatizar chamadas a um custo adequado era uma dor constante.
“The latency and jitter that we saw on automated calls in this region were outrageous. If we had become orchestrators, we might have had to use large models that were hosted outside the region, resulting in higher latency. We realized that in order for this to work, we have to use very small models and cut latency at every step”, disse Odemuyiwa à TechCrunch sobre a decisão de construir modelos próprios.
Construído de baixo para cima
Laboratórios de IA que implantam seus modelos mais recentes costumam gastar milhões em treinamento e aquisição de dados. A AethexAI encontrou uma solução para os dois. Em vez de perseguir os maiores modelos possíveis, decidiu que modelos pequenos são suficientes para enfrentar o problema de latência mantendo a precisão — e desenvolveu sua própria série Kora, com parâmetros de 300 milhões a 1,7 bilhão. Uma fração do tamanho dos LLMs convencionais, e é exatamente esse o ponto.
Para treinar esses modelos, a startup usou gravações anonimizadas de um call center parceiro. Também enviou discos rígidos para estações de rádio pela África para coletar mais dados de áudio. Para manter os custos baixos, montou uma rede de estudantes universitários para anotar dados e pronunciar nomes locais.
Como resultado, a startup afirma agora processar mais de 17 mil chamadas por dia.
Casos de uso e tração
Do lado do negócio, a empresa tem cuidado para acompanhar clientes que são novos em IA de voz, oferecendo demonstrações presenciais e workshops para ajudar a identificar os melhores casos de uso para automação.
“We always tell customers that we cannot be everything for everybody right now. We’re small. When we start talking to a company, we ask them to pick one use case that is the most important to them to start [with]”, disse Diallo.
A startup está aberta a atuar em todos os setores, mas no momento grande parte de seus casos de uso envolve chamadas para cobrança de dívidas, ativação de clientes ou KYC — o processo padrão de verificação de identidade usado por bancos e telecomunicações.
A empresa está contratando engenheiros destacados em bases contratuais para atender mercados locais e construindo parcerias de canal com provedores de telecom para lidar com a telefonia das chamadas de IA de voz. Soluções plug-and-play, diz a startup, simplesmente não funcionam nesses contextos.
Um mercado que era invisível
Walter Baddoo, cofundador e sócio-gerente da 4DX Ventures, argumenta que o mercado da África e do Oriente Médio é fundamentalmente diferente dos mercados para os quais a maioria das empresas de IA de voz foi construída.
“Enterprises in Africa and the Middle East process roughly three times the call volume of their Western counterparts, as voice is still the dominant channel for customer interaction”, afirmou. “Incumbent systems were built for Western markets characterized by high-end GPU infrastructure, standard English and European speech environments, and enterprise workflows common in the U.S. and Europe. That creates real gaps when enterprises need systems that handle dialects, code-switching, and informal speech patterns, and that work within their existing telephony infrastructure and their actual price points.”
Em outras palavras: enquanto empresas como ElevenLabs, Deepgram, Sierra e Cognigy se expandem globalmente em ritmo acelerado, os mercados para os quais foram construídas e os mercados que estão entrando nem sempre são a mesma coisa.
O que vem agora
Startups como a AethexAI apostam que essas lacunas — modelos especializados em dialetos locais, parcerias locais, infraestrutura pensada para a região — representam uma oportunidade de mercado que os gigantes não têm nem o incentivo nem a arquitetura para fechar.
Com os US$ 3 milhões em pre-seed, a startup planeja expandir sua série Kora de modelos, aumentar a rede de parceiros de telecomunicações e crescer a equipe de engenheiros destacados em novos mercados da África e do Oriente Médio.
Fonte: TechCrunch, Ivan Mehta, 03/06/2026. Tradução e adaptação: Rapadura Tech.



































