O serviço está disponível para todos
Em 18 de abril de 2026, a xAI tornou oficialmente público o seu API Grok Speech to Text (STT). O novo serviço entrega transcrição de voz com suporte a 25 idiomas, incluindo o russo.
Recursos do API Grok Speech to Text (STT)
Entre as principais capacidades estão as marcações de tempo palavra por palavra, o processamento de áudio multicanal e a separação precisa das falas quando há vários participantes na conversa.
Preços e formato de uso
Segundo a xAI, a plataforma oferece o mais alto nível de qualidade pelo menor preço do mercado:
- Transcrição de arquivos: $0,1 por hora de áudio;
- Streaming/em tempo real: $0,2 por hora de áudio
Com isso, desenvolvedores conseguem incorporar transcrição avançada aos seus produtos com facilidade. O lançamento reforça a estratégia da empresa de ampliar as capacidades do Grok.
Onde essa infraestrutura já é aplicada
O mesmo conjunto tecnológico já vem sendo utilizado ativamente no Grok Voice, em carros da Tesla e no suporte da Starlink. Agora, essa infraestrutura de ponta passa a ficar disponível pela primeira vez para desenvolvedores externos.
Anteriormente, a xAI de Elon Musk também apresentou um novo API de Text-to-Speech - uma ferramenta que transforma texto comum em uma fala natural e expressiva.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário