Pular para o conteúdo

xAI libera o API Grok Speech to Text (STT) para todos

Pessoa segurando microfone editando áudio em notebook com fones e celular em mesa de madeira.

O serviço está disponível para todos

Em 18 de abril de 2026, a xAI tornou oficialmente público o seu API Grok Speech to Text (STT). O novo serviço entrega transcrição de voz com suporte a 25 idiomas, incluindo o russo.

Recursos do API Grok Speech to Text (STT)

Entre as principais capacidades estão as marcações de tempo palavra por palavra, o processamento de áudio multicanal e a separação precisa das falas quando há vários participantes na conversa.

Preços e formato de uso

Segundo a xAI, a plataforma oferece o mais alto nível de qualidade pelo menor preço do mercado:

  • Transcrição de arquivos: $0,1 por hora de áudio;
  • Streaming/em tempo real: $0,2 por hora de áudio

Com isso, desenvolvedores conseguem incorporar transcrição avançada aos seus produtos com facilidade. O lançamento reforça a estratégia da empresa de ampliar as capacidades do Grok.

Onde essa infraestrutura já é aplicada

O mesmo conjunto tecnológico já vem sendo utilizado ativamente no Grok Voice, em carros da Tesla e no suporte da Starlink. Agora, essa infraestrutura de ponta passa a ficar disponível pela primeira vez para desenvolvedores externos.

Anteriormente, a xAI de Elon Musk também apresentou um novo API de Text-to-Speech - uma ferramenta que transforma texto comum em uma fala natural e expressiva.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário