Pular para o conteúdo

Andrej Karpathy: o gênio de bastidores disputado por Elon Musk, Sam Altman e a Anthropic

Jovem programador trabalhando em laptop com gráficos digitais, em escritório com decoração tecnológica.

Quem é, de fato, o gênio de bastidores que virou alvo de disputa entre Elon Musk, Sam Altman e, agora, a Anthropic? De referência mundial no Cubo de Rubik a construtor de algumas das IAs mais poderosas do planeta, a trajetória nada comum de Andrej Karpathy ajuda a entender por que ele está redefinindo o futuro do código.

Com apenas 39 anos, Andrej Karpathy já se consolidou como um dos nomes mais influentes e respeitados da história recente da inteligência artificial (IA). E foi ele quem voltou a agitar a Silicon Valley na terça-feira, 19 de maio de 2026, quando se tornou público que ele iria para a Anthropic. Para a empresa por trás do Claude, trata-se de uma contratação de peso - e um trunfo evidente na disputa agressiva entre gigantes de tecnologia para atrair talentos de elite.

Alocado ao time de pesquisa focado em pré-treinamento, Karpathy assumirá a liderança de uma unidade totalmente nova. A missão: usar os modelos Claude para acelerar e refinar a aquisição de conhecimentos fundamentais das próximas IAs, priorizando orquestração inteligente em vez de depender apenas de mais potência de computação e GPUs.

Para entender por que a indústria acompanha essa movimentação com tanta atenção, é preciso voltar ao percurso singular de alguém que, por conta própria, ajudou a desencadear algumas das maiores viradas algorítmicas do nosso tempo.

Seus mentores estão no topo da IA

Andrej Karpathy nasceu em outubro de 1986, em Bratislava, na então Tchecoslováquia, e imigrou com a família para Toronto aos 15 anos. Foi na universidade da própria cidade que concluiu, em 2009, a graduação em ciência da computação e física. Ali também assistiu às aulas de Geoffrey Hinton, pioneiro em redes neurais artificiais e frequentemente citado como um dos três “padrinhos” da IA.

Após um mestrado na Universidade da Colúmbia Britânica, com foco em simulação física de movimentos, ele seguiu para Stanford para o doutorado. Sob orientação de Fei-Fei Li, sua pesquisa se concentrou no cruzamento entre visão computacional e linguagem natural.

Para estressar os limites do modelo de deep learning do ImageNet, Karpathy decidiu passar semanas classificando manualmente milhares de imagens. Ao alcançar uma taxa de erro de 5,1 %, ele estabeleceu a “linha de base humana”, percebendo que os algoritmos que despontavam já conseguiam igualar a memória humana em tarefas visuais complexas.

Em paralelo ao percurso acadêmico, ele já chamava atenção desde 2006 no YouTube, com o pseudónimo badmephisto. Seus tutoriais extremamente detalhados de resolução do Cubo de Rubik somam milhões de visualizações e ajudaram a formar especialistas mundo afora - e ele próprio era capaz de resolver o quebra-cabeça em 17 segundos.

Assine o Presse-citron

O homem que ensinou deep learning a uma geração inteira

Enquanto avançava no doutorado, Karpathy assumiu, em 2015, o papel de idealizador e principal instrutor do primeiro curso de deep learning de Stanford: o célebre CS 231n (Convolutional Neural Networks for Visual Recognition). A disciplina virou rapidamente um pilar da universidade. As matrículas, por exemplo, saltaram de 150 estudantes em 2015 para mais de 750 em 2017.

Com as anotações e as aulas disponibilizadas online, o material passou a funcionar como a principal porta de entrada para uma geração inteira de futuros engenheiros da Silicon Valley.

Nesse período de intensa produção acadêmica, Karpathy também comprovou a base teórica com três estágios estratégicos em laboratórios de ponta. Ele passou pelo Google Brain em 2011, pelo Google Research em 2013 - trabalhando com aprendizado supervisionado aplicado a vídeos do YouTube - e, por fim, pela DeepMind em 2015, integrando a equipe de reinforcement learning. Na prática, isso o colocou em contato com infraestrutura de computação em larga escala muito antes da popularização massiva da IA.

Cofundador da OpenAI

Em dezembro de 2015, Andrej Karpathy tornou-se um dos 11 membros fundadores da OpenAI. Ao lado de nomes como Ilya Sutskever, Greg Brockman, Sam Altman e Elon Musk, ele entrou no laboratório de pesquisa que, à época, foi estruturado inicialmente como uma organização sem fins lucrativos. A missão declarada era desenvolver uma inteligência artificial geral (AGI) benéfica para a humanidade.

Como pesquisador científico, Karpathy liderou contribuições pioneiras em aprendizado profundo aplicado a modelos generativos e ao deep reinforcement learning. Entre elas, está o PixelCNN++, um modelo otimizado para geração de imagens em nível de pixel. Ele também trabalhou em agentes autónomos capazes de usar teclado e mouse para executar tarefas complexas em interfaces web.

Sua participação ativa por dois anos ajudou a moldar tanto a cultura de pesquisa quanto o padrão de excelência técnica da organização no começo.

A aposta ousada na Tesla

Em junho de 2017, a carreira de Andrej Karpathy deu uma guinada industrial decisiva. Elon Musk o recrutou pessoalmente para assumir como diretor de IA e visão do Autopilot na Tesla. Em um e-mail divulgado recentemente no processo Musk contra Altman, o executivo justificou a contratação - que irritou profundamente as equipes da OpenAI - ao chamar Karpathy de número 2 mundial da visão computacional, atrás apenas de Ilya Sutskever.

No comando de um time dedicado, ele passou a responder por rotulagem de dados, treinamento de redes neurais e implantação em chips personalizados da Tesla. Karpathy acabou se tornando o principal arquiteto de uma das apostas mais controversas do setor automotivo: ao contrário das concorrentes, a Tesla decidiu não usar sensores LiDAR para direção autónoma, considerados caros demais, e se apoiou somente em câmeras.

Sob sua liderança, os engenheiros criaram uma arquitetura de rede considerada revolucionária, capaz de fundir em tempo real os vídeos de 8 câmeras enquanto mantém memória de quadros anteriores. Karpathy sustentou a viabilidade técnica do modelo ao explorar dados de milhões de carros em circulação - e deixou a empresa em julho de 2022.

O ato 2 na OpenAI e o nascimento da Eureka Labs

Depois de um ano sabático dedicado à produção de conteúdo técnico, Andrej Karpathy confirmou seu retorno à OpenAI em fevereiro de 2023, no auge da expansão global do ChatGPT. Nessa segunda passagem, ele montou e liderou uma equipa focada em geração de dados sintéticos.

Esses esforços se tornaram essenciais para o desenvolvimento do GPT-4, marcando uma ruptura tecnológica importante graças às capacidades multimodais do modelo, capazes de processar texto e imagens ao mesmo tempo.

Coerente com seu desejo de independência, ele saiu novamente um ano depois, em fevereiro de 2024. Em julho do mesmo ano, lançou sua própria startup, a Eureka Labs. Pensada como uma plataforma educacional concebida nativamente para a era da IA, a empresa quer combinar a excelência pedagógica humana com assistentes virtuais capazes de orientar estudantes.

Em paralelo, sua série gratuita de vídeos Zero to Hero e o curso LLM101n passaram a ser tratados como referências globais para quem busca entender os fundamentos dos grandes modelos de linguagem.

Ele teorizou o vibe coding

No fim de 2025, Andrej Karpathy voltou a desafiar o senso comum do setor ao teorizar a ascensão do vibe coding. Em uma sequência de publicações amplamente repercutidas, ele afirmou que já não programa do modo tradicional: em vez disso, dita suas intenções a modelos de IA e supervisiona a geração automática de programas complexos. Na leitura dele, a engenharia de software caminha para um papel de orquestração, no qual dominar linguagem natural passa a valer mais do que memorizar sintaxe.

Agora, ao assumir a liderança de uma equipa dedicada a acelerar pesquisa com os modelos Claude, Karpathy encara um desafio enorme: demonstrar que a IA consegue otimizar o próprio aprendizado de forma autónoma e segura.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário