Prime Time

seg - sex

Apresentação

Ao vivo

A seguir

    Miguel Nicolelis
    Coluna

    Miguel Nicolelis

    Neurocientista e escritor. Professor Emérito de Neurobiologia, Duke University. Fundador Instituto Nicolelis de Estudos Avançados do Cérebro da ASSDAP

    OPINIÃO

    Meu momento Sputnik em Pequim

    No dia 4 de outubro de 1957, o mundo todo, e principalmente os americanos, foram surpreendidos com a notícia de que a União Soviética, apesar de não dispor de computadores digitais, havia conseguido colocar em órbita o primeiro satélite artificial da Terra.

    Batizado com o nome de Sputnik 1 – satélite artificial em termos técnicos ou “companheiro de viagem” em russo mais coloquial – ele não era um artefato muito sofisticado; apenas uma esfera metálica de 58 centímetros de diâmetro com quatro antenas externas, uma unidade de transmissão de rádio (1 watt e 3.5 Kg), e uma fonte que pesava por volta 51 Kg.

    Esta estrutura mínima foi usada para transmitir um sinal de rádio rítmico – um pulso de 0.3 de duração, transmitido numa frequência de três vezes por segundo – nas frequências de 20,005 e 40,002MHz, que podia ser facilmente captado por rádios amadores ao redor de todo o globo.

    E captados estes pulsos foram, causando o maior alvoroço nos EUA, que de repente se deram conta de que haveria um contendor competitivo na corrida pela conquista do espaço.

    Embora as transmissões de rádio do Sputnik 1 tenham durado apenas 22 dias, devido ao esgotamento da bateria, e o pequeno satélite tenha sido incinerado ao reentrar na atmosfera terrestre depois de 3 meses em órbita, a repercussão do tremendo feito de engenhosidade e criatividade dos engenheiros espaciais soviéticos, trabalhando com parcos recursos, reverberou por muitos anos.

    Por exemplo, como resultado do susto causado pelo sucesso soviético, o Presidente Dwight Einsenhower decidiu criar a Nasa, a agência espacial do governo americano, em 29 de julho de 1958, como forma de garantir a hegemonia americana na nova corrida espacial que levou o homem à Lua uma década depois.

    Pois bem, durante a semana de 20 a 27 de janeiro deste ano, eu vivi um “momento Sputnik” durante a minha estadia em Pequim para receber o “Friendship Award” (Prêmio Amizade), a maior condecoração do governo chinês conferida a especialistas e cientistas estrangeiros.

    Mais detalhes sobre o prêmio, bem como o banquete oferecido aos premiados, durante o qual eu tive a oportunidade de jantar e conversar com o Premier Li Qiang e ministro das Relações Exteriores Wang Yi, você encontra nesta reportagem da CNN Brasil.

    Na realidade, a comparação mais que apropriada com o Sputnik foi originariamente feita num tweet postado pelo empresário americano Marc Andreessen, um ex-engenheiro de software, conhecido pela co-criação dos navegadores pioneiros da web, Netscape e Mosaic.

    Coincidentemente, eu experimentei a mesma sensação do outro lado do mundo, quando do meu quarto de hotel em Pequim eu recebi a notícia do lançamento do modelo R1 de inteligência Artificial pela empresa chinesa DeepSeek. Poucos minutos depois deste anúncio, tanto na China como ao redor do mundo, centenas de milhões de pessoas se deram conta de que algo gigantesco estava acontecendo.

    Mas por que tanto alvoroço com o anúncio de mais um modelo da dita IA – que, a propósito continua sendo nem inteligente, nem artificial? Afinal, hoje em dia parece que a cada semana uma das “BIG 5” empresas americanas da área – Alphabet/Google, Meta, Apple, Microsoft, Amazon – anuncia o lançamento de um novo modelo de IA, alegando ser este o maior avanço da área e que nos coloca a um fio de cabelo da chamada AGI, ou “artificial general intelligence” (inteligência artificial geral ou genérica).

    As razões foram muitas. Para começar, o modelo R1 foi criado por uma startup chinesa, constituída por pouco mais de 200 jovens chineses que jamais saíram da China para estudar ou tinham qualquer conexão com as BIG 5 americanas.

    Segundo, o custo anunciado pela DeepSeek para realizar o último teste do modelo, ao redor de US$ 6 milhões, bem como o investimento total da empresa, foram extremamente mais modestos do que as centenas de bilhões de dólares investidos pelas BIG 5 no desenvolvimento dos seus modelos LLM (Large Language Models).

    Terceiro, a Deepseek alegou que não precisou usar os microchips (GPUs) de última geração da empresa NVIDIA – proibida pelo governo americano de comercializá-los com a China – , mas sim uma versão bem menos poderosa destas unidades de processamento gráfico.

    Quarto, o anúncio da Deepseek veio apenas alguns dias depois do recém-empossado presidente dos Estados Unidos anunciar na Casa Branca a criação de uma nova empresa, chamada Stargate, que supostamente receberia investimentos da ordem de US$ 500 bilhões, embora ninguém tenha ideia de onde este dinheiro todo virá.

    Quinto, aparentemente a Deepseek não precisou construir um gigantesco data center, como preconizado pelas BIG 5, que dependem de consumos altíssimos de energia elétrica e água, algo semelhantes a uma pequena cidade para funcionarem.

    Sexto, o treinamento do seu modelo aparentemente não precisou varrer toda a internet em busca de dados produzidos por todos nós para atingir uma ótima performance. Indo contra a corrente, a Deepseek usou um método de treinamento diferente e inovador, baseado numa técnica conhecida como “reinforcement-learning” (aprendizado reinforçado), que provou ser muito mais eficiente e barata do que os usados pelas BIG 5.

    Se estes seis pontos, por si só, seriam responsáveis por desencadear um grande auê, o sétimo e mais decisivo golpe, por assim dizer, deferido pela Deepseek, foi direto no coração do modelo de negócio das BIG 5. Simplesmente, a empresa disponibilizou o R1 usando um modelo “Open Source”, permitindo assim que qualquer um pudesse baixar e testar o seu produto e manual/artigos técnicos livremente, em qualquer parte do planeta, sem nenhum custo.

    Como resultado, em algumas horas, o aplicativo da DeepSeek alcançou o primeiro lugar de downloads da “Apple Store”, batendo todos os modelos das BIG 5. Como resultado, o meme mais visualizado neste dia nas redes sociais globalmente foi o ChatGpt buscando emprego como motorista do Uber!

    Basicamente, isso poderia ser comparado a virar líder em downloads grátis de um pôster do Palmeiras campeão no site das Lojas do Corinthians! Ou seja, os meninos chineses jogaram sal na ferida americana Big Time!

    Diga-se de passagem, todavia, que todo este sucesso foi alcançado sem que a DeepSeek resolvesse nenhuma das enormes, e provavelmente eternas, limitações dos LLMs, que continuam a alucinar frequentemente e a produzir respostas sem noção quando confrontados com tópicos para os quais eles não foram treinados a responder.

    Como eu estava vivendo no futuro naquela semana – 13 horas à frente do horário de Nova York e 11 horas na frente de São Paulo – na manhã do dia 27 de janeiro em Pequim ficou claro que os mercados de ações asiáticos estavam reagindo em modo pânico total com o anúncio de como a DeepSeek havia lançado o seu Sputnik.

    Horas mais tarde, quando os mercados europeus e americano abriram, o tamanho do estrago ficou absolutamente claro. Em um único pregão da bolsa de Nova York naquele dia que entrou para a história dos “banhos de sangue da bolsa”, as empresas de tecnologia perderam algo em torno de US$ 1 trilhão, próximo de meio PIB brasileiro. Só a NVIDIA sofreu perdas de quase US$ 600 bilhões, parcialmente recuperadas em pregões subsequentes. Mas o salvo de alerta foi feito! E nada mais será como antes neste mercado de IA.

    Evidentemente, algumas empresas americanas reagiram da forma típica do mau perdedor, alegando que a DeepSeek investiu mais dinheiro que anunciado, usou algumas dezenas de milhares de GPUs modernas e se apropriou de dados da OpenIA, aquela mesma empresa que responde a inúmeros processos de uso indevido de dados protegidos por copyright para treinar seus modelos.

    Neste momento é impossível verificar a validade de qualquer uma destas alegações, mas que existe um certo cheiro de justiça poética neste enredo, ah isso existe.

    Durante os últimos 2 anos eu venho repetidamente alertado que o hype e marketing sem embasamento científico das empresas de IA haviam criado inúmeras fragilidades globais, gerando uma bolha gigantesca no mercado de ações que poderia, caso ela viesse a estourar, causar uma crise econômica global maior do que a ocorrida em 2008 nos EUA.

    Pois bem, na segunda-feira retrasada, tudo leva a crer, que o primeiro capítulo deste chamado “buble burst” se materializou. Graças à criatividade e ingenuidade de um grupo de jovens chineses notadamente brilhantes e de uma startup que ousou desafiar a arrogância típica das BIG 5 americanas, que venderam a ilusão de que bastava jogar centenas de bilhões, construir modelos com centenas de milhares de GPUs de última geração e coletar bilhões de dados postados na internet para reproduzir algo – a inteligência humana nossa de cada dia – que o processo de seleção natural na Terra precisou de milhões de anos para solucionar.

    Só em 2024 estima-se que mais de US$ 300 bilhões foram queimados pelas BIG 5 nesta aventura doidivana. Neste momento, ninguém pode dizer que tal investimento monumental terá qualquer tipo de retorno comercial porque, muito antes, mas certamente depois da DeepSeek, os LLMs já haviam virado meras commodities.

    O verdadeiro ouro desta abordagem de força bruta computacional e estatística está nos dados e, claro, na verdadeira inteligência, aquela que nenhum modelo estatístico, nem mesmo o dos geniais meninos da DeepSeek, conseguiu emular.

    Nem ontem, nem hoje, e eu ouso dizer, nem nunca!

    Tópicos