Um grande modelo de linguagem não é inteligência artificial

Odeio quando chamam os grandes modelos de linguagem de inteligência artificial. Não tem inteligência nenhuma ali dentro. É geração de palavra por uma fórmula matemática, e pronto.

E o mais estranho é o seguinte. Como essas coisas funcionam é sabido, está tudo aberto, você pode ir lá e ler. Mesmo assim as pessoas buscam algo sobrenatural, dão pra coisa qualidades que ela não tem. Você começa a discutir, mostra a matemática, explica com palavras simples, e vem de volta: você está simplificando, tem alguma coisa ali dentro. Não. Não estou. Vamos ver o que tem ali de verdade.

O que ele faz

Um grande modelo de linguagem (LLM) faz uma coisa só: prevê o próximo pedaço de texto. Você dá um começo, ele constrói o resto, um pedaço de cada vez. O pedaço se chama token, uma palavra ou parte de uma palavra. Ele olha tudo o que veio antes e calcula uma probabilidade, qual token vem em seguida. Pega o que encaixa melhor, escreve, e vai de novo.

É isso. O truque inteiro. Um autocomplete caro e preciso, igual ao do seu celular, um milhão de vezes mais forte.

O que parece uma resposta à sua pergunta é, por dentro, uma continuação de texto. Você escreveu uma pergunta. A continuação mais provável de um texto que termina em pergunta é um texto que parece uma resposta. Ele não está respondendo você. Ele está continuando depois de você.

De onde vêm as probabilidades

Ele não inventa essas probabilidades na hora, elas foram colocadas ali. Passaram ele por uma montanha de texto, livros, sites, código, fóruns, e fizeram ele adivinhar o próximo token bilhões de vezes, com o nariz esfregado em cada erro. Depois de meses dessa lida, o formato da língua assentou dentro dele: que palavra vem depois de qual, como uma frase se sustenta, como é um parágrafo comum sobre impostos e um trecho comum de código. Isso não é conhecimento. É estatística sobre como é o texto a respeito do assunto.

Então não tem banco de dados ali dentro onde ele consulta as coisas. Tem pesos, bilhões de números com essa estatística compactada dentro. Quando te dizem que o modelo "sabe" a capital da França, quer dizer uma coisa só: no texto que ele aprendeu, depois de "a capital da França é" quase sempre vinha Paris. Ele não lembra o fato. Ele repete a frequência.

Por que não é inteligência

Quando a gente diz inteligência, está imaginando compreensão, um objetivo, um modelo do mundo, um pensamento, uma intenção. Nada disso está embutido num LLM. O que está embutido é uma distribuição de probabilidade sobre tokens. Ele não entende o que diz, do mesmo jeito que uma calculadora não entende o que é um número. Ele só faz uma ótima imitação de quem entende, porque foi exatamente pra isso que treinaram ele, pra produzir texto que você não consegue distinguir do texto de uma pessoa de verdade.

E aqui está a armadilha. A gente lê fluência como inteligência. Se alguém fala de forma fluida, a gente preenche o pensamento por trás. Com uma pessoa isso costuma valer, a fluência vem da compreensão. Com o modelo o fio está cortado. A fluência é uma coisa em si, separada de qualquer compreensão. Você, o leitor, é quem traz a inteligência pro texto. Ela não está no texto.

O que vem disso

O resto você enxerga no instante em que para de esperar um milagre.

Alucinações não são um defeito. Quando o modelo te dá com confiança uma lei que não existe ou um link que não leva a lugar nenhum, está fazendo exatamente o que sempre faz, construindo texto plausível. Plausível e verdadeiro são a mesma coisa pra ele, não tem um botão "verdade" separado lá dentro. Ele foi afiado pra "parece texto correto", não pra "verdade". Na maioria das vezes o que parece e o que é correto coincidem, e é por isso que ele é útil. Mas é a mesma máquina nos dois casos, então você não consegue zerar o erro sem trocar a máquina.

Ele não tem memória entre uma conversa e outra. Cada pedido, ele encontra com uma folha em branco. Tudo que parece "ele lembra da nossa conversa" é só o histórico do chat, devolvido pro começo de cada pedido. Tira o histórico e ele não lembra de você.

E ele não pensa enquanto você não está olhando. Entre as suas mensagens não tem vida interior nenhuma rodando. Não tem processo. Tem uma função, texto entra, texto sai.

Então de onde vem o "IA"

É um guarda-chuva velho. O termo tem quase setenta anos, e cabe tudo embaixo dele, de programas de xadrez a reconhecimento de rosto. Ele grudou nos modelos de linguagem porque é o que vende. "Inteligência" levanta dinheiro e assusta nas manchetes. "Um modelo estatístico preciso de texto" não faz nem uma coisa nem outra, mesmo sendo o nome honesto.

Eu não deixei de gostar da ferramenta por causa disso. A engenharia por trás é real e difícil, e ela paga o próprio salário. Mas eu mantenho na cabeça o que estou usando. O modelo é uma commodity, ficando mais barato, o mesmo preço pra todo mundo. O valor não está nele, está no que você monta em volta dele pro seu próprio trabalho. Quem confunde ele com inteligência é quem entrega uma citação inventada no tribunal porque "ele é esperto", e teme a coisa errada, uma revolta das máquinas, quando a pergunta de verdade é: de quem é o trabalho que ele barateia.

Ele é mais útil no segundo em que você para de esperar uma mente e começa a ver o que ele é. Uma máquina que prevê texto. E faz isso melhor do que qualquer um vivo.