“Então, como essa coisa do ChatGPT realmente funciona?”
Minha mãe me fez essa pergunta durante nossa videochamada semanal. Morando a milhares de quilômetros de distância, essas chamadas são nossa principal conexão, e frequentemente se transformam em sessões improvisadas de suporte técnico. Ela estava usando o ChatGPT para ajudar a escrever e-mails e estava genuinamente curiosa sobre o que acontecia nos bastidores.
Quando comecei a explicar sobre redes neurais e transformers, pude ver seus olhos ficando vidrados através da tela pixelada do FaceTime. Então tentei novamente, desta vez com analogias que ela poderia entender. Aqui está como expliquei os LLMs para minha mãe, e como você pode explicá-los para a sua.
A Analogia da Biblioteca: Como os LLMs Aprendem
“Mãe, imagine alguém que leu todos os livros da maior biblioteca do mundo: bilhões de livros, artigos, sites e conversas.
Essa pessoa não memorizou cada palavra, mas desenvolveu uma incrível noção de como a linguagem funciona e quais palavras tendem a seguir outras em diferentes contextos.
Isso é basicamente o que um LLM é. Ele leu a maior parte do texto na internet e aprendeu padrões sobre como a linguagem funciona.”
O Jogo de Previsão de Palavras
Para tornar mais concreto, joguei um jogo simples com ela pela chamada:
Eu: "Complete esta frase: O gato sentou no..."
Mãe: "Tapete!"
Eu: "Que tal: Eu preciso ir ao mercado comprar..."
Mãe: "Leite? Pão? Mantimentos?"
“É exatamente isso que o ChatGPT está fazendo,” expliquei. “Ele está prevendo qual palavra deve vir a seguir, com base em todo o texto que viu antes. Mas está fazendo essa previsão bilhões de vezes em sequência, criando parágrafos e ensaios inteiros, uma palavra de cada vez.”
O Livro de Receitas vs. O Chef
Minha mãe adora cozinhar, então essa analogia funcionou mesmo à distância:
“Um programa de computador tradicional é como seguir uma receita exatamente. Se a receita diz ‘adicione 500 gramas de farinha’, é isso que ele faz: nem mais, nem menos.
Mas um LLM é mais como um chef experiente que estudou milhares de receitas. Este chef não segue instruções exatas. Em vez disso, desenvolveu uma intuição sobre culinária. Se você pedir para ele fazer um prato de massa com os ingredientes na sua geladeira, ele pode improvisar algo que faça sentido, mesmo que nunca tenha feito exatamente esse prato antes.”
Como Realmente Funciona: A Versão de 5 Minutos
Quando ela pediu mais detalhes, compartilhei minha tela e desenhei um diagrama simples enquanto explicava em cinco etapas:
Dados de Treinamento: “Primeiro, eles alimentam o sistema de IA com quantidades massivas de texto: livros, artigos, sites e mais.”
Tokenização: “A IA divide todo esse texto em pequenas peças chamadas ’tokens’, que são palavras ou partes de palavras.”
Aprendizado de Padrões: “Usando um tipo especial de matemática (poupei-a dos detalhes de multiplicação de matrizes e retropropagação), a IA aprende quais palavras tendem a seguir outras em diferentes contextos.”
Pesos e Conexões: “A IA constrói uma gigantesca rede de conexões entre palavras e conceitos, com algumas conexões mais fortes que outras.”
Previsão: “Quando você faz uma pergunta, ela usa todas essas conexões para descobrir quais palavras devem vir a seguir em sua resposta.”
O Debate do Papagaio vs. Compreensão
Minha mãe então fez a pergunta de um milhão de dólares através de sua conexão um pouco travada do FaceTime: “Mas ele realmente entende o que está dizendo?”
“Esse é o grande debate,” eu disse a ela. “É como um papagaio super avançado que é incrivelmente bom em imitar padrões de linguagem humana. Ele não ’entende’ da maneira que os humanos entendem. Não tem experiências, emoções ou consciência.
Mas é tão bom em prever padrões de linguagem que pode simular compreensão de forma muito convincente. É como um espelho que reflete sua imagem sem realmente ‘ver’ você.”
Por Que Às Vezes Eles Inventam Coisas
Isso levou à sua próxima pergunta: “Por que às vezes ele inventa fatos? Ele me deu uma receita de pão de banana que parecia errada.”
“Lembra como eu disse que ele está prevendo a próxima palavra? Bem, às vezes a palavra mais provável leva a algo que soa plausível, mas não é verdade.
É como se eu pedisse para você continuar uma história sobre Abraham Lincoln, você poderia dizer que ele morou na Casa Branca, o que é verdade, mas também poderia adicionar detalhes que parecem certos, mas não são historicamente precisos.”
O Tamanho Importa: Por Que Modelos Maiores São Mais Inteligentes
Para explicar por que alguns modelos de IA são melhores que outros, usei uma comparação que ela poderia visualizar:
“Os modelos maiores leram mais livros e têm mais conexões entre conceitos. O GPT-4 tem centenas de bilhões dessas conexões, enquanto modelos menores podem ter apenas alguns bilhões.
É como comparar alguém que leu 10.000 livros com alguém que leu 100 livros. A primeira pessoa geralmente dará informações mais nuançadas e precisas.”
A Verdade Surpreendente Sobre o “Treinamento” de IA
Minha mãe presumiu que os modelos de IA estavam constantemente aprendendo com nossas conversas, então tive que corrigi-la:
“A maioria dos LLMs como o ChatGPT são na verdade congelados após seu treinamento inicial. Eles não aprendem com suas conversas com eles. É como se eles lessem bilhões de livros, depois fizessem um exame final, e agora estão apenas usando o que aprenderam durante esse período de estudo para responder perguntas.
Alguns sistemas mais novos têm memória ou podem pesquisar na web por informações atualizadas, mas o modelo central em si geralmente não está aprendendo com você.”
Por Que Isso Importa (Mesmo Se Você Não É Uma Pessoa Técnica)
Enquanto nossa chamada estava terminando (com o gato dela exigindo atenção ao fundo), expliquei por que entender o básico dos LLMs é importante:
“Esses sistemas estão cada vez mais tomando decisões que afetam nossas vidas, desde as notícias que vemos até ajudar médicos a diagnosticar doenças. Entender suas limitações nos ajuda a usá-los de forma responsável.
Eles são ferramentas incrivelmente poderosas, mas ainda são apenas ferramentas, como calculadoras muito avançadas para linguagem em vez de números.”
O Veredito da Minha Mãe
Após minha explicação, minha mãe assentiu e disse: “Então é como ter um assistente de pesquisa muito bem lido que às vezes inventa coisas, não tem experiências reais, e está realmente apenas jogando um jogo de previsão de palavras incrivelmente sofisticado?”
“Isso é… na verdade um resumo perfeito,” respondi.
E então ela me pediu para guiá-la na configuração do ChatGPT através do compartilhamento de tela, porque “mesmo que seja apenas um jogo de palavras, ainda escreve e-mails melhores do que eu.”
Às vezes, as explicações mais simples são as melhores, mesmo quando entregues a milhares de quilômetros de distância.