já viram como essas LLMs (large language models) funcionam?
tem uma relação forte com estatísticas da linguagem, o modelo calcula qual a palavra/frase com mais probabilidade de gerar um bom resultado e coloca essa frase em sequência, com um tempero de aleatoriedade e uma memória do que foi dito.
Não tinha essa ideia de que é baseado em estatística até ver uns vídeos da code.org
E quanto às IAs que geram imagens?
Um método chamado Diffusion:
Parte-se de uma imagem e uma descrição do que ela é (ex: cavalo marrom com céu azul atrás).
Adiciona-se um pouco de ruído à essa imagem. Algo como borrar ou deixar ela um pouco mais pixelada. Assim como uma imagem vai perdendo qualidade conforme vamos printando e repassando ela.
Ao se fazer isso várias vezes, a imagem perde a nitidez e se torna ruído puro.
Cada etapa desse processo é uma oportunidade de se ensinar a IA como reverter o processo.
E assim ela aprende a advinhar como uma versão com mais detalhes seria.
Então, a partir de uma descrição (ex: cavalo marrom com céu azul atrás), ela consegue gerar uma imagem totalmente nova!
Aprendi isso lá também!
https://code.org/ai#ai-videos