Modelos de Inteligência Artificial Generativa

Nos últimos meses, tudo em torno da Inteligência Artificial (IA) tem ganhado popularidade no mundo da tecnologia. Especificamente, a IA Generativa asumiu um lugar destacado como a maior novidade dentre as inovações baseadas em dados. 

O que é Inteligência Artificial Generativa? É uma tecnologia que usa Machine Learning (ML) e IA para permitir que um software crie novas imagens, blocos de texto, vídeo e áudio ou possa ser usado para produzir novas ideias ou planos. A IA Generativa pode identificar padrões nos dados de entrada (inputs) e usá-los para gerar saídas (outputs) semelhantes, conforme solicitado. Essas respostas não são uma cópia, mas objetos novos e únicos. 

A IA generativa tem uma enorme quantidade de casos de uso em pesquisa, negôcios ou até mesmo instituções governamentais. Por esse motivo, está sendo adotada por organizações de todos os tamanhos e áreas no mundo todo. A produção de grandes quantidades de dados úteis em curtos períodos também ajuda a treinar novos modelos de ML. Podemos dizer que a IA Generativa está aproveitando seu poder para se tornar uma tecnologia ainda mais relevante no futuro.

É diferente dos Modelos Analíticos

Devido a seu gigantesco poder de processamento, as máquinas são melhores do que nós na análise de conjuntos de dados. Inicialmente, a Inteligência Artificial foi usada exclusivamente para encontrar padrões em dados para tarefas como detectar spam ou fazer previsões, entre outras análises e trabalhos cognitivos.

Por exemplo, quando se usa o Google Maps para mostrar como ir de um ponto a outro em uma cidade, a IA usa seu poder analítico para mostrar diferentes rotas que você poderia usar para chegar ao seu destino, usando informações do trânsito em tempo real para obter a melhor rota disponível. 

É um grande salto ir da execução desse tipo de tarefas até a criação de um poema que seja semelhante aos escritos por seu poeta favorito, por exemplo. Qual é a diferença? Os novos modelos de IA Generativa requerem treinamento e consumo de recursos maiores para executar trabalhos criativos. Por conta disso, era preciso desenvolver e melhorar a Inteligência Artificial Analítica antes de que a generativa pudesse dar seus primeiros passos.

A IA generativa levou um tempo para evoluir

Depois de anos desenvolvendo modelos de IA “pequenos” que podiam classificar informações ou entender a linguagem, o poder de computação usado por esses modelos começou a crescer exponencialmente na segunda parte da década de 2010. Naquele momento, a capacidade de processar informações das Inteligências Artificiais também se expandiu e os primeiros modelos “generativos” apareceram para casos como escrever uma piada ou algumas linhas de código. 

O panorama das aplicações de IA generativa. Fonte.

A possibilidade de obter processamento e escalabilidade mais barato tornaram a Inteligência Artificial melhor e mais rápida de usar. No ano passado (2022), as coisas realmente começaram a melhorar para a IA Generativa e o futuro parece muito promissor. Como você pode ver na imagem acima, a geração de texto, imagens, vídeos e código pelas Inteligências Artificiais está em processo de desenvolvimento atualmente em várias linhas de pesquisa e negócios. Talvez este texto tenha sido gerado pela IA também? 😉

O que mais está reservado para o futuro?

Bilhões de dólares foram investidos em pesquisa e desenvolvimento de soluções de Inteligência Artificial Generativa nos últimos anos. De acordo com a Gartner, as aplicações de IA Generativa dominarão o mundo em breve. Algumas previsões e casos de uso que estão sendo desenvolvidos agora:

  • IA generativa para o desenho de medicamentos: isso deve reduzir o custo dos processos necessários para produzir um novo medicamento e também o tempo necessário para fazê-lo. Especialistas do Gartner esperam que 30% dos medicamentos sejam “descobertos” usando técnicas de IA generativa até 2025.
  • Desenho de materiais novos: focados em propriedades físicas específicas, novos materiais podem ser criados usando IA Generativa para ajudar e acelerar os processos em indústrias como aeroespacial, médica, militar, eletrônica e energia, entre outras.
  • Desenho de novas peças: essas mesmas indústrias podem usar a IA para ajudar no desenho de novas peças mais eficientes ou com melhor desempenho.
  • Otimização da colocação de componentes no desenho de chips semicondutores: isso também pode ser feito aproveitando o poder da IA Generativa. Reduziria o tempo do ciclo de vida do desenvolvimento do produto.
  • Criação de dados sintéticos: a IA Generativa pode criar dados em vez de coletá-los do mundo real. Por exemplo, dados médicos que simulam os reais, porém não expõem as identidades dos pacientes. Esses dados ajudariam a treinar outros modelos de ML.
  • Conteúdo de marketing: espera-se que as mensagens de marketing enviadas para clientes comecem a ser geradas sinteticamente. Expertos da Gartner esperam que o número suba para cerca de 30% desse tipo de mensagens até 2025, de apenas 2% em 2022.
  • Filmes de grande orçamento usarão vídeo gerado por IA: uma das previsões mais ousadas da Gartner. Espera-se que até 2030, pelo menos 90% da duração de um filme possa ser gerada pela IA. Isso exigiria muito avanço nessa área nos próximos anos, mas certamente é uma possibilidade agora.

ChatGPT e outros jogadores principais

ChatGPT

ChatGPT é um modelo de linguagem de IA desenvolvido pela OpenAI. É um chatbot em essência, mas é alimentado por uma quantidade gigantesca de dados e parâmetros. Graças a isso, ele pode responder perguntas, escrever histórias, fazer revisões de texto/código e muito mais. É usado em um contexto conversacional. 

Não se pode negar que o ChatGPT criou a febre pela IA. Grandes quantias de dinheiro foram prometidas para o desenvolvimento da IA após seu lançamento e popularidade. Então, mesmo que no futuro seja substituído por outras Inteligências Artificiais que façam o mesmo tipo de tarefas de melhor forma, ChatGPT ainda será lembrado como um dos pioneiros da indústria.

Dall-E

A OpenAI também está por trás da criação de Dall-E e Dall-E 2. Esses dois são modelos de Deep Learning usados para criação de imagens. A ideia por trás deles é criar imagens que reflitam com precisão instruções que recebeu escritas em linguagem natural. Dall-E criará uma imagem original e realista combinando conceitos, atributos e estilos. Ele pode fazer edições realistas em imagens existentes, adicionando ou removendo elementos, ou criando variações com base no original, segundo solicitado. Isso pode ser usado para criar uma coleção de imagens exclusivas que são semelhantes em seu conceito. Abaixo você pode ver uma imagem original (esquerda) e uma imagem criada por Dall-E 2 (direita), expandindo a original. 

Uma imagem original e uma imagem expandida criada por DALL-E. Fonte.

LaMDA

LaMDA do Google é uma família de modelos de linguagem neural de conversação. O Google tem trabalhado nesses modelos durante esta década e o LaMDA 2 ficou muito famoso em 2022, quando um engenheiro de software sênior do Google afirmou que o LaMDA havia se tornado consciente. Essa alegação foi desconsiderada por grande parte da comunidade. 

Além disso, em fevereiro de 2023, o Google anunciou o lançamento de Bard, um chatbot baseado no LaMDA, resposta direta à popularidade do ChatGPT da Open AI. Espera-se que o Bard seja integrado no mecanismo de buscas do Google no futuro.

Stable Diffusion

Outro modelo de texto para imagem que foi lançado em 2022. Stable Diffusion foi desenvolvido pelo Grupo CompVis na Universidade Ludwig Maximilian, em Munique. Ele usa um modelo de difusão e foi treinado com mais de 5 bilhões de pares de imagem e texto. Seu código foi lançado publicamente e pode ser executado em hardware que não é muito especializado, já que ele requer uma modesta Unidade de Processamento Gráfico e VRAM.

Scroll to Top