IA generativa está mudando o trabalho criativo

IA generativa está mudando o trabalho criativo
Entenda como a IA generativa está mudando o trabalho criativo e ganhe mais conhecimento do assunto com nosso saiba mais.

Compartilhe esse post

Olá, querido leitor! Se você já se perguntou como a IA generativa está mudando o cenário do trabalho criativo, você chegou ao lugar certo. O mundo da criação artística e de conteúdo está passando por uma revolução silenciosa, mas impactante.

Como a IA generativa está mudando o trabalho criativo

E não, não estou falando apenas de um novo software de design ou uma técnica de filmagem inovadora. Estou falando da Inteligência Artificial generativa — uma tecnologia que está redefinindo as fronteiras do que é possível em design, música, escrita e muito mais.

Notei que a IA generativa não está apenas auxiliando os criativos, mas também está criando novas formas de arte e expressão que antes eram inimagináveis. Pense em músicas compostas por algoritmos, pinturas geradas por redes neurais e escrita assistida por IA.

Sim, você leu certo. E o melhor de tudo? Essas mudanças estão ocorrendo aqui e agora, transformando setores e criando oportunidades para quem está disposto a abraçar essa nova era.

IA generativa está mudando o trabalho criativo


Primeiro, ele é sensível às instruções que lhe são fornecidas; tentamos várias sugestões alternativas antes de decidirmos por essa frase. Segundo, o sistema escreve razoavelmente bem; não há erros gramaticais e a escolha das palavras é apropriada. Terceiro, beneficiaria da edição; normalmente não começaríamos um artigo como este com uma lista numerada, por exemplo. Finalmente, surgiram ideias nas quais não tínhamos pensado. O último ponto sobre conteúdo personalizado, por exemplo, não seria algo que teríamos considerado.

No geral, fornece uma boa ilustração do valor potencial destes modelos de IA para as empresas. Ameaçam subverter o mundo da criação de conteúdos, com impactos substanciais no marketing, software, design, entretenimento e comunicações interpessoais. Esta não é a “inteligência artificial geral” com que os humanos há muito sonham e temem, mas pode parecer que sim para observadores casuais.

O que é IA generativa?
A IA generativa já pode fazer muito. É capaz de produzir textos e imagens, abrangendo postagens de blogs, códigos de programas, poesia e obras de arte (e até mesmo vencer competições, de forma controversa). O software usa modelos complexos de aprendizado de máquina para prever a próxima palavra com base em sequências de palavras anteriores ou a próxima imagem com base em palavras que descrevem imagens anteriores. Os LLMs começaram no Google Brain em 2017, onde foram inicialmente usados para tradução de palavras preservando o contexto.

Desde então, grandes modelos de linguagem e de texto para imagem proliferaram em empresas líderes de tecnologia, incluindo Google (BERT e LaMDA), Facebook (OPT-175B, BlenderBot) e OpenAI, uma organização sem fins lucrativos na qual a Microsoft é o investidor dominante (GPT- 3 para texto, DALL-E2 para imagens e Whisper para fala). Comunidades online como Midjourney (que ajudou a vencer o concurso de arte) e fornecedores de código aberto como HuggingFace também criaram modelos generativos.

Esses modelos têm sido em grande parte confinados às grandes empresas de tecnologia porque treiná-las requer enormes quantidades de dados e poder computacional. O GPT-3, por exemplo, foi inicialmente treinado em 45 terabytes de dados e emprega 175 mil milhões de parâmetros ou coeficientes para fazer as suas previsões; uma única execução de treinamento para GPT-3 custou US$ 12 milhões. Wu Dao 2.0, um modelo chinês, possui 1,75 trilhão de parâmetros. A maioria das empresas não possui recursos de data center ou orçamentos de computação em nuvem para treinar seus próprios modelos desse tipo do zero.

Mas uma vez treinado um modelo generativo, ele pode ser “ajustado” para um domínio de conteúdo específico com muito menos dados. Isto levou a modelos especializados de BERT – para conteúdo biomédico (BioBERT), conteúdo jurídico (Legal-BERT) e texto francês (CamemBERT) – e GPT-3 para uma ampla variedade de fins específicos.

O BioNeMo da NVIDIA é uma estrutura para treinar, construir e implantar grandes modelos de linguagem em escala de supercomputação para química generativa, proteômica e DNA/RNA. A OpenAI descobriu que apenas 100 exemplos específicos de dados específicos de domínio podem melhorar substancialmente a precisão e relevância das saídas do GPT-3.

IA generativa está mudando o trabalho criativo


Para usar a IA generativa de forma eficaz, você ainda precisa do envolvimento humano no início e no final do processo.

Para começar, um ser humano deve inserir um prompt em um modelo generativo para que ele crie conteúdo. De modo geral, as solicitações criativas geram resultados criativos. É provável que o “engenheiro imediato” se torne uma profissão estabelecida, pelo menos até surgir a próxima geração de IA ainda mais inteligente. O campo já resultou em um livro de 82 páginas de prompts de imagens do DALL-E 2 e em um mercado de prompts no qual, por uma pequena taxa, é possível comprar prompts de outros usuários. A maioria dos usuários desses sistemas precisará tentar vários prompts diferentes antes de alcançar o resultado desejado.

Então, uma vez que um modelo gere conteúdo, ele precisará ser avaliado e editado cuidadosamente por um ser humano. Saídas de prompt alternativas podem ser combinadas em um único documento. A geração de imagens pode exigir manipulação substancial. Jason Allen, que venceu o concurso de “fotografia digitalmente manipulada” do Colorado com a ajuda de Midjourney, disse a um repórter que passou mais de 80 horas fazendo mais de 900 versões da arte e ajustando suas instruções continuamente. Ele então melhorou o resultado com o Adobe Photoshop, aumentou a qualidade e a nitidez da imagem com outra ferramenta de IA e imprimiu três peças em tela.

Os modelos de IA generativa são incrivelmente diversos. Eles podem incluir conteúdo como imagens, formatos de texto mais longos, e-mails, conteúdo de mídia social, gravações de voz, código de programa e dados estruturados. Eles podem produzir novos conteúdos, traduções, respostas a perguntas, análises de sentimentos, resumos e até vídeos. Essas máquinas de conteúdo universal têm muitas aplicações potenciais nos negócios, várias das quais descrevemos abaixo.

Aplicações de marketing

Esses modelos generativos são potencialmente valiosos em diversas funções de negócios, mas as aplicações de marketing são talvez as mais comuns. Jasper, por exemplo, uma versão do GPT-3 com foco em marketing, pode produzir blogs, postagens em mídias sociais, textos para a web, e-mails de vendas, anúncios e outros tipos de conteúdo voltado para o cliente.

Ela afirma que testa frequentemente seus resultados com testes A/B e que seu conteúdo é otimizado para posicionamento em mecanismos de pesquisa. Jasper também ajusta os modelos GPT-3 com os melhores resultados de seus clientes, o que, segundo os executivos da Jasper, levou a melhorias substanciais. A maioria dos clientes da Jasper são pessoas físicas e pequenas empresas, mas alguns grupos dentro de empresas maiores também utilizam seus recursos.

Na empresa de computação em nuvem VMWare, por exemplo, os redatores usam Jasper para gerar conteúdo original para marketing, desde e-mail até campanhas de produtos e textos para mídias sociais. Rosa Lear, diretora de crescimento liderado por produto, disse que Jasper ajudou a empresa a aprimorar nossa estratégia de conteúdo, e os redatores agora têm tempo para fazer melhores pesquisas, ideias e estratégias.

Kris Ruby, proprietária da agência de relações públicas e mídia social Ruby Media Group, agora está usando a geração de texto e imagem a partir de modelos generativos. Ela diz que eles são eficazes para maximizar a otimização de mecanismos de pesquisa (SEO) e, em RP, para argumentos de venda personalizados para redatores. Ela acredita que essas novas ferramentas abrem uma nova fronteira nos desafios de direitos autorais e ela ajuda a criar políticas de IA para seus clientes.

Quando ela usa as ferramentas, ela diz: “A IA é 10%, eu sou 90%” porque há muita solicitação, edição e iteração envolvida. Ela sente que essas ferramentas tornam a escrita melhor e mais completa para a descoberta em mecanismos de pesquisa, e que as ferramentas de geração de imagens podem substituir o mercado de banco de imagens e levar a um renascimento do trabalho criativo.

O DALL-E 2 e outras ferramentas de geração de imagens já estão sendo utilizadas para publicidade. Heinz, por exemplo, usou a imagem de um frasco de ketchup com um rótulo semelhante ao de Heinz para argumentar que “isto é o que ‘ketchup’ parece para a IA”. Claro, isso significava apenas que o modelo foi treinado em um número relativamente grande de fotos de garrafas de ketchup Heinz.

IA generativa está mudando o trabalho criativo


A Nestlé usou uma versão aprimorada por IA de uma pintura de Vermeer para ajudar a vender uma de suas marcas de iogurte. Stitch Fix, a empresa de roupas que já usa IA para recomendar roupas específicas aos clientes, está experimentando o DALL-E 2 para criar visualizações de roupas com base nas preferências solicitadas dos clientes em termos de cor, tecido e estilo. A Mattel está usando a tecnologia para gerar imagens para design e marketing de brinquedos.

Aplicativos de geração de código

O GPT-3, em particular, também provou ser um gerador eficaz, senão perfeito, de código de programa de computador. Dada a descrição de um “snippet” ou função de programa pequeno, o programa Codex do GPT-3 – treinado especificamente para geração de código – pode produzir código em uma variedade de linguagens diferentes. O Github da Microsoft também possui uma versão do GPT-3 para geração de código chamada CoPilot. As versões mais recentes do Codex agora podem identificar bugs e corrigir erros em seu próprio código – e até mesmo explicar o que o código faz – pelo menos algumas vezes.

O objetivo expresso da Microsoft não é eliminar os programadores humanos, mas fazer com que ferramentas como o Codex ou o CoPilot “emparelhem programadores” com humanos para melhorar sua velocidade e eficácia.

O consenso sobre a geração de código baseada em LLM é que ela funciona bem para tais trechos, embora a integração deles em um programa maior e a integração do programa em um ambiente técnico específico ainda exijam capacidades de programação humana. A Deloitte experimentou extensivamente o Codex nos últimos meses e descobriu que ele aumenta a produtividade de desenvolvedores experientes e cria alguns recursos de programação para aqueles sem experiência.

Em um piloto de seis semanas na Deloitte com 55 desenvolvedores durante 6 semanas, a maioria dos usuários classificou a precisão do código resultante em 65% ou melhor, com a maior parte do código vindo do Codex. No geral, o experimento da Deloitte encontrou uma melhoria de 20% na velocidade de desenvolvimento de código para projetos relevantes.

A Deloitte também usou o Codex para traduzir código de um idioma para outro. A conclusão da empresa foi que ainda precisaria de desenvolvedores profissionais num futuro próximo, mas o aumento da produtividade poderia exigir menos deles. Tal como acontece com outros tipos de ferramentas generativas de IA, eles descobriram que quanto melhor o prompt, melhor o código de saída.

Aplicativos de conversação
Os LLMs estão sendo cada vez mais usados no centro da IA conversacional ou chatbots. Eles oferecem potencialmente maiores níveis de compreensão da conversação e consciência do contexto do que as tecnologias de conversação atuais. O BlenderBot do Facebook, por exemplo, que foi projetado para o diálogo, pode manter longas conversas com humanos enquanto mantém o contexto.

O BERT do Google é usado para entender as consultas de pesquisa e também é um componente do mecanismo de chatbot DialogFlow da empresa. O LaMBA do Google, outro LLM, também foi projetado para o diálogo, e as conversas com ele convenceram um dos engenheiros da empresa de que era um ser senciente – um feito impressionante, visto que ele simplesmente prevê palavras usadas em conversas com base em conversas anteriores.

Nenhum desses LLMs é um conversador perfeito. Eles são treinados com base em conteúdo humano passado e têm tendência a replicar qualquer linguagem racista, sexista ou tendenciosa à qual foram expostos no treinamento. Embora as empresas que criaram estes sistemas estejam a trabalhar na filtragem do discurso de ódio, ainda não foram totalmente bem-sucedidas.

Aplicativos de gestão de conhecimento

Uma aplicação emergente dos LLMs é empregá-los como um meio de gerenciar conhecimento baseado em texto (ou potencialmente baseado em imagem ou vídeo) dentro de uma organização. A intensidade do trabalho envolvido na criação de bases de conhecimento estruturadas dificultou a gestão do conhecimento em larga escala para muitas grandes empresas. No entanto, algumas pesquisas sugeriram que os LLMs podem ser eficazes na gestão do conhecimento de uma organização quando o modelo de formação é ajustado a um corpo específico de conhecimento baseado em texto dentro da organização. O conhecimento dentro de um LLM pode ser acessado por meio de perguntas emitidas como instruções.

Algumas empresas estão explorando a ideia da gestão do conhecimento baseada em LLM em conjunto com os principais fornecedores de LLMs comerciais. O Morgan Stanley, por exemplo, está trabalhando com o GPT-3 da OpenAI para aperfeiçoar o treinamento sobre conteúdo de gestão de patrimônio, para que os consultores financeiros possam pesquisar o conhecimento existente na empresa e criar facilmente conteúdo personalizado para os clientes.

Parece provável que os utilizadores de tais sistemas necessitarão de formação ou assistência na criação de instruções eficazes, e que os resultados de conhecimento dos LLMs poderão ainda necessitar de edição ou revisão antes de serem aplicados. Supondo que tais questões sejam abordadas, no entanto, os LLMs poderiam reacender o campo da gestão do conhecimento e permitir-lhe escalar de forma muito mais eficaz.

Deepfakes e outras questões legais/éticas

Já vimos que estes sistemas generativos de IA conduzem rapidamente a uma série de questões legais e éticas. “Deepfakes”, ou imagens e vídeos criados por IA e que pretendem ser realistas, mas não o são, já surgiram na mídia, no entretenimento e na política. Até agora, no entanto, a criação de deepfakes exigia uma quantidade considerável de habilidade computacional. Agora, porém, quase qualquer pessoa será capaz de criá-los.

A OpenAI tentou controlar imagens falsas “marcando uma marca d’água” em cada imagem do DALL-E 2 com um símbolo distinto. No entanto, é provável que sejam necessários mais controles no futuro – especialmente à medida que a criação de vídeos generativos se torna popular.

A IA generativa também levanta inúmeras questões sobre o que constitui conteúdo original e proprietário. Como o texto e as imagens criados não são exatamente iguais a qualquer conteúdo anterior, os fornecedores desses sistemas argumentam que eles pertencem aos seus criadores imediatos. Mas eles são claramente derivados do texto e das imagens anteriores usados para treinar os modelos.

Veja mais em: Casos de uso de IA no setor imobiliário.

Escusado será dizer que estas tecnologias proporcionarão um trabalho substancial para os advogados de propriedade intelectual nos próximos anos.

A partir destes poucos exemplos de aplicações empresariais, deve ficar claro que estamos apenas a arranhar a superfície do que a IA generativa pode fazer pelas organizações e pelas pessoas dentro delas. Em breve poderá ser uma prática padrão, por exemplo, que tais sistemas criem a maior parte ou todo o nosso conteúdo escrito ou baseado em imagens – para fornecer primeiros rascunhos de e-mails, cartas, artigos, programas de computador, relatórios, postagens em blogs, apresentações, vídeos, e assim por diante.

Leia mais em: Neurônios Artificiais: O Cérebro da Máquina.

Não há dúvida de que o desenvolvimento de tais capacidades teria implicações dramáticas e imprevistas para a propriedade de conteúdos e a protecção da propriedade intelectual, mas também é provável que revolucionem o conhecimento e o trabalho criativo. Supondo que estes modelos de IA continuem a progredir como têm feito no curto período de existência, dificilmente podemos imaginar todas as oportunidades e implicações que podem gerar.

Inscreva-se na Newsletter

DOSE DIÁRIA DE INTELIGÊNCIA ARTIFICIAL
E receba atualizações sobre IA todo dia no seu e-mail

Subscription Form

Mais para explorar

Entre para a melhor formação de IA na prática do Brasil