A inteligência artificial é um campo que vive um período de transformações tão rápidas e profundas que, muitas vezes, parece até que estamos vendo algo de magia e não de tecnologia. Nesta semana, a coluna de Pedro e Paulo Markun, em Tilt, apresenta três exemplos de tecnologias que mais parecem ter saído do mundo dos bruxos. OpenAI - GPT 3A inteligência artificial da OpenAI foi treinada para produzir textos. Os engenheiros colocaram a tecnologia para ler boa parte da internet (Common Crawl e WebText2), a Wikipédia e milhões de livros, totalizando uma massa de dados de 45 terabytes de informação. Para colocar em perspectiva é como se o tal sistema tivesse lido 10 milhões de livros diferentes, do tamanho de uma Bíblia comum. Com toda essa informação memorizada e transformada em "parâmetros", os cientistas descobriram que o sistema consegue criar textos bem convincentes e praticamente indistinguíveis daqueles produzidos por humanos. O sistema ainda funciona significativamente melhor em inglês, mas é capaz também de gerar textos em outras línguas, como o português, e de traduzir conteúdos com um alto grau de precisão. OpenAI - Dall-E 2O Dall-E foi treinado a partir de centenas de milhares de imagens, com uma lógica parecida com a do GPT 3. Funciona assim: você descreve o que quer que a inteligência artificial desenhe e ele cria dezenas de variações da sua proposta. O Dall-E também permite você alterar e inserir elementos em imagens já existentes ou recriar variações de uma imagem ou obra de arte. Exemplo: "Um astronauta andando a cavalo em um estilo fotorealista". A ideia é que a IA exiba resultados dentro disso. O sistema ainda não está disponível para uso público. Apenas uns poucos pesquisadores têm acesso à ferramenta, mas já é possível colocar seu nome na lista de espera. NVIDIA - MaxineEsse ano, a NVIDIA, uma das grandes pioneiras do campo apresentou o Maxine, uma tecnologia de vídeo para teleconferências que utiliza transformadores e IA. Na prática, a Maxine possibilita a correção do olhar, já que a pessoa pode estar lendo a tela. Assim, sempre vai parecer que está olhando diretamente para seus interlocutores. Há ainda a possibilidade de tradução em tempo real da fala, permitindo uma conversa simultânea entre pessoas de diferentes partes do mundo. Moral da história: tudo parece mágica, não? |
Nenhum comentário:
Postar um comentário