Esta Semana em IA: OpenAI e editoras são parceiros de conveniência

Manter-se atualizado em uma indústria tão movimentada quanto a IA é uma tarefa árdua. Então, até que uma IA possa fazer isso por você, aqui está um resumo útil das últimas histórias no mundo do aprendizado de máquina, juntamente com pesquisas e experimentos notáveis que não cobrimos separadamente.

A propósito, o TechCrunch planeja lançar em breve uma newsletter sobre IA. Fique ligado. Enquanto isso, estamos aumentando a frequência de nossa coluna de IA semi-regular, que antes era quinzenal (ou algo assim), para semanal — então fique atento para mais edições.

Nesta semana em IA, a OpenAI anunciou que fez um acordo com a News Corp, o novo gigante editorial, para treinar modelos de IA generativa desenvolvidos pela OpenAI em artigos das marcas da News Corp, incluindo The Wall Street Journal, Financial Times e MarketWatch. O acordo, que as empresas descrevem como "multi-anual" e "histórico", também dá à OpenAI o direito de exibir os logotipos da News Corp em aplicativos como ChatGPT em resposta a certas perguntas — presumivelmente em casos em que as respostas são parcialmente ou totalmente provenientes das publicações da News Corp.

Parece ser uma vitória para ambas as partes, não é? A News Corp recebe uma infusão de dinheiro por seu conteúdo — mais de $250 milhões, segundo relatos — em um momento em que o outlook da indústria de mídia é ainda mais sombrio do que o usual. (A IA generativa não tem ajudado, ameaçando reduzir consideravelmente o tráfego de referência das publicações.) Enquanto isso, a OpenAI, que está lutando com detentores de direitos autorais em várias frentes por questões de uso justo, tem uma batalha judicial cara a menos para se preocupar.

Mas o detalhe está nos detalhes. Observe que o acordo com a News Corp tem uma data de término — assim como todos os acordos de licenciamento de conteúdo da OpenAI.

Isso por si só não é de má fé por parte da OpenAI. A licença perpétua é uma raridade na mídia, dadas as motivações de todas as partes envolvidas em manter a porta aberta para renegociar o acordo. No entanto, é um pouco suspeito à luz dos comentários recentes do CEO da OpenAI, Sam Altman, sobre a diminuição da importância dos dados de treinamento de modelos de IA.

Em uma participação no podcast "All-In", Altman disse que definitivamente não acredita que haverá uma corrida armamentista por dados de treinamento, porque quando os modelos ficam inteligentes o suficiente, em algum momento, não deveria se tratar de mais dados — pelo menos não para treinamento. Em outro lugar, ele disse a James O'Donnell da MIT Technology Review que é "otimista" de que a OpenAI — e/ou a indústria de IA mais ampla — vão "encontrar uma saída de [precisar] de mais e mais dados de treinamento."

Os modelos ainda não são tão "inteligentes", levando a relatos de que a OpenAI está experimentando com dados de treinamento sintéticos e pesquisando nas partes mais remotas da web — e do YouTube — por fontes orgânicas. Mas vamos supor que um dia eles não precisem de muitos dados adicionais para melhorar significativamente. O que isso significa para as editoras, especialmente uma vez que a OpenAI raspou todos os seus arquivos?

O ponto que estou querendo chegar é que as editoras — e os outros proprietários de conteúdo com quem a OpenAI trabalhou — parecem ser parceiros de conveniência de curto prazo, não muito mais. Através de acordos de licenciamento, a OpenAI neutraliza efetivamente uma ameaça legal — pelo menos até que os tribunais determinem como o uso justo se aplica no contexto do treinamento de IA — e comemora uma vitória de relações públicas. As editoras obtêm capital muito necessário. E o trabalho em IA que poderia prejudicar gravemente essas editoras continua.

Aqui estão algumas outras histórias de IA dignas de nota dos últimos dias:

  • DJ de IA do Spotify: A adição do recurso DJ de IA do Spotify, que introduz seleções de músicas personalizadas para os usuários, foi o primeiro passo da empresa para um futuro de IA. Agora, o Spotify está desenvolvendo uma versão alternativa desse DJ que falará em espanhol.
  • Conselho de IA da Meta: A Meta anunciou na quarta-feira a criação de um conselho consultivo de IA. No entanto, há um grande problema: só há homens brancos nele. Isso parece um pouco insensível considerando que os grupos marginalizados são os mais propensos a sofrer as consequências das deficiências da tecnologia de IA.
  • FCC propõe divulgações de IA: A Federal Communications Commission (FCC) propôs a exigência de que o conteúdo gerado por IA seja divulgado em anúncios políticos — mas não proibido.
  • Responder a chamadas com a própria voz: O Truecaller, o conhecido serviço de identificador de chamadas, em breve permitirá que os clientes usem seu assistente alimentado por IA para atender chamadas com sua própria voz, graças a uma parceria recém-firmada com a Microsoft.
  • Humane considera uma venda: Humane, a empresa por trás do muito falado Ai Pin que foi lançado no mês passado, está procurando um comprador. A empresa teria se avaliado entre $750 milhões e $1 bilhão, e o processo de venda está em estágios iniciais.
  • TikTok recorre à IA generativa: O TikTok é a mais recente empresa de tecnologia a incorporar IA generativa em seu negócio de publicidade, conforme anunciou na terça-feira que está lançando um novo conjunto de ferramentas AI Symphony TikTok para marcas.
  • Cúpula de IA em Seul: Em uma cúpula de segurança de IA em Seul, Coréia do Sul, autoridades governamentais e executivos da indústria de IA concordaram em aplicar medidas de segurança elementares no campo de rápida evolução e estabelecer uma rede internacional de pesquisa em segurança.
  • PCs de IA da Microsoft: Em dois discursos principais durante sua conferência anual de desenvolvedores Build esta semana, a Microsoft revelou uma nova linha de máquinas Windows (e laptops Surface) chamados de PCs Copilot+, além de recursos alimentados por IA generativa, como Recall, que ajuda os usuários a encontrar aplicativos, arquivos e outro conteúdo que já visualizaram no passado.
  • Debacle de voz da OpenAI: A OpenAI está removendo uma das vozes no recurso de texto para fala do ChatGPT. Os usuários acharam a voz, chamada Sky, bastante parecida com a de Scarlett Johansson — e Johansson ela mesma divulgou uma declaração dizendo que contratou advogados para investigar a voz Sky e obter detalhes precisos sobre como ela foi desenvolvida.
  • Lei de condução autônoma do Reino Unido: As regulamentações do Reino Unido para carros autônomos agora são oficiais depois de receberem sanção real, o último carimbo final que qualquer legislação deve passar antes de se tornar lei.

Mais aprendizados de máquina

Alguns interessantes pesquisas relacionadas à IA para você esta semana. O prolífico pesquisador da Universidade de Washington, Shyan Gollakota, mais uma vez se destaca com um par de fones de ouvido com cancelamento de ruído que você pode solicitar para bloquear tudo exceto a pessoa que você deseja ouvir. Usando esses fones de ouvido, você pressiona um botão enquanto olha para a pessoa, e ele amostra a voz vindo daquela direção específica, usando isso para alimentar um mecanismo de exclusão auditiva para que ruídos de fundo e outras vozes sejam filtrados.

Os pesquisadores, liderados por Gollakota e vários estudantes de pós-graduação, chamam o sistema de The Target Speech Hearing e o apresentaram na semana passada em uma conferência em Honolulu. Útil tanto como uma ferramenta de acessibilidade quanto uma opção cotidiana, este é definitivamente um recurso que você pode ver uma das grandes empresas de tecnologia roubando para a próxima geração de fones de alta qualidade.

Os químicos da EPFL claramente estão cansados de realizar 18 tarefas em particular, porque treinaram um modelo chamado ChemCrow para fazê-las no lugar deles. Não coisas reais como titulando e pipetando, mas planejando trabalhos como vasculhar a literatura e planejar cadeias de reações. ChemCrow não faz tudo para os pesquisadores, é claro, mas age mais como uma interface de linguagem natural para o conjunto inteiro, usando qualquer opção de busca ou cálculo conforme necessário.

Créditos da Imagem: EPFL

O autor principal do artigo que mostra o ChemCrow disse que é 'análogo a um especialista humano com acesso a uma calculadora e bancos de dados', ou seja, um estudante de pós-graduação, então espero que eles possam trabalhar em algo mais importante ou pular as partes chatas. Me lembra um pouco o Coscientist. Quanto ao nome, é porque os corvos são conhecidos por usar ferramentas bem. Suficiente!

Os robóticos da Disney Research estão trabalhando arduamente para fazer suas criações se moverem de forma mais realista sem ter que animar manualmente todas as possibilidades de movimentos. Um novo artigo que eles apresentarão na SIGGRAPH em julho mostra uma combinação de animação gerada proceduralmente com uma interface de artista para ajustá-la, tudo funcionando em um robô bípede real (um Groot).

A ideia é permitir que o artista crie um tipo de locomoção — saltitante, rígida, instável — e os engenheiros não precisam implementar todos os detalhes, apenas garantir que esteja dentro de certos parâmetros. Isso pode então ser executado na hora, com o sistema proposto improvisando os movimentos exatos. Espere ver isso em alguns anos na Disney World...