Pular para o conteúdo

A Meta enfrenta outro processo por usar trabalhos protegidos por direitos autorais para treinar seus modelos de IA

Para uma empresa que possui mais de 3 bilhões de usuários ativos e o fluxo interminável de dados que vem disso, é uma admiração por que a Meta precisa confiar em tão enormes tesouros de dados externos para alimentar suas ferramentas de IA.

De qualquer forma, com a empresa enfrentada um desafio legal significativo nos EUA sobre o uso não autorizado de material protegido por direitos autorais para treinar seu modelo de lhama, a meta também foi Bata com outro desafio de direitos autoraisdesta vez na França, onde os editores franceses também lançaram ações legais para violação de direitos autorais.

Conforme relatado por Bloomberg:

““Os editores e autores franceses estão processando a meta por violação de direitos autorais, acusando a gigante da tecnologia de usar seus livros para treinar seu modelo generativo de inteligência artificial sem autorização. Sne, a Associação Comercial que representa os principais editores franceses, incluindo Hachette e Publicadojuntamente com o SGDL da Associação de Autores e o SNAC da Union Writers, apresentou uma queixa nesta semana em um tribunal de Paris dedicado à propriedade intelectual, informou o grupo em entrevista coletiva na quarta -feira. ”

Parece que, assim como o American Collective Procurando manter a Meta para explicar ilegalmente seus trabalhos, os editores franceses também descobriram o mesmo, que os modelos de IA da Meta são capazes de produzir réplicas altamente precisas do trabalho de seus autores, sinalizando provavelmente raspando e roubo de sua propriedade intelectual.

Que provavelmente decorre do mesmo impulso de desenvolvimento da IA ​​na empresa.

Segundo relatos, após a ascensão do Openai em 2022, o CEO da Meta, Mark Zuckerberg, estava desesperado para recuperar o atraso e construir um modelo rival de IA que garantiria que a Meta permanecesse o líder na corrida de IA.

Dentro disso, Zuckerberg aprovou o uso do que a Meta sabia ser o material protegido por direitos autorais para criar seu modelo de idioma.

Conforme relatado por The New York Times:

““A Meta não pôde corresponder ao ChatGPT, a menos que tenha mais dados. Alguns debateram pagar US $ 10 por livro pelos direitos de licenciamento completos para novos títulos. Eles discutiram a compra de Simon & Schuster, que publica autores como Stephen King, de acordo com as gravações. Eles também conversaram sobre como haviam resumido livros, ensaios e outros trabalhos da Internet sem permissão e discutiram mais, mesmo que isso significasse enfrentar ações judiciais. Um advogado alertou sobre as preocupações “éticas” em relação a tirar a propriedade intelectual dos artistas, mas foi recebido com silêncio, de acordo com as gravações. ”

Meta então teria integram material de origem ilegalmente de origem de direitos autorais, de plataformas de raspagem que sabia que estavam operando em violação da lei.

O problema, de acordo com o NYT, era que, apesar da meta ter tantos usuários de seus aplicativos, a maioria do conteúdo que eles produzem não é muito útil na construção de seu modelo de IA, porque as pessoas excluem postagens mais antigas, as pessoas geralmente não publicam conteúdo mais longo no aplicativo, o estilo de escrita não está alinhado com a natureza conversacional dos chatbots etc.

Como tal, para a Meta competir, precisava de novas fontes de dados e a encontrou em livros piratas. Que os editores agora detectaram por seus próprios meios.

O que pode ver meta enfrentar um desfile de ações judiciais em todo o mundo, especialmente se esses casos iniciais levarem a acordos de compensação para os autores impactados.

De fato, se o precedente legal puder ser estabelecido, você poderá apostar que todas as editoras do mundo cheirarão o dinheiro e estarão vasculhando qualquer informação que puder encontrar para farejar traços de seus próprios trabalhos.

O que poderia levar a grandes penalidades para a meta avançando.

Mas espere, como o OpenAI, uma start-up muito menor, sem acesso a bilhões de informações dos usuários, criará seu próprio banco de dados da mesma maneira sem os mesmos problemas de direitos autorais?

Bem, também é enfrentando vários desafios legais para o mesmo.

De fato, em todos esses casos, você pode esperar ver o OpenAI também sendo investigado pela mesma violação, pois autores e editores buscam recurso para uso não autorizado.

Os dados são a fonte de energia arterial de grandes modelos de linguagem, e a empresa com as melhores fontes de dados acabará vencendo, porque seu sistema produzirá resultados melhores, mais precisos e mais utilizáveis, com base no conjunto de referências. Sem essa fonte de dados inicial, os sistemas não têm nada a seguir, e é aparentemente por isso que Meta e Openai, e outros, estavam dispostos a correr riscos na construção de seus LLMs.

Ao mesmo tempo, uma vez construídos, eles existem e você pode treiná -los com dados suplementares a partir daí. Portanto, a Meta pode ter visto isso como um risco necessário na configuração, o que agora permitirá fazer mais uso de seu próprio trove de dados para refinar seus modelos.

Isso é semelhante ao modo como a XAI está se aproximando de seu LLM, construindo a fundação e depois usando x postagens para refinar e revisar o modelo para fornecer atualizações informativas em tempo real.

Como tal, embora isso possa acabar custando -lhes, pode valer a pena, compensado pelos benefícios que eles coletam de vender seus modelos.

De qualquer maneira, pode levar anos para os tribunais litigarem cada caso e, até então, pode haver uma nova abordagem legal para o treinamento de LLM e o uso de tais obras.

Você pode apostar que a Meta está explorando todos os ângulos nesta frente.

Fonte