O site NiemanLab publicou matéria na quarta-feira (20/3) sobre uma nova estratégia legal para editores digitais que processam OpenAI, referindo-se ao Raw Story, AlterNet e The Intercept, as primeiras publicações menores a enfrentar o gigante da IA por violações de direitos autorais. Assinada por Andrew Deck, a reportagem revela que dois processos judiciais contra a OpenAI estão traçando um novo caminho para litígios de direitos autorais contra desenvolvedores de IA – um deles adaptado a veículos que publicam apenas na Internet.
Em 28 de fevereiro, o The Intercept, assim como os sites de notícias progressistas Raw Story e AlterNet, entraram com ações judiciais alegando que a OpenAI usou suas histórias para treinar o ChatGPT sem permissão ou compensação. Todas as três publicações são representadas pelo mesmo escritório de advocacia de direitos civis, Loevy & Loevy.
Esses novos processos ocorrem apenas dois meses depois que o The New York Times abriu um caso histórico no Tribunal Distrital Federal dos EUA. O Times foi a primeira grande empresa de mídia americana a processar a OpenAI por infringir seus direitos autorais no treinamento dos lucrativos modelos de linguagem grande (LLMs) do GPTZ.
Em vez de confiar em alegações padrão de violação de direitos autorais, como faz o caso do Times, os advogados da Loevy & Loevy se concentraram na suposta violação da OpenAI de uma lei de 1998 chamada Lei de Direitos Autorais do Milênio Digital , ou DMCA.
Romancistas, jornalistas e outros autores alegaram que a OpenAI, ao recolher texto de diferentes cantos da Internet, incorporou os seus trabalhos protegidos por direitos de autor nos seus conjuntos de dados de formação. Algumas das provas estão nos próprios resultados do ChatGPT.
Para processar diretamente a OpenAI por violação de direitos autorais, os editores devem manter um registro das obras violadas no US Copyright Office. Os jornais físicos podem pagar uma taxa, uma vez por mês, para registrar tudo o que esteve em seus jornais naquele mês. Por essa razão, o Times pode pagar o que for necessário para cobrir uma grande parte do seu jornalismo publicado.
As publicações apenas digitais, no entanto, precisam registrar registros eletrônicos para cada artigo ou trabalho individual em seu site. Um registro eletrônico padrão no US Copyright Office custa US$ 65 . Registrar todos os artigos em um site de notícias prolífico como o The Intercept poderia rapidamente chegar a dezenas de milhares de dólares, ou até mais.
Em Janeiro, o Gabinete de Direitos de Autor dos EUA anunciou que iria considerar um novo tipo de registo para “ sites de notícias frequentemente actualizados ”. Se aprovado, permitiria que publicações apenas digitais, pela primeira vez, pagassem pelos arquivamentos em massa. Mas, por enquanto, publicações pequenas e sem fins lucrativos como The Intercept ainda enfrentam taxas exorbitantes para reivindicar legalmente violação de direitos autorais por parte de desenvolvedores de IA.
O DMCA, no entanto, oferece outra forma de entrar nos tribunais. A lei foi originalmente escrita para minimizar as violações de direitos autorais durante o surgimento da Internet. Um dos seus princípios é que é ilegal remover informações relacionadas com direitos de autor de uma obra online, incluindo o nome do autor, o título da obra e quaisquer avisos de direitos de autor ou termos de utilização.
Embora o processo do Times inclua algumas violações do DMCA entre suas muitas alegações, esses novos processos estão centrados exclusivamente na alegação de que a OpenAI retirou artigos online do The Intercept, Raw Story e AlterNet de suas informações relacionadas a direitos autorais. Em particular, os processos alegam que a OpenAI removeu itens como nomes de autores e termos de uso ao adicionar os artigos aos seus conjuntos de dados de treinamento. Loevy & Loevy contratou cientistas de dados externos e especialistas em IA para ajudar a verificar esta afirmação, de acordo com o Topic.
The Intercept, Raw Story e AlterNet podem ter evitado esta questão ao procurar representação da Loevy & Loevy, um escritório de advocacia de direitos civis com um extenso histórico de vitórias em casos de brutalidade policial e condenações injustas. A Topic, em particular, criou uma prática que representa redações menores em casos FOIA estaduais e federais. Embora ele tenha se recusado a comentar sobre acordos específicos nos processos judiciais da OpenAI, ele confirmou que muitos de seus clientes não podem pagar antecipadamente por representação legal.
Todos os três demandantes, no entanto, dizem que seu litígio envolve mais do que apenas recuperar danos. “Penso que as editoras mais pequenas serão deixadas para trás se não reivindicarem os seus direitos ao seu jornalismo, ou pior, serão simplesmente destruídas”, disse Byrne, fundador e CEO da Raw Story. “Eles não vão se sentar à mesa.”
Grandes empresas de notícias, incluindo The Associated Press e Axel Springer, assinaram acordos de licenciamento plurianuais e multimilionários com a OpenAI para usar suas histórias para treinar modelos de IA. Mas muitas organizações noticiosas mais pequenas, que também estão a sentir a pressão da ascensão da IA generativa, não foram abordadas ou não lhes foram oferecidos contratos competitivos semelhantes.
De acordo com Bralow, o The Intercept está mais do que aberto a tais acordos de licenciamento com desenvolvedores de IA, desde que seja compensado de forma justa por seu trabalho. Na verdade, ele argumenta que é importante que meios de comunicação diversificados e progressistas sejam incluídos nesses modelos.
Esta preocupação de toda a indústria em torno das violações de direitos de autor está a emergir à medida que os modelos de negócio do jornalismo independente e sem fins lucrativos continuam a deteriorar-se. Só em fevereiro, o The Intercept demitiu 15 funcionários, quase metade de sua equipe editorial. As saídas incluíram o editor-chefe Roger Hodge.
“[O processo] não é simplesmente moral, é para a sustentabilidade final destas organizações de notícias e destas vozes únicas”, disse Barlow. “O princípio de poder receber conteúdo sem compensação é extremamente importante para nós – assim como a nossa capacidade de sobrevivência. Eles andam de mãos dadas.”