Reddit processa a Perplexity por supostamente copiar conteúdo para alimentar IA

Reddit processa a Perplexity por suposta raspagem de dados para treinar IA; processo iniciou após carta de cessar e desistir enviada em maio de 2024, com a Perplexity supostamente ignorando o pedido e aumentando as citações do Reddit em sua plataforma.
A ação faz parte de estratégia do Reddit para proteger seus dados, considerados valiosos para treinamento de modelos de IA; Ben Lee, diretor jurídico da empresa, comparou raspadores a “ladrões de banco” e afirmou que a Perplexity seria cliente de uma dessas empresas que obtém conteúdo roubado.
A Perplexity disse não usar conteúdo do Reddit para treinar seus modelos e afirmou respeitar o robots.txt; o Reddit, porém, observou aumento significativo das citações do Reddit na plataforma.
A empresa conseguiu acessar rapidamente um post do Reddit configurado para rastreamento apenas pelo Google, levantando suspeitas sobre a legalidade das práticas.
A disputa ocorre após ações legais anteriores contra Anthropic e outras empresas, destacando pressão para que dados de usuários sejam obtidos de forma ética e legal para IA.

Reddit está processando a empresa Perplexity por supostamente raspar dados da plataforma para alimentar seus modelos de inteligência artificial. O processo, iniciado após o envio de uma carta de cessar e desistir em maio de 2024, destaca a crescente tensão entre plataformas de mídia social e empresas de tecnologia que dependem de dados públicos. O site alega que a Perplexity, uma das várias empresas acusadas de coleta indevida de dados, não apenas ignorou o pedido, mas também aumentou a utilização de citações do Reddit em sua plataforma.

A ação legal é parte de uma estratégia mais ampla do Reddit para proteger seus dados, considerados valiosos para o treinamento de modelos de IA. Em declarações, o diretor jurídico do Reddit, Ben Lee, comparou as empresas de raspagem de dados a “ladrões de banco”, afirmando que elas burlam proteções tecnológicas para roubar conteúdo. Lee enfatizou que a Perplexity é um cliente de pelo menos uma dessas empresas, optando por comprar dados roubados em vez de negociar diretamente com o Reddit.

Aumento das Citações e Resposta da Perplexity

Após a carta de cessar e desistir, a Perplexity afirmou que não utiliza conteúdo do Reddit para treinar seus modelos e que respeita o arquivo robots.txt da plataforma. No entanto, o Reddit observou um aumento significativo nas citações de seus conteúdos na Perplexity. Além disso, a empresa de tecnologia conseguiu acessar rapidamente um post do Reddit que foi configurado para ser rastreado apenas pelo Google, levantando suspeitas sobre a legalidade de suas práticas.

Reddit já havia tomado ações legais contra outras empresas de IA, como a Anthropic, por práticas semelhantes. O movimento atual reflete a pressão crescente sobre empresas de tecnologia para garantir que os dados utilizados em seus modelos sejam obtidos de maneira ética e legal. A disputa entre Reddit e Perplexity destaca a complexidade do acesso a dados na era da informação, onde o valor do conteúdo gerado por usuários se torna cada vez mais evidente.