A Perplexity, uma empresa de tecnologia que oferece serviços de busca impulsionados por inteligência artificial, está no centro de uma nova polêmica. De acordo com um relatório da Cloudflare, a empresa estaria utilizando métodos questionáveis para coletar dados de websites, burlando restrições estabelecidas por proprietários de conteúdo.
O principal ponto da acusação reside no uso de ‘web crawlers’ (robôs de indexação) que, supostamente, estariam se disfarçando para acessar sites que explicitamente proíbem a coleta de seus dados. Essa proibição é comumente implementada através de arquivos ‘robots.txt’, um padrão da web que indica aos rastreadores quais áreas de um site podem ou não ser acessadas. A Cloudflare alega que a Perplexity estaria utilizando um navegador genérico, se passando pelo Google Chrome em sistemas macOS, para contornar essas restrições. Além disso, a empresa estaria rotacionando endereços IP e ASNs (Autonomous System Numbers) não listados em sua faixa oficial para evitar firewalls.
Essa não é a primeira vez que a Perplexity enfrenta acusações semelhantes. Em 2024, diversos sites relataram que a empresa continuava acessando seu conteúdo, mesmo após terem sido bloqueados no arquivo robots.txt. Na época, a Perplexity atribuiu o problema a crawlers de terceiros que estavam sendo utilizados. Posteriormente, a empresa estabeleceu parcerias com alguns veículos de comunicação, compartilhando a receita de anúncios exibidos juntamente com o conteúdo desses parceiros, em uma tentativa de compensar o ocorrido. A Cloudflare já removeu os bots da Perplexity de sua lista de bots verificados e implementou um sistema para identificar e bloquear o rastreador furtivo, visando proteger o conteúdo de seus clientes.
Origem: Link