Uma nova pesquisa revelou que o modelo de inteligência artificial Llama, da Meta, demonstrou uma capacidade surpreendente de reproduzir trechos textuais do primeiro livro da série Harry Potter. O estudo, conduzido por pesquisadores de Stanford, Cornell e West Virginia University, analisou diversos livros do conjunto de dados Books3, conhecido por conter obras pirateadas utilizadas para treinar modelos de IA, incluindo o Llama.
Os resultados indicam que o Llama 3.1 conseguiu memorizar cerca de 42% do livro Harry Potter e a Pedra Filosofal, sendo capaz de reproduzir trechos verbatim em pelo menos 50% das tentativas. Em geral, o modelo conseguiu reproduzir trechos de 91% do livro, embora com menor consistência. Essa capacidade de memorização levanta questões importantes sobre o uso de material protegido por direitos autorais no treinamento de IAs e as possíveis implicações legais para empresas como a Meta.
Embora os resultados sejam notáveis, os pesquisadores também destacaram que a memorização varia significativamente entre diferentes modelos de IA e entre diferentes livros. Por exemplo, o Llama 3.1 demonstrou uma capacidade muito menor de memorizar outras obras presentes no conjunto de dados Books3. A pesquisa sugere que a popularidade e a ampla disponibilidade de um livro, como Harry Potter, podem influenciar a probabilidade de um modelo de IA o memorizar. Este estudo contribui para o debate em andamento sobre os limites do uso justo (fair use) em relação ao material protegido por direitos autorais utilizado para treinar inteligências artificiais.
Origem: Link