Blog   ·  

Wikipédia implementa medidas para evitar o plágio com iThenticate

Com o uso da ferramenta, aproximadamente 2,5 mil casos foram sinalizados para os editores, sendo que um pouco mais da metade deles foi considerado inapropriado pelos voluntários da Wikipédia.

Turnitin Staff

Subscrever

 

 

 

 

Ao preencher este formulário, está a concordar com a Política de Privacidade da Turnitin. A Turnitin utiliza as informações que fornece para entrar em contacto consigo com informações relevantes. Pode cancelar a subscrição destas comunicações em qualquer altura.

 

Resumo

A Wikipédia precisava de uma solução de alta escala para otimizar a detecção de plágio, que, anteriormente, requeria verificação manual em edições suspeitas.

  • A Wikipédia em inglês, que conta com mais de 5 milhões de artigos, agora submete edições que podem conter plágio (60 mil por mês), por meio do iThenticate;

  • O iThenticate tem ajudado a detectar 1,5 mil possíveis contribuições contendo plágio por mês;

  • Os editores voluntários estão agora aptos a trabalhar mais na expansão e aperfeiçoamento dos artigos da Wikipédia em vez de verificarem manualmente edições plagiadas.
Wikipédia em números
  1. 350 edições por minuto
  2. Mais de 4,7 milhões de edições por mês no site da Wikipédia em inglês
  3. Mais de 5 milhões de artigos
  4. O maior recurso de informação online criado de forma colaborativa
Desafio

Por volta de 2014, a Yahoo descontinuou uma Interface de Programação de Aplicativos (API) que permitia que editores voluntários da Wikipédia revisassem artigos recém-criados para detectar a presença de materiais copiados de outras fontes. Enquanto os editores voluntários da Wikipédia lidavam com centenas de possíveis casos de plágio, ao final de 2014, eles ainda suspeitavam de uma série de questões não detectadas e buscavam uma nova solução como oportunidade de reexaminar sua situação e metas.

Além de verificar edições potencialmente preocupantes para a Wikipédia em inglês, o Dr. James Heilman e o Dr. Eran Rosenthal queriam uma solução automatizada e extremamente rápida que pudesse ser escalonada para o volume de dados da Wikipédia, mais de 4,7 milhões de edições por mês somente no site da Wikipédia em inglês.

“Na Wikipédia, tentamos detectar problemas de plágio de forma adequada, rápida e eficiente, haja vista que o conteúdo é tão amplamente difundido pela Internet. Se olharmos para um material que está na plataforma há cinco anos, podemos encontrá-lo em livros, artigos de jornal e até mesmo em discursos governamentais porque muitas pessoas copiam e colam os textos de lá. Sendo assim, rapidez é obviamente importante”, diz o Dr. James Heilman, Voluntário, Administrador da Wikipédia em inglês e membro do Conselho da Fundação Wikimedia.

Resultados

Os resultados são mensuráveis e expressivos, com o iThenticate revisando 60 mil edições submetidas mensalmente por meio do sistema. De todas as contribuições analisadas, aproximadamente 2,5 mil casos com possível plágio foram sinalizados para os editores, sendo que um pouco mais da metade deles foi considerado inapropriado pelos voluntários da Wikipédia.

O Dr. James Heilman relata que “cada edição é examinada individualmente. Se o bloco de texto ultrapassar uma determinada extensão, os voluntários o enviam por meio da API da Turnitin para saber se ele já foi ou não publicado anteriormente. Isso funciona muito bem”.

Além disso, uma vez que o iThenticate faz um confronto com fontes offline, o Dr. Eran Rosenthal diz que “estamos nos saindo muito melhor na verificação de fontes offline, revistas, fontes fechadas ou buscas de propósito geral em livros também”.

O maior benefício é que a reutilização da Wikipédia é garantida, como afirma o Dr. Heilman:

“A nossa colaboração com a Turnitin e o iThenticate significa que as pessoas que estão reutilizando a Wikipédia em outros projetos podem fazê-lo com mais conforto e menos preocupação de virem a se deparar com problemas de plágio mais adiante”.

Embora a integridade de conteúdo ainda seja uma prioridade permanente, o Dr. Heilman diz que “a comunidade tem despendido muito menos esforço para detectar plágio, o que significa que os voluntários podem focar em outras coisas”. “Menos tempo lidando com plágio”, continua ele, “permite que os voluntários da Wikipédia possam focar na expansão e no aperfeiçoamento do conteúdo do site – como aprofundar o conteúdo de artigos, cobertura em outros idiomas, além de adicionar conteúdo multimídia”.

Nas palavras do Dr. Heilman:

“A nossa colaboração com a Turnitin e o iThenticate significa que as pessoas que estão reutilizando a Wikipédia em outros projetos podem fazê-lo com mais conforto e menos preocupação de virem a se deparar com problemas de plágio mais adiante”.