Pesquisadores que analisaram um grande conjunto de literatura científica identificaram padrões que levantam suspeitas sobre a origem de centenas de milhares de artigos relacionados ao câncer. Segundo a apuração inicial, cerca de 261 mil textos publicados entre 1999 e 2024 exibem características compatíveis com publicações produzidas por fábricas de artigos, conhecidas como paper mills.
O número — elevado e inquietante — exige checagens adicionais. Segundo análise da redação do Noticioso360, os sinais identificados incluem similaridade estrutural entre textos, recorrência de nomes de autores em padrões pouco plausíveis e descrições metodológicas genéricas que dificultam a replicação dos estudos.
Como foi o levantamento
A investigação se baseou em um modelo de classificação aplicado a um banco de dados de aproximadamente 2,6 milhões de textos científicos. O algoritmo reportou 261 mil artigos com características semelhantes às de publicações associadas a paper mills. A apuração do Noticioso360 cruzou as informações com reportagens da Reuters e da BBC Brasil para contextualizar a dimensão do problema.
Os responsáveis pelo estudo afirmam ter usado uma combinação de sinais textuais, metadados e padrões de autoria para identificar anomalias. Ainda assim, há perguntas essenciais em aberto: é necessário disponibilizar o dataset, detalhar as features usadas pelo modelo e apresentar a estimativa de falso-positivos para que a comunidade possa avaliar a robustez das conclusões.
Sinais de alerta encontrados
Entre os padrões reunidos pelos pesquisadores estão:
- Estrutura textual repetitiva e seções com frases padronizadas;
- Padrões incomuns de autoria, como a recorrência de combinações de nomes em vários artigos;
- Descrições metodológicas vagas que impedem a reprodução dos experimentos;
- Casos documentados de duplicação, manipulação de imagens e inconsistências nos dados apresentados.
Quando isolados, esses sinais não provam fraude. Porém, avaliados em conjunto, elevam a probabilidade de procedência indevida. Revisões independentes e retratações formais ainda são necessárias para confirmar caso a caso.
Limites e verificações pendentes
O principal desafio para mensurar o problema é a transparência metodológica. Sem acesso público ao conjunto de 2,6 milhões de textos e ao código do modelo, é difícil estimar a taxa de falso-positivos ou entender quais atributos pesaram mais na classificação.
Também é preciso mapear a distribuição temporal, geográfica e editorial desses 261 mil artigos: quais periódicos concentram os textos suspeitos, quais áreas dentro da pesquisa oncológica são mais afetadas e se há concentração por instituições ou países.
Refinamento e responsabilidade editorial
Editoras científicas, revisores e financiadores têm papel central. Além de revisar políticas de revisão por pares, periódicos devem adotar checagens sistemáticas de integridade de figuras, dados e autoria. A recomendação imediata é permitir auditorias independentes do dataset e priorizar a revisão e possível retratação de trabalhos com evidências fortes de manipulação.
Para pesquisadores e instituições, a prioridade deve ser a transparência: disponibilizar dados brutos, protocolos experimentais e, quando aplicável, códigos de análise. Isso torna mais difícil a circulação de material de origem duvidosa e facilita correções quando necessário.
Impacto na saúde pública
Pesquisas sobre câncer orientam políticas, diretrizes clínicas e decisões médicas. A presença de conteúdo possivelmente fraudulento em grande escala compromete a confiança no conhecimento acumulado e pode impactar pacientes direta ou indiretamente.
Além disso, a detecção tardia de estudos com problemas reduz a eficácia de políticas baseadas em evidências e pode gerar desperdício de recursos em linhas de pesquisa orientadas por achados inválidos.
O que vem a seguir
O número divulgado serve como sinal de alerta. Próximos passos recomendados incluem:
- Publicação dos critérios e do código do modelo de classificação;
- Disponibilização do dataset para auditoria independente;
- Priorizar revisões e retratações de artigos com evidências documentadas de fraude;
- Fortalecer os processos de revisão por pares e checagem de integridade em periódicos.
Enquanto essas medidas não forem adotadas em larga escala, a comunidade científica permanecerá vulnerável à infiltração de material produzido por paper mills.
Conteúdo verificado e editado pela Redação do Noticioso360, com base em fontes jornalísticas verificadas.
Fontes
Analistas apontam que a detecção de um grande volume de material potencialmente fraudulento pode redefinir práticas editoriais e acelerar mecanismos de auditoria na pesquisa biomédica.
Veja mais
- Padilha busca acordos com indústrias indianas para reduzir custos e transferir tecnologia a laboratórios brasileiros.
- Paciente da capital contraiu mpox fora do estado; SMS orienta medidas de prevenção à população.
- Dor no peito ou palpitações ao se exercitar podem indicar isquemia ou arritmia; saiba quando buscar ajuda.



