Artsenkrant

"Beschermt het drinken van halfvolle melk tegen depressie?"

Tsunami waardeloze artikels op basis van gezondheidsdata

Data uit open access gezondheidsdatabanken worden steeds vaker gebruikt om wetenschappelijke artikelen van lage kwaliteit te genereren, zeggen onderzoekers. Ze vermoeden dat hierbij generatieve A.I. wordt ingezet.

ChatGPT systeemprompt
Generatieve A.I. wordt massaal ingezet om wetenschappelijke artikels te produceren. Foto: Nik/Unsplash

De studie, die als preprint op medRxiv werd gepubliceerd, signaleert een forse toename van studies gebaseerd op data uit 34 open access databanken met gezondheidsdata, waaronder de Britse UK Biobank en het Adverse Event Reporting System (FAERS) van de Amerikaanse Food and Drug Administration.

Tussen 2021 en 2024 steeg het aantal gepubliceerde artikels dat gebruikmaakte van gezondheidsdata uit deze databanken van ongeveer 4.000 naar 11.500. Het aantal artikels afkomstig uit China groeide in deze periode met een factor 9,5.

Homogene titels

De titels van artikels worden ook homogener, stelden de onderzoekers vast. De term ‘Mendeliaanse randomisatie’ - een techniek die helpt bepalen of een specifieke risicofactor een ziekte veroorzaakt - duikt 25% vaker op, de term ‘associatie’ wordt dubbel zo vaak in titels gebruikt.

Eén artikel onderzocht via Mendeliaanse randomisatie of het drinken van halfvolle melk beschermt tegen depressie.

De onderzoekers ontdekten ook dubieuze artikels, die complexe gezondheidsproblemen aan één variabele uit de gezondheidsdata koppelen. Een artikel onderzocht via Mendeliaanse randomisatie of het drinken van halfvolle melk beschermt tegen depressie. Een ander artikel onderzocht de correlatie tussen opleidingsniveau en de kans op een hernia na een operatie.

De auteurs van de studie waarschuwen dat een groot aantal van deze artikelen “waarschijnlijk van lage kwaliteit” zijn.

Meer regulering

Ze concluderen dat de ongereguleerde open access tot deze databanken een uitnodiging is om generatieve A.I. - de bekende 'large language models' zoals ChatGPT - massaal artikels te laten produceren. Ze pleiten voor meer toezicht op het gebruik van gezondheidsdata, bijvoorbeeld via preregistratie van onderzoeksprotocollen, zoals al gebruikelijk in genomica, maar met respect voor de open access filosofie.

Dat deze artikels gepubliceerd geraken in wetenschappelijke tijdschriften is een andere bron van ongerustheid - niet alleen omdat wetenschappers of het publiek de conclusies zouden overnemen, maar ook omdat veel GenAI-modellen worden getraind op wetenschappelijke literatuur. Als de input voor dat leren vervuild geraakt door waardeloze of misleidende artikels, zullen deze modellen slechte wetenschap leren en reproduceren.

Krijg GRATIS toegang tot het artikel
of
Proef ons gratis!Word één maand gratis premium partner en ontdek alle unieke voordelen die wij u te bieden hebben.
  • checkwekelijkse newsletter met nieuws uit uw vakbranche
  • checkdigitale toegang tot 35 vakbladen en financiële sectoroverzichten
  • checkuw bedrijfsnieuws op een selectie van vakwebsites
  • checkmaximale zichtbaarheid voor uw bedrijf
Heeft u al een abonnement? 
Geschreven door Erik Derycke17 juli 2025

Meer weten over

Print Magazine

Recente Editie

Nu lezen

Ontdek de nieuwste editie van ons magazine, boordevol inspirerende artikelen, diepgaande inzichten en prachtige visuals. Laat je meenemen op een reis door de meest actuele onderwerpen en verhalen die je niet wilt missen.

In dit magazine
Cookies

Artsenkrant maakt gebruik van cookies om uw gebruikservaring te optimaliseren en te personaliseren. Door gebruik te maken van deze website gaat u akkoord met het privacy- en cookiebeleid.