Over de wielersport en zijn beoefenaars.

Het dopingtopic 2.0

Livio Livius
Forum-lid HC
Berichten: 5547
Lid geworden op: 06 sep 2006 15:10

Livio Livius 06 dec 2009 13:42

Gezien de (maatschappelijke) ophef en de consequentie voor topsporters lijkt 95% betrouwbaarheid m.i. te laag. Daarnaast, en Zorro haalt dit al deels aan, is er geen onderzoek gedaan naar welke data voor topsporters extreem zijn. Er wordt uitgegaan van een databestand en normale verdeling van "jan resptievelijk truus" modaal.

Daarnaast begrijp ik niet waarom ISU nu plotseling 95% betrouwbaarheid neemt i.t.t. gewone dopingtesten 99,9%.
What makes the boat go faster?

Gebruikersavatar
arepol
Forum-lid
Berichten: 1467
Lid geworden op: 17 jun 2008 14:07
Locatie: Eindhoven
Contact

Gebruikersavatar arepol 06 dec 2009 13:49

Maar in dit geval gaan ze toch niet uit van 1 positieve 'test'? Als ik me goed weet te herinneren uit eerdere stukken was bij Pechstein meerdere malen een te hoog percentage jonge bloedlichaampjes aangetroffen?

95% betrouwbaarheid geeft dus 1/20 (=5%) kans op een foutieve waarde.
De kans dat dan bijvoorbeeld op 20 tests 2x een meetfout plaatsvind is dan: (1/20)^2 * (19/20)^18 = 0,00099303 (oftewel 0,099% kans op een dubbele meetfout in 20 metingen)
3 meetfouten in 20 tests = (1/20)^3 * (19/20)^17 = 0,000052265 (oftewel 0,0052% kans op 3 meetfouten uit 20 tests.

Mits ze dus niet op een enkele (positieve) test afgaan, is er dus weinig mis met de betrouwbaarheid denk ik zo...

Livio Livius
Forum-lid HC
Berichten: 5547
Lid geworden op: 06 sep 2006 15:10

Livio Livius 06 dec 2009 14:06

Arepol schreef:Maar in dit geval gaan ze toch niet uit van 1 positieve 'test'? Als ik me goed weet te herinneren uit eerdere stukken was bij Pechstein meerdere malen een te hoog percentage jonge bloedlichaampjes aangetroffen?

95% betrouwbaarheid geeft dus 1/20 (=5%) kans op een foutieve waarde.
De kans dat dan bijvoorbeeld op 20 tests 2x een meetfout plaatsvind is dan: (1/20)^2 * (19/20)^18 = 0,00099303 (oftewel 0,099% kans op een dubbele meetfout in 20 metingen)
3 meetfouten in 20 tests = (1/20)^3 * (19/20)^17 = 0,000052265 (oftewel 0,0052% kans op 3 meetfouten uit 20 tests.

Mits ze dus niet op een enkele (positieve) test afgaan, is er dus weinig mis met de betrouwbaarheid denk ik zo...


Volgens kun je eea niet vermenigvuldigen maar dan moet ik 25 jaar terug en mijn statistiek ophalen :D.
Daarnaast zijn alle andere waarden normaal en ook niet alle reticulocyt waarden komen boven de norm uit bij Pechstein maar liggen wel aan de bovenkant van het gemiddelde.
Het draait ook meer om vals positief bij een 95% betrouwbaarheid. Een sporter zal over een periode van 5 jaar toch snel 100 tests doen en zal dus 5 keer valselijk veroordeeld kunnen worden.
What makes the boat go faster?

Gebruikersavatar
Zorro
Forum-lid HC
Berichten: 6746
Lid geworden op: 01 jan 2008 15:07
Locatie: Almere

Gebruikersavatar Zorro 06 dec 2009 15:04

Arepol schreef:Maar in dit geval gaan ze toch niet uit van 1 positieve 'test'? Als ik me goed weet te herinneren uit eerdere stukken was bij Pechstein meerdere malen een te hoog percentage jonge bloedlichaampjes aangetroffen?



Hoi,

Ook al gaan zie uit van meerdere tests dan nog is dat geen bewijs dat iemand daadwerkelijk:

1- Doping heeft gebruikt
2- Een waarde laat zien die 'hors category' is om maar in wielrentermen te spreken.

Even een ander voorbeeld om te laten zien wat ik bedoel.

Gemidelde lengte jongens 18 jaar geeft de volgende normale verdeling:

[img=http://www.wiskundebijles.nl/statistiek ... age001.png]

Als je hier een 95% betrouwbaarheidsinterval 'op los zou laten' dan heeft dit tot gevolg dat (en dat is per definitie) de laagste 2,5% (zeg voor het gemak even 155-159cm) en de hoogste (zeg even 185-189cm) significant afwijken van het gemiddelde en dus als 'uitzonderlijk' worden bestempeld hetgeen
niet inhoud dat dergelijke extremen in praktijk niet voorkomen. De kans is echter erg klein, 5%.


Bovenstaande is direct weer terug te koppelen naar hematocriet. Klein verschil natuurlijk aangezien je niet significant langer of kort wordt door het jaar heen (ofschoon je 's ochtends over het algemeen iets van 1cm langer bent en in de loop van de dag weer krimpt. Geen geintje :D maar dat terzijde).

Nog even wat aanvulling aangezien ik vond dat bovenstaande wellicht niet 100% duidelijk zou zijn.

Waarschijnlijk wordt zoals Livio Livius tevens aangeeft, de normale verdeling voor wat betreft hematocriet b.v. vastgesteld aan de hand van een zeer grote groep met daarin wellicht wat topsporters. Hieruit volgt dan het gemiddelde en, naar aanleiding van het betrouwbaarheidsinterval dat wordt gehanteerd, de range van wat geacht wordt aannemelijk te zijn. In mijn bovenstaand lengte voorbeeld zou die normale range dus 159cm to 185cm zijn. Niet dat mensen onder of boven die range doping zouden gebruiken natuurlijk :D. Puur om het statistische punt duidelijk proberen te maken.

Lijkt mij niet correct om een kleine groep (want dat is het vergeleken met het aantal niet topsorters in de samenleving) te toetsen op grond van verkregen data van 'Jan met de Pet of Truus van beneden) en op grond daarvan ook nog eens vonissen te vellen. Zeker niet met een 95% betrouwbaarheidsinterval. Toeval dat je dan een sporter ten onrechte veroordeeld is te groot.

Ik pleit niemand zoals Pantani en Pechstein echt vrij maar acht ze ook niet direct schuldig aangezien de methodes, validaties en de daaruit volgende maatregels e.d. niet juist zijn. Een snert onderzoek ik eigenlijk geen onderzoek.

Waarom die grens dan idd niet op 99% of oid leggen? Zoals als ik eerder zei denk ik dat men meer gelegen is om alle extremen uit een sport te weren dit ten koste van sporters die wel clean zijn maar wel in die extreme zones vallen.
Commercieel/BOBO belang.

Mvg, Zorro


Mvg, Zorro
We thought that we had the answers
It was the questions we had wrong
U2-11 O'Clock Tick Tock

pierre92
Forum-lid
Berichten: 577
Lid geworden op: 10 jan 2009 20:00

pierre92 06 dec 2009 16:29

Livio Livius schreef:
Arepol schreef:Maar in dit geval gaan ze toch niet uit van 1 positieve 'test'? Als ik me goed weet te herinneren uit eerdere stukken was bij Pechstein meerdere malen een te hoog percentage jonge bloedlichaampjes aangetroffen?

95% betrouwbaarheid geeft dus 1/20 (=5%) kans op een foutieve waarde.
De kans dat dan bijvoorbeeld op 20 tests 2x een meetfout plaatsvind is dan: (1/20)^2 * (19/20)^18 = 0,00099303 (oftewel 0,099% kans op een dubbele meetfout in 20 metingen)
3 meetfouten in 20 tests = (1/20)^3 * (19/20)^17 = 0,000052265 (oftewel 0,0052% kans op 3 meetfouten uit 20 tests.

Mits ze dus niet op een enkele (positieve) test afgaan, is er dus weinig mis met de betrouwbaarheid denk ik zo...


Volgens kun je eea niet vermenigvuldigen maar dan moet ik 25 jaar terug en mijn statistiek ophalen :D.
Daarnaast zijn alle andere waarden normaal en ook niet alle reticulocyt waarden komen boven de norm uit bij Pechstein maar liggen wel aan de bovenkant van het gemiddelde.
Het draait ook meer om vals positief bij een 95% betrouwbaarheid. Een sporter zal over een periode van 5 jaar toch snel 100 tests doen en zal dus 5 keer valselijk veroordeeld kunnen worden.


De juiste moet zijn:

20 boven 3 x 0,05^3 x 0,95^18 = rekenapparaat is leeg, misschien kan iemand het uitrekenen?

Je kunt die 3 fouten namelijk in 20 tests maken. Willekeurig.

Ongeacht bovenstaande. Pechstein heeft gepakt, dat lijkt mij duidelijk. In het wielrennen worden al enkele jaren renners geschorst op grond van het bloepaspoort, en er is niemand die eraan twijfelt dat die indicaties niet indicatief zijn. Kom op, wie was er vorig jaar opeens weer de goede schaatster? Claudia Pechstein, dit terwijl ze buiten beeld was geraakt. Daarbij is ze al ver in de 30 gevorderd, iets wat bij schaatsen ouder is dan wielrennen. En hoeveel wielrenners van 38 rijden nog de pannen van het dak?
fietsen, da\'s mijn verzetje!

eelcoz

eelcoz 06 dec 2009 16:47

95% betrouwbaarheid betekent toch gewoon dat de kans dat iemand die NIET gebruikt heeft WEL gepakt wordt, 5% is? Een zogenaamde Type-I error.

Of gebruikt men gewoon een empirische verdeling van hematocratiet-waarden en is vervolgens iedereen die in de hoogste 5% zit positief, en verwijst die 95% daar naar. Dat kan toch niet zomaar, lijkt me.

Of haal ik nu dingen door elkaar? Iemand?

Gebruikersavatar
Zorro
Forum-lid HC
Berichten: 6746
Lid geworden op: 01 jan 2008 15:07
Locatie: Almere

Gebruikersavatar Zorro 06 dec 2009 16:50

Hoi,

@Pierre92 Nee, nee, nee! We hebben het hier niet over een meetfout.

Een meetfout is de nauwkeurigheid van een bepaalde meting.

Dus de bepaalde waarde op een bepaald moment die je kunt bepalen. Dus iets van 55% Hematocriet +/- 1%. Dan is 1% de meetfout.

Neem b.v. Vermogensmeting. Je hebt een SRM/PowerTap oid met een nauwkeurigheid van +/- 1.5%. 1.5% is dan de meetfout. Stel dat over een grote groep wielrenners een bepaalde vermogensmeting is gedaan en dat het gemiddeld uitkwam op 275Watt over 20 minuten.

Gebruikmakende van een 95% betrouwbaarheidsinterval komt er dan b.v. een 2.5% uit welke gaat van b.v. 325-350Watt. In die 325-350Watt wijk je dus significant (95% betrouwbaarheid) af van het gemiddelde.

Stel jij reedt 340Watt. Meetfout was 1.5%=5.1Watt. Dus zelfs met de meetfout in acht genomen was je nog altijd verdacht als we het vertalen naar Hematocriet b.v.

Waar we het hier over hebben zijn waarden die zo ver van het (groeps) gemiddelde afwijken dat ze als 'excessief' worden aangemerkt. Iets heel anders.
In hoeverre je iets beschouwd als excessief hangt dan af van je betrouwbaarheidsinterval welke hier 95% was. Dat betrouwbaarheidsinterval is echter arbitrair en je kun je instellen op 95% maar ook op 99%.
Hoe hoger je het insteld, hoe minder je gaat zeggen dat bepaalde waarden die in praktijk wel voorkomen, buiten het toeval vallen en DUS op andere manieren verklaard dienen te worden.

Het essentiele probleem is hier dat die 'excessieve waarden 'DUS' lekker vrij vertaald worden naar dopinggebruik en DAT hoeft dus niet waar te zijn aangezien er ook andere oorzaken aan ten grondslag kunnen liggen.

Zoals met mijn eerder aangehaald lengte voorbeeld. Bij een 95% betrouwbaarheidsinterval zou je dus zeggen dat alles boven de 185cm geen toeval (natuurlijke spreiding) is en dus een andere verklaring moet hebben.
Zo ook met b.v. hematocriet waarden.

Omdat we dus niet alles op kunnen sporen gaan we maar voor indirecte indicatoren tevens gebruikmakend van invalide of niet geverifeerde aannames.

Het gaat me er hier niet om dopinggebruikers vrij te pleitten maar wel om de procedure aan de kaak te stellen waar eventueel renners die clean zijn WEL positief worden bevonden.

Schandalig hoe makkelijk dit alles zomaar goedgekeurd wordt.
We willen het wielrennen/schaatsen e.d. maar dope vrij krijgen en dus kan het gebeuren dat een niet gebruikende sporter 'positief' wordt bevonden terwijl hij/zij dat niet is. Schande!!


Mvg, Zorro
We thought that we had the answers
It was the questions we had wrong
U2-11 O'Clock Tick Tock

eelcoz

eelcoz 06 dec 2009 16:55

Dus in het geval van Pechstein is haar hematocriet-waarde een aantal keren in de hoogste 5% van de verdeling gevallen?

Gebruikersavatar
Zorro
Forum-lid HC
Berichten: 6746
Lid geworden op: 01 jan 2008 15:07
Locatie: Almere

Gebruikersavatar Zorro 06 dec 2009 17:06

Hoi,
eelcoz schreef: 95% betrouwbaarheid betekent toch gewoon dat de kans dat iemand die NIET gebruikt heeft WEL gepakt wordt, 5% is? Een zogenaamde Type-I error.


Onjuist. Je kunt wel degelijk in de bovenste regio zitten (2.5% trouwens) en NIET gebruikt hebben. De andere 2.5% zit aan de linker 'poot' van de kromme en is niet belangrijk hier aangezien ik nog nooit een renner positief heb horen testen vanwege een te LAGE hematocriet ;)
eelcoz schreef: Of gebruikt men gewoon een empirische verdeling van hematocratiet-waarden en is vervolgens iedereen die in de hoogste 5% zit positief, en verwijst die 95% daar naar. Dat kan toch niet zomaar, lijkt me.


Juist, als je bij de bovenste 2.5% zit dan wordt dit per definitie niet aan natuurlijke spreiding toegeschreven (de andere 2.5% zit aan de linker 'poot' van de kromme en is niet belangrijk hier aangezien ik nog nooit een renner positief heb horen testen vanwege een te LAGE hematocriet ;)
Oftewel. Zit je in die bovenste 2.5% dan is de onjuiste conclusie en resultaat dat je wel gebruikt moet hebben oid. Vandaar mijn kritiek.

Vandaar dat je het betrouwbaarheidsinterval zo hoog mogelijk zou moeten stellen indien mogelijk. Hangt o.a. van de omvang van je referentiegroep die gebruikt is om de normale verdeling vast te stellen.

Mvg, Zorro
We thought that we had the answers
It was the questions we had wrong
U2-11 O'Clock Tick Tock

Gebruikersavatar
Zorro
Forum-lid HC
Berichten: 6746
Lid geworden op: 01 jan 2008 15:07
Locatie: Almere

Gebruikersavatar Zorro 06 dec 2009 17:12

eelcoz schreef:Dus in het geval van Pechstein is haar hematocriet-waarde een aantal keren in de hoogste 5% van de verdeling gevallen?


2.5%. Ook waren er variaties die men twijfelachtig vond. Mij echter niet bekend wat die feitelijke variates waren. Tussen hoeveel en hoeveel? Ook die variaties kun je niet zomaar terug voeren op vermeend doping gebruik.
Wat zijn variaties in een vergelijkbare groep topsporters? Wellicht dat Pechstein dan niet significant andere waarden liet zien ten aanzien van fluctuaties.

Ja, ze zat wellicht soms in de bovenste 2.5% voor wat betreft absolute Hematocriet waarden oid maar dat is INDIRECT bewijs voor dopinggebruik.


Wat men nu doet is het ene met het andere vergelijken en dat kan niet!! Appels en Peren.

Zorro
We thought that we had the answers
It was the questions we had wrong
U2-11 O'Clock Tick Tock

eelcoz

eelcoz 06 dec 2009 19:18

ZorroI schreef:Hoi,
eelcoz schreef: 95% betrouwbaarheid betekent toch gewoon dat de kans dat iemand die NIET gebruikt heeft WEL gepakt wordt, 5% is? Een zogenaamde Type-I error.


Onjuist. Je kunt wel degelijk in de bovenste regio zitten (2.5% trouwens) en NIET gebruikt hebben. De andere 2.5% zit aan de linker 'poot' van de kromme en is niet belangrijk hier aangezien ik nog nooit een renner positief heb horen testen vanwege een te LAGE hematocriet ;)
Volgens mij bedoelen we hier hetzelfde en is mijn bewering in jouw ogen dus WEL juist.
ZorroI schreef:
eelcoz schreef: Of gebruikt men gewoon een empirische verdeling van hematocratiet-waarden en is vervolgens iedereen die in de hoogste 5% zit positief, en verwijst die 95% daar naar. Dat kan toch niet zomaar, lijkt me.


Juist, als je bij de bovenste 2.5% zit dan wordt dit per definitie niet aan natuurlijke spreiding toegeschreven (de andere 2.5% zit aan de linker 'poot' van de kromme en is niet belangrijk hier aangezien ik nog nooit een renner positief heb horen testen vanwege een te LAGE hematocriet ;)
Oftewel. Zit je in die bovenste 2.5% dan is de onjuiste conclusie en resultaat dat je wel gebruikt moet hebben oid. Vandaar mijn kritiek.

Vandaar dat je het betrouwbaarheidsinterval zo hoog mogelijk zou moeten stellen indien mogelijk. Hangt o.a. van de omvang van je referentiegroep die gebruikt is om de normale verdeling vast te stellen.

Mvg, Zorro


Dus als je in de bovenste 2.5% zit, kan dit per definitie niet aan natuurlijke spreiding toegeschreven worden en moet je wel gebruikt hebben.

Dat vind ik echt heel merkwaardig. Waar komt die verdeling vandaan? Van een vrij groot aantal mensen (evt. topsporters) waar de hematocrietwaarden van bekend zijn. Dus in die bovenste 2.5% zitten allemaal mensen met van nature hoge hematocrietwaarden (en eventueel een paar topsporters die wel degelijk gepakt hebben). Waarom zou dan in hemelsnaam het feit dat Pechstein zich in die 2.5% bevindt, betekenen dat ze gepakt heeft? Als anderen zulke waarden kunnen vertonen, waarom zou zij dat dan niet kunnen?

Gebruikersavatar
Zorro
Forum-lid HC
Berichten: 6746
Lid geworden op: 01 jan 2008 15:07
Locatie: Almere

Gebruikersavatar Zorro 06 dec 2009 20:47

eelcoz schreef:
Dus als je in de bovenste 2.5% zit, kan dit per definitie niet aan natuurlijke spreiding toegeschreven worden en moet je wel gebruikt hebben.


Hoi,

Dat is juist wat ik NIET verkondig.
Je kan ook in die bovenste 2.5% zitten (al eerder gezegd) ZONDER dat je doping hebt gebruikt. Feit van natuurlijke spreiding en het betrouwbaarheidsinterval dat wordt aangelegd.

Het is de CONCLUSIE/STRAF die aan die 2.5% wordt gehangen welke fout is.
Dat is mijn punt. Je KUNT binnen die 2.5% valllen ZONDER doping te hebben gebruikt en wel een soort van levenslang krijgen. Te grote kans imho om vals positief getest te worden.

Nu is het feit dat ALS je binnen je die 2.5% valt tijdens bloedtesten je per definitie wel gebruikt MOET hebben. Indirecte bewijsvoering.
Zie mijn vorige posts van vandaag.


Zorro
We thought that we had the answers
It was the questions we had wrong
U2-11 O'Clock Tick Tock

Plaats reactie