Schaken in de eenentwintigste eeuw

SV Eindhoven in de eenentwintigste eeuw in cijfers

We leven in een tijd waarin alles digitaal wordt. Eén aspect  van de digitalisering is dat een hoop informatie beschikbaar komt voor een grote groep mensen. Onze schaakclub is al jarenlang voornemens om haar archief te digitaliseren. Hierdoor zullen alle leden toegang krijgen tot oude nummers van de Raadsheer en alle notulen van bestuursvergaderingen en ALV’s. De KNSB is al een paar jaar geleden begonnen haar ledenbestand te digitaliseren. OLA heet dit: Online Leden Administratie. Clubs moeten nu ledenmutaties via OLA invoeren. Als toegift is het hele clubledenbestand plus de mutaties uit het nabije verleden te downloaden. De KNSB heeft het zelfs verfraaid door ledenmutaties uit de laatste jaren voor het bestaan van OLA hieraan toe te voegen. Zelf ben ik, behalve gek op schaken, ook gek op cijfers. Ik kan het dan ook niet nalaten uit deze bestanden allerlei statistieken te halen.

Het eerste bestand dat ik bekeek was het huidige ledenbestand van de SV Eindhoven. Dit bestand bevat gegevens zoals woonplaats, geboortejaar, rating, geslacht, bondsnummer en nog veel meer. Een simpele vraag die we kunnen stellen  is: waar wonen onze leden. Onderstaand histogram geeft daar een antwoord op.

woonplaats

(U kunt het plaatje vergroten door erop te klikken.)

Zoals verwacht wonen onze meeste leden in Eindhoven, gevolgd door Best, Waalre en Heeze. Niet zo spectaculair natuurlijk. De volgende vraag is: wat is de leeftijdsopbouw van onze club. Het bestand bevat geen geboortedatum alleen een geboortejaar. De leeftijd kunnen we hieruit schatten door dit jaar af te trekken van 2017 accepterend dat we voor ongeveer de helft van de leden er een jaar naast zitten. Dit levert het volgende histogram op:

leeftijdopbouw

Onder de twaalf is er een grote piek van onze jeugdleden. De leeftijd tussen de 34 en 58 is ook goed vertegenwoordigd met een uitschieter van late vijftigers. Verder is alles vlak tot de 86. Deze grafiek zou ik graag willen vergelijken met de landelijke leeftijdsverdeling van schakers. Op de ratingsite van de KNSB staan bestanden met ratingen van al haar leden. Behalve rating bevatten deze bestanden ook de geboortejaren van de leden. Van 1 mei 2017 zijn er twee bestanden: een algemene en een bestand met jeugdleden. Deze bestanden kunnen we samenvoegen en de dubbele leden (sommige jeugdleden komen ook in het algemene bestand voor) weghalen. Dit leidt tot de volgende verdeling:

leeftijdsopbouwKNSB_2017

We zien weer een oververtegenwoordiging van jeugdleden, alleen bij de KNSB loopt die tot iets hogere leeftijd door. Onze club mist de jeugdleden van 12 tot en met 18 jaar. Er is ook een piek bij de eind twintigers en een forse piek bij vijftig begin zestig. De piek van de twintigers ontbreekt bij onze club, de piek van de vijftigers ligt bij SV Eindhoven iets eerder.

Wat ik mij afvraag is of die pieken altijd bij deze leeftijden liggen of dat dit toevallig goede schaakgeneraties zijn. Op de ratingsite van de KNSB staan ook nog bestanden van vorige jaren. De oudste is van 1 mei 2008. Helaas zijn er van oudere jaren geen bestanden met jeugdleden. Kijken we naar het bestand uit 2008 dan krijgen we de volgende verdeling:

leeftijdsopbouwKNSB_2008

Natuurlijk missen we hierin de jeugdpilaar. Verder zien we dat beide pieken acht jaren naar links zijn verschoven. Het zijn dus bepaalde generaties waarbij schaken populair is. De piek van vijftigers en zestigers kan ik begrijpen, dat zijn de mensen die zijn gaan schaken ten tijde van de match Fischer-Spassky in 1972. Daar hoor ik zelf ook bij. Zou de piek van twintigers misschien geinspireerd zijn door de WK match van Timman?

De volgende vraag die we uit het ledenbestand kunnen halen is of er een verband is tussen leeftijd en rating. Omdat de rating bij de jeugd nogal anders is dan de rating bij de senioren zullen we jeugd en senioren apart nemen. Als we de rating tegen leeftijd uitzetten van de leden van onze club krijgen we de volgende plot:

rating_leeftijd_senior

De rode lijn is de schatting van de gemiddelde rating per leeftijd voor de hele populatie van schakers als je SV Eindhoven als steekproef neemt. De rode band is het betrouwbaarheidsinterval van dit gemiddelde. We zien dat het gemiddelde vrij vlak is. Tot 40 loopt het licht op, van 40 tot 60 zit er een daling, en daarna is het weer vlak. Hoe zou dit landelijk zijn? Voor die vraag kunnen we weer terecht bij het ratingbestand van de KNSB. Dit bestand geeft de volgende plot:

rating_leeftijd_KNSB_2017

Dit laat een duidelijke toename zien tot 50 en daarna een gestage afname. Deze afname zien we in veel mindere mate bij onze schaakclub. Blijkbaar doen de krasse knarren van SV Eindhoven het bovengemiddeld goed. Sowieso is de gemiddelde rating van onze schaakclub vrij hoog. Een interessante vraag is of de piek altijd bij 50 heeft gelegen of heeft de generatie die heeft leren schaken door de match Fischer-Spassky het gewoon beter geleerd? Hiervoor kunnen we weer kijken naar het ratingbestand uit 2008:

rating_leeftijd_KNSB_2008

We zien dat de piek naar links is verschoven. De Fischer-Spassky generatie is gewoon sterker. Hoe zit het bij de jeugdleden? Laten we eerst een kijken naar de landelijke trend:

rating_leeftijd_KNSB_jeugd_2017

Bij de jeugd is er een sterke toename in rating bij het ouder worden. Dat is ook wat je mag verwachten. Merk op dat door onze manier van leeftijd bepalen (huidig jaar minus geboortejaar) er alleen maar gehele jaren in de plot voorkomen. Hoe ziet de plot er bij onze jeugdleden uit?

rating_leeftijd_jeugd

Eenzelfde toename, alleen een veel steilere lijn. Dat is ook wat je mag verwachten bij een club die zoveel Nederlands kampioenen voortbrengt.

Door gebruik te maken van het bestand met ledenmutaties kunnen we precies achterhalen wie wanneer lid was van onze schaakclub. Ik heb dit gedaan vanaf het jaar 2000. De volgende grafiek geeft het ledenaantal van onze club over de tijd weer. In 2017 ben ik uitgegaan van het ledenbestand per 1 mei, in voorgaande jaren per 1 augustus.

aantalleden

In 2002 en 2003 was er een sterke daling van het aantal leden. Ik heb wel eens wat over die periode gehoord. Maar vanaf 2008 neemt het aantal leden weer gestaag toe. Splitsen we deze leden uit op geslacht dan zien we dat er tot 2012 sporadisch een vrouw lid was, maar vanaf 2012 neemt het aantal vrouwen sterk toe.

 

aantalleden_geslacht

De meeste leden zullen dit raar vinden omdat ze sinds het vertrek van Erika geen vrouw meer hebben gezien op onze club. Een uitdeling van de leeftijdsverdeling naar geslacht maakt veel duidelijk:

leeftijd_geslacht

Dit type plaatje heet in het Engels “violin plot”. Het geeft voor verschillende categorieën een verdeling weer. Het zijn eigenlijk twee histogrammen die 90 graden gedraaid zijn, verdubbeld met hun spiegelbeeld en waar een “smooth” lijntje de toppen van de balkjes aangeeft. Uit deze violin plot zien we dat we de vrouwen alleen  aantreffen bij leden onder de veertien. Daarboven haken ze af. De volgende grafiek geeft aan wat het aandeel van de jeugd is over de jaren heen van het aantal leden.

aantalleden_cat

Dit plaatje leert ons dat er vanaf 2008 maar een geringe toename is van het aantal seniorleden en dat de sterke ledentoename vooral wordt veroorzaakt door de jeugdleden. Lezers die van extrapoleren houden zullen verwachten dat onze club binnen weinig jaren een jeugdclub zal worden. Hoe gaat het met de gemiddelde leeftijd van de leden van onze club? Natuurlijk moeten we dit uitsplitsen naar seniorleden en jeugdleden. En eigenlijk is het beter om niet naar de gemiddelde leeftijd te kijken, maar naar de mediaan van de leeftijd. Dat is de leeftijd van diegene die als je alle leden ordent op leeftijd precies middenin staat. De volgende twee grafieken geven ze beiden:

middelsteleeftijd

gemiddeldeleeftijd

De mediaan van de leeftijd laat een lichte steiging van de leeftijd van de seniorleden zien. De leeftijdsopbouw over de jaren kunnen we het beste illustreren met een violin plot:

leeftijdvanaf2000

Tot slot kunnen we ons nog afvragen of onze club de laatste jaren sterker of zwakker is geworden. Hiervoor moeten we gebruikmaken van de ratingbestanden van de afgelopen jaren. Zoals eerder vermeld gaat dit terug tot 2008. Als we alle bestanden aan elkaar koppelen dan krijgen we de volgende grafiek:

gemiddelderating

We zien dat zowel de gemiddelde rating van onze club, als het gemiddelde van de tien hoogste ratinghouders  en het gemiddelde van de tien laagste ratinghouders vrij constant blijft over de jaren.

–Frits Schalij

Zie ook deel twee

 

2 gedachten over “Schaken in de eenentwintigste eeuw

  1. Heel interessant verhaal! Ook duidelijk dat het jeugdschaak essentieel is voor het voortbestaan van de vereniging! En bij de jeugd zitten veel meisjes, hopelijk kunnen die later doorstromen naar de senioren zodat het gemis aan dames gecompenseerd gaat worden 🙂

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *