Statistische dataverwerking (B-KUL-I0N48B)

Doelstellingen
De student leert basistechnieken aan voor het analyseren van observationele en experimentele data, met klemtoon op lineaire regressiemethoden, logistieke regressiemethoden en variantie-analyse.
Begintermen
Interesse voor statistische problematiek
Beginvoorwaarden: Toegepaste statistiek en biometrie of gelijkaardig
Volgtijdelijkheidsvoorwaarden
Je moet voldoen aan een volgtijdelijkheidsvoorwaarde om dit opleidingsonderdeel te mogen opnemen. Volgtijdelijkheid kan STRENG of SOEPEL zijn of een GELIJKTIJDIGHEID inhouden. Ook kan een diplomaNIVEAU als voorwaarde gesteld zijn.
Verklaring:
STRENG: Om dit opleidingsonderdeel op te nemen, moet je geslaagd zijn voor of een tolerantie ingezet hebben voor de opleidingsonderdelen waarvoor dit soort voorwaarde geldt.
SOEPEL: Om dit opleidingsonderdeel op te nemen, moet je de opleidingsonderdelen waarvoor dit soort voorwaarde geldt, gevolgd hebben.
GELIJKTIJDIG: Om dit opleidingsonderdeel op te nemen, moet je ook de opleidingsonderdelen waarvoor dit soort voorwaarde geldt, opnemen of al opgenomen hebben.
NIVEAU: Om dit opleidingsonderdeel op te nemen, moet je ten minste deze graad behaald hebben.
SOEPEL(X0A14B) OF SOEPEL(X0E44A) OF SOEPEL(I0V68A)
Bovenstaande codes van opleidingsonderdelen stemmen overeen met onderstaande omschrijvingen van die opleidingsonderdelen:
X0A14B : Statistiek
X0E44A : Kansrekenen en statistiek
I0V68A : Inleiding tot de bio-statistiek
Dit opleidingsonderdeel is een voorwaarde voor het opnemen van volgende opleidingsonderdelen:
I0N57C : Statistische proefopzet
Identieke opleidingsonderdelen
Dit opleidingsonderdeel is identiek aan de volgende opleidingsonderdelen:
I0N48A : Statistische dataverwerking (Niet meer aangeboden dit academiejaar)
X0C87A : Statistische modellen en data-analyse
X0F67A : Statistische dataverwerking voor biowetenschappen
Plaats in het onderwijsaanbod
- Bachelor in de bio-ingenieurswetenschappen (programma voor studenten gestart vóór 2021-2022) (Leuven) 180 sp.
- Master in de statistiek (Leuven) 120 sp.
- Master in de bio-informatica (Leuven) 120 sp.
- Educatieve master in de wetenschappen en technologie (Leuven) 120 sp.
- Bachelor in de bio-ingenieurswetenschappen (verkort programma) (Leuven) 60 sp.
- Bachelor in de bio-ingenieurswetenschappen (programma voor studenten gestart in 2021-2022 of later) (Leuven) 180 sp.
- Master in de industriële wetenschappen: elektromechanica (programma voor studenten gestart in 2023-2024 of later) (Leuven) (Focus education) 60 sp.
- Master in de industriële wetenschappen: elektromechanica (programma voor studenten gestart in 2023-2024 of later) (Sint-Katelijne-Waver) (Focus education) 60 sp.
- Master in de industriële wetenschappen: elektromechanica (programma voor studenten gestart in 2023-2024 of later) (Geel) (Focus education) 60 sp.
- Master in de industriële wetenschappen: elektromechanica (programma voor studenten gestart in 2023-2024 of later) (Brugge) (Focus education) 60 sp.
- Master in de industriële wetenschappen: elektromechanica (programma voor studenten gestart in 2023-2024 of later) (Gent) (Focus education) 60 sp.
Onderwijsleeractiviteiten
3.5 sp. Statistische dataverwerking: hoorcollege (B-KUL-I0N48a)
Inhoud
In deze cursus ligt de klemtoon op het kwantificeren van verbanden tussen variabelen. Het eerste deel van de cursus handelt over regressie-analyse, terwijl het tweede deel handelt over variantie-analyse. Beide worden benaderd vanuit de context van het algemene lineaire model. Daarnaast wordt ook aandacht besteed aan frequent gebruikte niet-lineaire modellen. Toepassingen van de diverse analysetechnieken komen uitvoerig aan bod, zowel in de hoorcolleges als in de oefenzittingen.
Aan de hand van de cursus kunnen studenten een concreet vraagstuk in al zijn facetten ontleden, correct formuleren en vertalen in een statistisch model. Studenten kunnen deze modellen schatten en testen, gebruikmakend van een voor het vraagstuk geschikte procedure. Studenten zijn in staat de vereiste analyses zelf uit te voeren en de resultaten van een statistische analyse nauwkeurig te rapporteren.
Door onder begeleiding oefeningen op papier en met de computer te maken krijgen de studenten de kans om hun inzicht en kennis te vergroten in de leerstof van het hoorcollege.
Inleiding
Observationele versus experimentele gegevens, correlatie, causaliteit
1. Regressie
Enkelvoudige lineaire regressie:
- Definitie en model
- Schatting van de regressiecoëfficiënten (kleinste kwadratenmethode, normaalvergelijkingen, eigenschappen van de schatters)
- Inferenties : betrouwbaarheidsintervallen, hypothesetesten, voorspellingen
- Nagaan van de veronderstellingen omtrent het model
- Transformaties
- Testen van lack of fit.
- Belang van de keuze van de waarden van de onafhankelijke variabele
Meervoudige lineaire regressie:
- Definitie en model
- Schatting van de regressiecoëfficiënten (kleinste kwadratenmethode, normaalvergelijkingen, eigenschappen van de schatters)
- Kwantitatieve en kwalitatieve verklarende variabelen
- Het begrip interactie
- Inferenties : betrouwbaarheidsintervallen, hypothesetesten, voorspellingen
- Nagaan van de veronderstellingen omtrent het model
- Multicollineariteit
- Stappenplannen voor het opbouwen van regressiemodellen
- Belang van de keuze van de waarden van de onafhankelijke variabelen
Complicaties bij het schatten van lineaire regressiemodellen:
- Heteroscedasticiteit
- Gecorreleerde waarnemingen: seriële correlatie en clusters van waarnemingen
- Veralgemeende kleinste kwadratenmethode
Niet-lineaire regressiemodellen
Veralgemeende lineaire regressiemodellen:
- logistische regressie
- Poisson regressie:
2. Variantie-analyse
Variantie-analyse met 1 factor :
- Definitie en model
- Verband met regressie-analyse
- Anova-tabel
- Inferenties : testen, betrouwbaarheidsintervallen, contrasten, problematiek van meervoudig toetsen
- Nagaan van de veronderstellingen omtrent het model
Variantie-analyse met 2 of meer factoren:
- Definitie en model
- Het begrip interactie
- Anova-tabel
- Inferenties : testen, betrouwbaarheidsintervallen, contrasten, problematiek van meervoudig toetsen
- Nagaan van de veronderstellingen omtrent het model
Covariantie-analyse
Studiemateriaal
Cursusnota's en slides beschikbaar via Toledo
Toelichting werkvorm
Klassiek hoorcollege
0.5 sp. Statistische dataverwerking: oefeningen (B-KUL-I0N49a)
Inhoud
De oefeningen hebben tot doel meer inzicht in de leerstof te verwerven. Dit gebeurt door concrete vraagstukken te ontleden en op te lossen (via berekeningen en/of software). Ook worden statistische concepten verduidelijkt aan de hand van software. Hiervoor wordt gebruik gemaakt van het gebruiksvriendelijke, interactieve softwarepakket JMP.
Studiemateriaal
Informatie beschikbaar via Toledo.
Toelichting werkvorm
Oefensessie
Studenten worden opgesplitst in kleinere groepen voor de oefensessies.
Evaluatieactiviteiten
Evaluatie: Statistische dataverwerking (B-KUL-I2N48b)
Toelichting
• Schriftelijk examen op 18/20. Dit is een gesloten boek examen, waarbij een formularium en een rekentoestel gebruikt mogen worden.
• Take-home werkje op 2/20. Het is verplicht om het werkje tijdig in te dienen om te kunnen slagen voor het volledige OPO.
Toelichting bij herkansen
Voor de tweede examenkans is er enkel een schriftelijk examen (op 20). De punten van het take-home werkje worden niet overgedragen vanuit de eerste examenkans.