Statistiek & data-analyse (B-KUL-G0N11C)
Doelstellingen
De cursus heeft tot doel de basisbegrippen van statistiek bij te brengen zodat de student inzicht verwerft in de methodiek van data−analyse en het gebruik ervan in wetenschappelijke disciplines. Een concrete en correcte toepassing van deze technieken primeert. De cursus beoogt eveneens de studenten vertrouwd te maken met statistische software.
Na het volgen van dit onderdeel:
- heeft de student kennis van statistische software zoals R om een dataset op een duidelijke manier voor te stellen en samen te vatten door gebruik te maken van gepaste grafische methoden en samenvattende numerieke getallen uit de beschrijvende statistiek, waaronder een staafdiagram, histogram, boxplot, kwantielplot, kruistabel, steekproefgemiddelde, steekproefstandaardafwijking en steekproefvariantie, steekproefcorrelatie.
- kent de student de belangrijkste kansregels, onafhankelijkheid van gebeurtenissen, voorwaardelijke kans, de wet van de totale kans en de regel van Bayes, en kan deze toepassen in concrete situaties.
- kan de student de belangrijkste eigenschappen van univariate dichtheidsfuncties, verdelingsfuncties en kwantielfuncties hanteren om kansen en kenmerken van een toevalsvariabele te berekenen. In het bijzonder is de student erg vertrouwd met de normale verdeling en de binomiaalverdeling.
- kent de student het belang van de centrale limietstelling en kan deze in concrete situaties toepassen.
- kan de student bij een concreet onderzoeksprobleem en bijhorende data-verzameling de gepaste statistische methode uit de beschrijvende en de inductieve statistiek selecteren en toepassen. De student kan in concrete situaties (cfr. inhoud) puntschattingen berekenen, betrouwbaarheidsintervallen opstellen, hypothesetesten uitvoeren, de resultaten interpreteren en op basis daarvan een correct besluit op een wetenschappelijke manier formuleren. Hij kent ook de voorwaarden om de analyse te mogen uitvoeren en kan deze op een concrete dataset nagaan. De student kan de gegeven R-output analyseren.
Begintermen
Elementaire calculus
Volgtijdelijkheidsvoorwaarden
Dit opleidingsonderdeel is een voorwaarde voor het opnemen van volgende opleidingsonderdelen:
E06A0A : Milieu epidemiologie: zinvol en actueel (Niet meer aangeboden dit academiejaar)
I0O15A : Bioinformatics
G0P06C : Ruimtelijke analysetechnieken
G0L66B : Geïntegreerd veldwerk biodiversiteit en ecologie
G0N25D : Bachelorproef
Identieke opleidingsonderdelen
Dit opleidingsonderdeel is identiek aan de volgende opleidingsonderdelen:
X0A17A : Statistiek & data-analyse
Plaats in het onderwijsaanbod
- Bachelor in de biochemie en de biotechnologie (programma voor studenten gestart vóór 2023-2024) (Leuven) 180 sp.
- Bachelor in de informatica (Leuven) 180 sp.
- Bachelor in de geologie (programma voor studenten gestart vóór 2024-2025) (Leuven) 180 sp.
- Bachelor in de geografie (programma voor studenten gestart vóór 2024-2025) (Leuven) 180 sp.
- Bachelor in de chemie (Leuven) 180 sp.
- Bachelor in de biologie (Leuven) 180 sp.
- Schakelprogramma: Master in de biologie (Leuven) 87 sp.
- Bachelor in de biochemie en de biotechnologie (programma voor studenten gestart in 2023-2024 of later) (Leuven) 180 sp.
- Bachelor in de geowetenschappen (Leuven) 180 sp.
Onderwijsleeractiviteiten
2 sp. Statistiek & data-analyse: hoorcollege (B-KUL-G0N11a)
Inhoud
• Inleidend gedeelte: hier wordt aan de hand van eenvoudige praktische voorbeelden het belang van de statistiek uitgelegd. Eveneens worden de basiselementen van beschrijvende statistiek uitgewerkt. Dit omvat numerisch en grafisch weergeven van zowel univariate als bivariate gegevens.
• De belangrijkste rekentechnieken en modellen van de kansrekenen worden ingevoerd. Het betreft hier alleen de basisbeginselen van de kansrekening die behoren tot de meest essentiële toolbox van de statisticus. Na de basisregels van de kansrekening wordt het begrip toevalsvariabele geïntroduceerd tesamen met de overeenkomstige rekentechnieken voor het berekenen van verwachtingswaarden en de kansverdeling van een getransformeerde toevalsvariabele. Met behulp van deze basis worden enkele belangrijke kansmodellen ontwikkeld (binomiaal, Poisson, normaal, exponentieel). Het concept onafhankelijke toevalsvariabelen en correlatie wordt besproken.
• Het deel Verklarende Statistiek behandelt de basisprincipes die worden toegepast bij het schatten van een model op basis van meetgegevens. Daarna wordt de notie van kansverdeling van een statistiek ingevoerd. Verder komen betrouwbaarheidsintervallen en testen van hypothesen aan bod, tesamen met validatieprincipes van een kansmodel. Het verschil tussen een parametrische en niet−parametrische aanpak komt hierbij aan bod. Deze basisprincipes worden toegepast op univariate en bivariate gegevensstructuren, inclusief regressieanalyse.
Studiemateriaal
Er worden slides en on-line lesmateriaal ter beschikking gesteld.
Materiaal voor de oefeningen wordt ter beschikking gesteld, alsook een formularium en statistische tabellen.
Het boek 'Statistiek en Wetenschap (Acco Uitgeverij) wordt als handboek gebruikt.
Toelichting werkvorm
Er wordt naast de hoorcolleges in het auditorium ook online lesmateriaal ter beschikking gesteld.
1 sp. Statistiek & data-analyse: oefeningen 3 (B-KUL-G0W79a)
Inhoud
Begeleide oefenzittingen worden aangeboden waardoor de student vertrouwd wordt gemaakt met de rekentechnieken en methoden uit de kansrekening en de statistiek die in de cursus aan bod komen.
Daarnaast maken de studenten kennis met statistische software en worden de resultaten besproken in de oefenzittingen.
Toelichting werkvorm
Oefensessie - PC-sessie
Evaluatieactiviteiten
Evaluatie: Statistiek & data-analyse (B-KUL-G2N11c)
Toelichting
Het examen is volledig schriftelijk.