Statistiek voor economen (B-KUL-D0E21A)

6 studiepuntenNederlands52 urenEerste semester
OC Economische wetenschappen FEB Campus Leuven

Na het voltooien van dit opleidingsonderdeel heeft de student inzicht in de statistische analyse, opgevat als een essentieel instrument voor de economische analyse.
Zie verder onder 'onderwijsleeractiviteiten' aub

*

Bij het voltooien van dit opleidingsonderdeel kan de student:
* uitspraken formuleren over een populatie en deze toetsen aan de hand van een geobserveerde steekproef, gebruik maken van een objectief en wetenschappelijk kader
* geobserveerde data samenvattend weergeven
* de theorie en basisprincipes begrijpen en toepassen
* een hypothesetoest opzetten en uitvoeren. In deze inleidende cursus wordt de klemtoon gelegd op toetsen die steunen op de normale verdeling (t-verdeling, chi-kwadraat-verdeling, F-verdeling).
 
 

Volgtijdelijkheid
De student heeft volgende opleidingsonderdelen (of equivalenten)
* met succes afgerond: D0E12A Wiskunde voor economisten
* afgerond: /
* minstens gelijktijdig opgenomen: /
 
 
Verdere toelichting
Een behoorlijke kennis van calculus strekt tot aanbeveling. Deze laatste wordt aangeboden in het opleidingsonderdeel "Wiskunde voor economen".

Dit opleidingsonderdeel is identiek aan de volgende opleidingsonderdelen:
D0W27A : Bedrijfsstatistiek

Onderwijsleeractiviteiten

6 sp. Statistiek voor economen (B-KUL-D0E21a)

6 studiepuntenNederlandsWerkvorm: College52 urenEerste semester
OC Economische wetenschappen FEB Campus Leuven

Bestaat uit drie delen: beschrijvende statistiek, kansrekenen, en statistische besluitvorming.  Er volgt een bondig overzicht. 

 

I  BESCHRIJVENDE STATISTIEK (ongeveer zes uren hoorcollege)
1.  Data (en de datamatrix)
1.1.  meetbaarheid : kwalitatief (nominaal, ordinaal) versus kwantitatief (interval, ratio geschaald)
1.2.  discreet versus versus continu, gegroepeerde data
1.3.  univariaat versus multivariaat
2.  Voorstelling data
2.1.  grafieken : o.a. (cumulatieve) frequentiegrafieken (discreet versus continu)
3.  Kengetallen of datastatistieken : univariaat
3.1.  kengetallen van centrale ligging of centrummaten (en hun eigenschappen)
3.1.1.  rekenkundig gemiddelde (balans in evenwicht, minimaliseert de som van gekwadrateerde afwijkingen, gevoelig voor elke observatie)
3.1.2.  afgeknot (rekenkundig) gemiddelde, geometrisch gemiddelde
3.1.3.  mediaan (robuust voor uitschieters, minimaliseert som van absolute afwijkingen)
3.1.4.  modus
3.2.  maatstaven van relatieve ligging
3.2.1.  minimum, maximum, mediaan, kwartielen en percentielen
3.3.  maatstaven van spreiding
3.3.1.  variatiebreedte of range, interkwartielbreedte (grijpt de 50% middenblok)
3.3.2.  gemiddelde absolute afwijking (tov rekenkundig gemiddelde, tov mediaan)
3.3.3.  gemiddelde gekwadrateerde afwijking MSE
3.3.4.  steekproefvariantie versus populatievariantie
3.3.5.  stelling van Chebyshev
3.3.6.  variatiecoëfficiënt
3.3.7.  polarisatie bij ordinale meetbaarheid, heterogeniteit bij nominale data
3.4.  maatstaven van scheefheid
3.4.1.  Skewness Pearson, scheefheidscoëfficiënt
3.5.  kurtosis
3.6.  Lorenz-curve en Gini-coëfficiënt (inkomensongelijkheid)
4.  Kengetallen : bivariaat
4.1.  univariate kengetallen voor de projecties
4.2.  covariantie en correlatie (steekproef versus populatie)

 

II  KANSREKENEN (ongeveer vijftien uren hoorcollege)
1.  Kansruimte, stochastisch experiment
1.1.  gebeurtenis en kans, axioma's voor een kansruimte (Omega, P)
1.2.  eenvoudige eigenschappen (vanuit axioma’s)
2.  Voorwaardelijke kans
2.1.  definitie, kansboom en vermenigvuldigen langsheen een kansboom
2.2.  wet van de totale kans, en de stelling van Bayes (1702-1761)
2.3.  onafhankelijke gebeurtenissen
3.  Stochasten of univariate kansvariabelen
3.1.  stochastisch experiment, populatie, kenmerk X, gebeurtenis, kans
3.2.  verdelingsfunctie : definitie en eigenschappen
3.3.  discrete versus continue stochasten
3.4.  dichtheidsfunctie : oppervlakte (integralen) als kans
3.5.  interpretatie van een dichtheid in termen van kansen
4.  Specifieke verdelingen
4.1.  uniforme (discreet versus continu)
4.2.  verdelingen gebaseerd op een Bernoulli experiment
4.2.1.  Bernoulli, binomiale, geometrische, hypergeometrische
4.2.2.  binomium coëfficiënt en binomium van Newton
4.3.  Poisson als limiet van een rij van binomiaal verdeelde stochasten
4.4.  wachttijden vanuit een Poisson-proces (geen geheugen)
4.5.  exponentiële verdeling, overlevingsfunctie 
5.  Kengetallen van een stochast X
5.1.  verwachtingswaarde E[g(X)]
5.2.  verwachte waarde E[X] en variantie var(X), de ongelijkheid van Chebyshev
5.3.  wet van herhaalde verwachtingen E[Y] = E[E[Y | X]]
5.4.  mediaan
6.  Beslissen onder onzekerheid
6.1.  verwachte payoff
6.2.  verwacht nut versus nut van verwachte waarde, de ongelijkheid van Jensen
7.  Stochastische vectoren (van lengte twee)
7.1.  gezamenlijke dichtheid, marginale dichtheden, voorwaardelijke dichtheden
7.2.  onafhankelijkheid van stochasten
7.2.1.  definitie op basis van gebeurtenissen

 

7.2.2. stellingen die onafhankelijkheid vertalen naar marginale en conditionele dichtheden
7.3.  verwachtingswaarde
7.3.1.  covariantie, variantie van een som, onafhankelijkheid versus nul-covariantie
8.  Momentgenererende functies
8.1.  de rij van ruwe momenten legt de stochast volledig vast
8.2.  inzicht in sommen van onafhankelijke stochasten
9.  De normale verdeling
9.1.  dichtheidsfunctie, de momenten
9.2.  willekeurige normale versus standaard normale verdeling
9.3.  mgf en sommen van onafhankelijke normaal verdeelde stochasten
9.4.  praktische berekeningen : bovenstaartkansen van de standaardnormale
10.  De gamma verdeling en de chi-kwadraat verdeling
10.1.  kwadraat van een standaard normale, dichtheidsfunctie en haar verloop
10.2.  de verwachte waarde, de variantie, en de mgf
11.  Centrale limietstelling: convergeren in verdeling, formulering, en toepassingen
 
III  STATISTISCHE BESLUITVORMING (ongeveer vijftien uren hoorcollege)
1.  Steekproef
1.1.  representatieve steekproef, lukrake trekking, gestratificeerde,  clustersteekproef, geobserveerde steekproef
1.2.  stochastiek van het steekproefgemiddelde en van de steekproefvariantie
2.  Puntschatters voor een populatieparameter
2.1.  een puntschatter versus een intervalschatter
2.2.  criteria voor schatters 
2.2.1.  vertekening (bias), consistentie (ongelijkheid van Chebyshev),  efficiëntie
2.2.2.  het rekenkundig gemiddelde als BLUE voor het populatiegemiddelde
2.2.3.  steekproefvariantie als niet-vertekend puntschatter voor populatievariantie
2.3.  maximum-likelihood methode
2.3.1.  Bernoulli, Poisson, exponentiële, normale (vertekening)
2.3.2.  eigenschappen van ML-schatters
3.  Betrouwbaarheidsintervallen : de klassieke oefeningen
3.1.  puntschatter, verdeling van de puntschatter, betrouwbaarheidsinterval
3.2.  b.i. voor de verwachte waarde van een normale verdeling met variantie gekend
3.2.1.  halve intervalbreedte en de lengte van de steekproef
3.3.  b.i. voor de verwachte waarde van een normale verdeling met variantie niet gekend
3.3.1.  verdeling van steekproefvariantie, de t-verdeling (versus de normale)
3.4.  b.i. voor het verschil in verwachte waarde van twee onafhankelijke normale verdelingen
3.4.1.  varianties gekend, varianties aan elkaar gelijk en ongekend
3.4.2.  varianties niet gekend, Behrens-Fisher probleem, benaderend b.i. (CLS)
3.4.3.  b.i. voor verhouding varianties (F-verdeling)
3.5.  b.i. voor de variantie van een normale verdeling (chi-kwadraat schatter)
3.6.  b.i. voor de kans op succes in een Bernoulli-experiment
3.6.1.  kwadratische vergelijking oplossen
3.6.2.  vereenvoudigende benadering
3.7.  b.i. voor het verschil in kans op succes bij twee onafhankelijke Bernoulli’s
4.  Toetsen van hypothesen
4.1.  basisnotatie : nulhypothese, alternatieve hypothese, parameterhypothese, enkelvoudige hypothese, meervoudige hypothese
4.2.  procedure : formuleren van de nul- en van de alternatieve hypothese, betrouwbaarheidsniveau, toetsstochast, verdeling van de toetsstochast indien de nulhypothese waar is, kritisch gebied aanduiden, toets uitvoeren op de geobserveerde data, besluiten : nulhypothese al dan niet verwerpen (ten voordele van de alternatieve)
4.3.  eenzijdig versus tweezijdig verwerpingsgebied
4.4.  p-waarde
4.5.  gepaarde versus onafhankelijke observaties
4.6.  type-I-fout versus type-II-fout
4.6.1.  kans op fouten : alpha (voor type-I) versus beta (voor type-II)
4.6.2.  berekenen van alpha en beta
4.7.  verband tussen hypothesetoets en betrouwbaarheidsinterval
5.  Goodness-of-fit
5.1.  Pearson-chi-kwadraat-test
5.1.1.  TWEE cellen, Bernoulli-experimenten, binomiale benaderen door normale, en kwadrateren (en veralgemenen naar meer dan twee cellen)
5.1.2.  Pearson-chi-kwadraat-toets voor onafhankelijkheid
5.2.  Quantile-Quantile-plot
6.  Bivariaat normale verdeling
6.1.  toetsen van correlatie
7.  Niet-parametrische methoden
7.1.  motivatie
7.2.  Mann - Whitney – Wilcoxon rangsom
 
IV  OEFENINGEN (worden voorbereid door de studenten, ongeveer twaalf contacturen)
 

Gebruikt studiemateriaal wordt aangeboden via TOLEDO.

Evaluatieactiviteiten

Evaluatie: Statistiek voor economen (B-KUL-D2E21a)

Type : Partiële of permanente evaluatie met examen tijdens de examenperiode
Evaluatievorm : Mondeling, Schriftelijk
Vraagvormen : Meerkeuzevragen, Open vragen
Leermateriaal : Formularium, Rekenmachine


De evaluatie bestaat uit drie delen en wordt gewogen als volgt:

  • een tussentijds examen in week 5 van het academiejaar op 3 punten
  • een tussentijds examen in week 10 van het academiejaar op 5 punten
  • een examen in de examenperiode op 12 punten

Studenten die omwille van overmacht niet aanwezig kunnen zijn op een deelexamen, volgen de procedure zoals omschreven op het studentenportaal

Indien er geen sprake is van overmacht en de student niet deelneemt aan één (of meerdere) van de deelevaluaties, wordt de beoordeling van de niet afgelegde deelevaluatie(s) meegeteld als een 0-score binnen het gewogen eindresultaat.

Bepaling examenresultaat:

Het examen wordt beoordeeld door de titularis, zoals meegedeeld via Toledo en de examenregeling. De deelresultaten van de tussentijdse examens worden bekend gemaakt via Toledo. Het eindresultaat wordt berekend en uitgedrukt met een geheel getal op 20.

Evaluatie derde examenperiode

  • De student heeft tweemaal de kans deel te nemen aan het examen: een eerste keer in de eerste examenperiode en een tweede keer in de derde examenperiode.
  • De evaluatiekenmerken van de tweede examenkans zijn verschillend aan deze van de eerste examenkans: het examen in tweede examenkans bestaat uit één examen op 20 punten. Deelresultaten uit de eerste zittijd zijn niet overdraagbaar. 

Examenkenmerken

  • Gesloten boek
  • Enkele meerkeuzevragen met giscorrectie
  • Enkele open vragen, mondelinge toelichting bij één open vraag.
  • Gebruik van tabellen en van een eenvoudige rekenmachine wordt toegelaten.

De tweede examenkans bestaat uit één examen op 20 punten. Deelresultaten uit de eerste zittijd zijn niet overdraagbaar.