Numerieke benadering met toepassing in datawetenschappen (B-KUL-H01P3A)

6 studiepuntenNederlands54 urenTweede semesterUitgesloten voor examencontract
Michiels Wim (coördinator) |  Michiels Wim |  Samaey Giovanni
POC Computerwetenschappen

De benadering van functionele verbanden tussen grootheden en de interpretatie van data zijn universele problemen in de (ingenieurs-)wetenschappen met vele toepassingen, onder meer in de datawetenschappen en in machine learning. Deze cursus behandelt een aantal belangrijke numerieke methoden en algoritmen voor het benaderen van een gekende functie door een combinatie van eenvoudigere functies, het bepalen van een ongekende functie op basis van mogelijk grote hoeveelheden (gemeten) data, en voor de analyse van datasets en grafen. Daarbij wordt aandacht besteed aan de kwaliteit van de bekomen oplossingen, de rekencomplexiteit en numerieke eigenschappen van de algoritmes om die oplossingen te berekenen, en de brede  toepasbaarheid van de aangereikte theorie en algoritmes. In de cursus komen zowel eendimensionale als meerdimensionale benaderingsproblemen aan bod. 

 

Na deze cursus zal de student in staat zijn om: 

  • standaard benaderingstechnieken te beschrijven en hun eigenschappen (complexiteit, nauwkeurigheid, betrouwbaarheid) kritisch te bespreken; 
  • een gefundeerde keuze te maken voor specifieke benaderingstechnieken, afhankelijk van de context en de probleemstelling; 
  • benaderingsalgoritmes te implementeren en de bekomen numerieke resultaten te interpreteren in functie van de eigenschappen van de methodes; 
  • specifieke problemen in datawetenschappen te formuleren als een benaderingsprobleem, numeriek op te lossen en het oplossingsproces helder schriftelijk te rapporteren. 

Deze cursus steunt op cursussen analyse, lineaire algebra en numerieke wiskunde zoals die bijvoorbeeld aangeboden worden in de eerste 3 semesters van bachelor ingenieurswetenschappen, en veronderstelt een vertrouwdheid met 
toepassingsdomeinen zoals systeemtheorie, informatie-overdracht, mechanica/natuurkunde. 

Onderwijsleeractiviteiten

4 sp. Numerieke benadering met toepassing in datawetenschappen: hoorcollege (B-KUL-H01P3a)

4 studiepuntenNederlandsWerkvorm: College34 urenTweede semester
POC Computerwetenschappen

Deel 1 Inleiding   

  • Data en model: Wat is een benaderingsprobleem; Van data naar functiebenadering 
  • Beste benadering: Definitie van een optimalisatieprobleem; Regularisatie; Lineaire vs. niet-lineaire benadering in de parameters 

 

Deel 2 Lineaire benaderingsproblemen 

  • Beste benadering van vectoren in een lineaire deelruimte: Scheve en orthogonale basis in Rn; Orthogonalisatieprocedures; Beste benadering van vectoren 
  • Benadering van functies in deelruimtes: Metrische ruimte en afstand; Genormeerde ruimte en lengte; Unitaire ruimte en orthogonaliteit; Benadering in Euclidische ruimten 
  • Veeltermbenadering: Kleinste-kwadratenbenadering met veeltermen: Orthogonale veeltermen; Continue kleinste-kwadratenbenadering  
  • Benaderingen door middel van splines: Definitie en eigenschappen; B-spline basis; Bewerkingen op splines 
  • Discrete benadering op basis van meetdata: Opstellen van de benadering; Ruis en overfitting 

 

Deel 3 Data, grafen en eigenwaarden 

  • Grafen en eigenwaardenproblemen in data science: PageRank; Meest centrale knoop; Spectrale clustering; Partitionering van een graaf 
  • Numerieke methodes voor eigenwaardeproblemen: Methode van de machten; deelruimte-iteratie; QR-algoritme zonder en met shifts; Krylov methodes 

 

Deel 4 Niet-lineaire benadering 

  • Niet-lineaire benaderingsproblemen in de praktijk: Functies met niet-lineaire parameterafhankelijkheid; Diepe neurale netwerken 
  • Optimalisatiemethodes: Gradient descent method and stochastic gradient descent; Conjugate gradient method; Gauss-Newton methode; Leren uit data 
  • IJle representatie en benaderingen: Singuliere waardenontbinding: definitie en eigenschappen; algoritmes; Reductie van datasets en Principal Component-Analysis; Lagerangbenaderingen 

Studiekost: 51-75 euro (De informatie over studiekosten zoals hier opgenomen is indicatief en geeft enkel de prijs weer bij aankoop van nieuw materiaal. Er zijn mogelijk ook e- en tweedehandskopijen beschikbaar. Op LIMO kan je nagaan of het handboek beschikbaar is in de bibliotheek. Eventuele printkosten en optioneel studiemateriaal zijn niet in deze prijs vervat.)

Cursustekst

1.2 sp. Numerieke benadering met toepassing in datawetenschappen: oefeningen (B-KUL-H01P4a)

1.2 studiepuntenNederlandsWerkvorm: Practicum20 urenTweede semester
POC Computerwetenschappen

De oefenzittingen zijn programmeerzittingen in Matlab op basis van opgaven die verband houden met de inhoud van het hoorcollege. 

Opdrachten gegeven tijdens de oefenzittingen.

0.8 sp. Numerieke benadering met toepassing in datawetenschappen: practica (B-KUL-H01Z3a)

0.8 studiepuntenNederlandsWerkvorm: OpdrachtTweede semester
POC Computerwetenschappen

Twee opdrachten, uit te voeren in Matlab en schriftelijk te rapporteren, waarbij een deelaspect uit de inhoud van het hoorcollege verder uitgediept wordt.   

Algemene doelstellingen: 

  • dieper inzicht in theorie verwerven 
  • ontwikkeling van een efficiënte Matlab implementatie 
  • ontwerp van nieuwe, gelijkaardige numerieke algoritmen aan deze gezien in de hoorcolleges 
  • schrijven van wetenschappelijk verslag 

Opdracht verspreid via Toledo.

De practica worden alleen of met 2 gemaakt. Bij elk practicum moet er een verslag geschreven worden. De beoordeling van de practica gebeurt op basis van dit verslag. 

Evaluatieactiviteiten

Evaluatie: Numerieke benadering met toepassing in datawetenschappen (B-KUL-H21P3a)

Type : Partiële of permanente evaluatie met examen tijdens de examenperiode
Evaluatievorm : Schriftelijk, Verslag


De evaluatie voor dit vak bestaat enerzijds uit de kwotering voor de practica en anderzijds uit de kwotering voor het examen.
Een student moet slagen op elk van deze twee onderdelen (practica, eindexamen) om in totaal te kunnen slagen. 

 

De evaluatie voor dit vak bestaat enerzijds uit de kwotering voor de practica en anderzijds uit de kwotering voor het examen. Een student moet slagen op elk van deze twee onderdelen (practica, eindexamen) om in totaal te kunnen slagen.

Bij niet slagen voor de practica in de juni-zittijd wordt een extra opgave voorzien.  Bij het slagen voor de practica in de juni-zittijd moet voor de herkansing van het vak geen nieuwe opgave gemaakt worden.

Bij het niet slagen voor het vak in de juni-zittijd moet het examen steeds opnieuw afgelegd worden.