Numerieke benadering met toepassing in datawetenschappen (B-KUL-H01P3A)

Doelstellingen
De benadering van functionele verbanden tussen grootheden en de interpretatie van data zijn universele problemen in de (ingenieurs-)wetenschappen met vele toepassingen, onder meer in de datawetenschappen en in machine learning. Deze cursus behandelt een aantal belangrijke numerieke methoden en algoritmen voor het benaderen van een gekende functie door een combinatie van eenvoudigere functies, het bepalen van een ongekende functie op basis van mogelijk grote hoeveelheden (gemeten) data, en voor de analyse van datasets en grafen. Daarbij wordt aandacht besteed aan de kwaliteit van de bekomen oplossingen, de rekencomplexiteit en numerieke eigenschappen van de algoritmes om die oplossingen te berekenen, en de brede toepasbaarheid van de aangereikte theorie en algoritmes. In de cursus komen zowel eendimensionale als meerdimensionale benaderingsproblemen aan bod.
Na deze cursus zal de student in staat zijn om:
- standaard benaderingstechnieken te beschrijven en hun eigenschappen (complexiteit, nauwkeurigheid, betrouwbaarheid) kritisch te bespreken;
- een gefundeerde keuze te maken voor specifieke benaderingstechnieken, afhankelijk van de context en de probleemstelling;
- benaderingsalgoritmes te implementeren en de bekomen numerieke resultaten te interpreteren in functie van de eigenschappen van de methodes;
- specifieke problemen in datawetenschappen te formuleren als een benaderingsprobleem, numeriek op te lossen en het oplossingsproces helder schriftelijk te rapporteren.
Begintermen
Deze cursus steunt op cursussen analyse, lineaire algebra en numerieke wiskunde zoals die bijvoorbeeld aangeboden worden in de eerste 3 semesters van bachelor ingenieurswetenschappen, en veronderstelt een vertrouwdheid met
toepassingsdomeinen zoals systeemtheorie, informatie-overdracht, mechanica/natuurkunde.
Plaats in het onderwijsaanbod
- Voorbereidingsprogramma: Master in de ingenieurswetenschappen: wiskundige ingenieurstechnieken (Leuven) 29 sp.
- Bachelor in de wiskunde (Leuven) 180 sp.
- Master in de statistiek (Leuven) 120 sp.
- Master in de sterrenkunde (Leuven) (Professionele Optie) 120 sp.
- Master in de ingenieurswetenschappen: wiskundige ingenieurstechnieken (Leuven) 120 sp.
- Voorbereidingsprogramma: Master in de ingenieurswetenschappen: computerwetenschappen (Leuven) 61 sp.
- Master in de wiskunde (Leuven) 120 sp.
- Master of Mathematics (Leuven) 120 sp.
- Master of Mathematical Engineering (Leuven) 120 sp.
- Bachelor in de ingenieurswetenschappen (programma voor studenten gestart vóór 2024-2025) (Leuven) (Hoofdrichting computerwetenschappen) 180 sp.
- Bachelor in de ingenieurswetenschappen (programma voor studenten gestart vóór 2024-2025) (Leuven) (Nevenrichting computerwetenschappen) 180 sp.
- Bachelor in de ingenieurswetenschappen (programma voor studenten gestart in 2024-2025 of later) (Leuven) (Afstudeerrichting computerwetenschappen) 180 sp.
- Bachelor in de ingenieurswetenschappen (programma voor studenten gestart in 2024-2025 of later) (Leuven) (Keuzepakket H) 180 sp.
- Voorbereidingsprogramma: Master in de ingenieurswetenschappen: artificiële intelligentie (Leuven) 46 sp.
Onderwijsleeractiviteiten
4 sp. Numerieke benadering met toepassing in datawetenschappen: hoorcollege (B-KUL-H01P3a)
Inhoud
Deel 1 Inleiding
- Data en model: Wat is een benaderingsprobleem; Van data naar functiebenadering
- Beste benadering: Definitie van een optimalisatieprobleem; Regularisatie; Lineaire vs. niet-lineaire benadering in de parameters
Deel 2 Lineaire benaderingsproblemen
- Beste benadering van vectoren in een lineaire deelruimte: Scheve en orthogonale basis in Rn; Orthogonalisatieprocedures; Beste benadering van vectoren
- Benadering van functies in deelruimtes: Metrische ruimte en afstand; Genormeerde ruimte en lengte; Unitaire ruimte en orthogonaliteit; Benadering in Euclidische ruimten
- Veeltermbenadering: Kleinste-kwadratenbenadering met veeltermen: Orthogonale veeltermen; Continue kleinste-kwadratenbenadering
- Benaderingen door middel van splines: Definitie en eigenschappen; B-spline basis; Bewerkingen op splines
- Discrete benadering op basis van meetdata: Opstellen van de benadering; Ruis en overfitting
Deel 3 Data, grafen en eigenwaarden
- Grafen en eigenwaardenproblemen in data science: PageRank; Meest centrale knoop; Spectrale clustering; Partitionering van een graaf
- Numerieke methodes voor eigenwaardeproblemen: Methode van de machten; deelruimte-iteratie; QR-algoritme zonder en met shifts; Krylov methodes
Deel 4 Niet-lineaire benadering
- Niet-lineaire benaderingsproblemen in de praktijk: Functies met niet-lineaire parameterafhankelijkheid; Diepe neurale netwerken
- Optimalisatiemethodes: Gradient descent method and stochastic gradient descent; Conjugate gradient method; Gauss-Newton methode; Leren uit data
- IJle representatie en benaderingen: Singuliere waardenontbinding: definitie en eigenschappen; algoritmes; Reductie van datasets en Principal Component-Analysis; Lagerangbenaderingen
Studiemateriaal
Studiekost: 51-75 euro (De informatie over studiekosten zoals hier opgenomen is indicatief en geeft enkel de prijs weer bij aankoop van nieuw materiaal. Er zijn mogelijk ook e- en tweedehandskopijen beschikbaar. Op LIMO kan je nagaan of het handboek beschikbaar is in de bibliotheek. Eventuele printkosten en optioneel studiemateriaal zijn niet in deze prijs vervat.)
Cursustekst
1.2 sp. Numerieke benadering met toepassing in datawetenschappen: oefeningen (B-KUL-H01P4a)
Inhoud
De oefenzittingen zijn programmeerzittingen in Matlab op basis van opgaven die verband houden met de inhoud van het hoorcollege.
Studiemateriaal
Opdrachten gegeven tijdens de oefenzittingen.
0.8 sp. Numerieke benadering met toepassing in datawetenschappen: practica (B-KUL-H01Z3a)
Inhoud
Twee opdrachten, uit te voeren in Matlab en schriftelijk te rapporteren, waarbij een deelaspect uit de inhoud van het hoorcollege verder uitgediept wordt.
Algemene doelstellingen:
- dieper inzicht in theorie verwerven
- ontwikkeling van een efficiënte Matlab implementatie
- ontwerp van nieuwe, gelijkaardige numerieke algoritmen aan deze gezien in de hoorcolleges
- schrijven van wetenschappelijk verslag
Studiemateriaal
Opdracht verspreid via Toledo.
Toelichting werkvorm
De practica worden alleen of met 2 gemaakt. Bij elk practicum moet er een verslag geschreven worden. De beoordeling van de practica gebeurt op basis van dit verslag.
Evaluatieactiviteiten
Evaluatie: Numerieke benadering met toepassing in datawetenschappen (B-KUL-H21P3a)
Toelichting
De evaluatie voor dit vak bestaat enerzijds uit de kwotering voor de practica en anderzijds uit de kwotering voor het examen.
Een student moet slagen op elk van deze twee onderdelen (practica, eindexamen) om in totaal te kunnen slagen.
Toelichting bij herkansen
De evaluatie voor dit vak bestaat enerzijds uit de kwotering voor de practica en anderzijds uit de kwotering voor het examen. Een student moet slagen op elk van deze twee onderdelen (practica, eindexamen) om in totaal te kunnen slagen.
Bij niet slagen voor de practica in de juni-zittijd wordt een extra opgave voorzien. Bij het slagen voor de practica in de juni-zittijd moet voor de herkansing van het vak geen nieuwe opgave gemaakt worden.
Bij het niet slagen voor het vak in de juni-zittijd moet het examen steeds opnieuw afgelegd worden.