Cursusplan

De planning is up to date voor 2020.

Volgens het officiële rooster hebben we drie tijdblokken in de week: A = woensdag 15-17, B = vrijdag 13-15, C = vrijdag 15-17.

In deel 1 van de cursus worden de hoorcolleges vervangen door clips en je bent vrij om deze te bekijken wanneer je wilt, hoewel het verstandig is om het weekrooster te volgen. Incidenteel is er werkcollegebegeleiding via MS Teams. Het practicum start in week 19.

Deel 2 begint in week 22. In dit deel van de cursus zijn tijdblokken A en B bestemd voor de hoorcolleges. Let op: het hoorcollege op woensdag is, in tegenstelling tot het officiële rooster, van 13.15 tot 15.00 uur. Na afloop van de hoorcolleges zijn Ad Feelders en/of Laurens Stoop in de Teams chat aanwezig om vragen over de practicumopdracht te beantwoorden. Zij zullen ook regelmatig op andere dagen openstaande vragen in de chat beantwoorden. De eerste sessie is op vrijdag 29 mei, dus na afloop van hoorcollege 22B.

Kort voor of na elk college verschijnen links naar de gebruikte slides op deze pagina. Momenteel staan de slides van vorig jaar online, maar die kunnen nog aangepast worden. Verder verwijzen we naar de literatuur. Een - betekent tot en met.

College Onderwerp/Slides/Opgaven Literatuur
17A intropostings lists, dictionaries
Clips: intro, 1-1, 1-2
zie slides
17B index building, map-reduce
Clips: 2-1, 2-2
boek ch. 4 - 4.2, MoMD 2 - 2.3
17C werkcollege oefeningen MR
18A ranking, tf-idf, vector space
Clips: 3-1, 3-2
database query ranking
zie slides; Agrawal & Chaudhuri
18B top-k searching, oefeningen
frequent itemsets
Ilyas: ch. 1, 2-2.3, 3.1-3.3
19-21 Practicum P1 Deadline: 26 mei
19A recap linear algebra;
Google PageRank
oefeningen, ommezijde; Brandts, t/m 4.2
19B case study k-grams: DNA matching, BLAST zie slides
20C Deeltoets T1  
22A Intro Data Mining / Text Classification and Naive Bayes Boek Manning et al. hoofdstuk 13
22B Lineaire Regressie + Intro Opdracht 2 Boek James et al. hoofdstuk 3 (video's)
Alle slides en video's bij het boek.
22-25 Practicum P2 Deadline: 19 juni
23A Classificatie (Extra Slides.) Boek James et al. hoofdstuk 4
tot en met paragraaf 4.3
23B Word Embeddings (Word2vec, GloVe) Hoofdstuk 6 van Jurafsky en Martin
24A Ordinale Classificatie. Lecture Notes Ordinal Classification
24B Clustering Manning et al. hoofdstuk 16
25A Proeftentamen en uitgebreide uitwerking.
oefenopgaven deel 2
 
25B Herkansing T1  
26 Deeltoets T2: vrijdag 26 juni