Boeken

We maken gebruik van een aantal boeken. Alle boeken zijn gratis online beschikbaar.

Het hoofdboek van de cursus is Christopher D. Manning, Prabhakar Raghavan en Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, 2008.
Te verkrijgen via de boekverkoop van Sticky (https://svsticky.nl/boeken).

Daarnaast gebruiken we gedeelten van Mining of Massive Datasets, van Jure Leskovic, Anand Rajaraman en Jeff Ullman. Er zijn ook video's beschikbaar bij dit boek.

Tevens gebruiken we gedeelten uit An introduction to statistical learning van Gareth James et al.
Er zijn ook slides en video's beschikbaar bij dit boek.

Tenslotte maken we ook gebruik van het boek Speech and Language Processing van
Dan Jurafsky en James H. Martin.

Slides

De slides die tijdens het college getoond worden vind je onder het kopje Planning. De slides die van de Stanford course zijn overgenomen bevatten verwijzingen naar de chapters uit Manning.

Artikelen

Agrawal, Chaudhuri e.a., Automated ranking of database query results

Ilyas e.a., A survey of top-k querying techniques

Jan Brandts: Over de wiskunde die Google groot maakte

Overzicht Verplichte Stof Deel 2

De verplichte literatuur voor deel 2 van de cursus bestaat uit:

  1. Hoofdstuk 3 uit het boek ISLR van James et al. in zijn geheel.
  2. Hoofdstuk 4 uit het boek ISLR van James et al. tot en met paragraaf 4.3.
  3. Hoofdstuk 13 uit Introduction to Information Retrieval van Manning et al.,
    behalve 13.2.1 en 13.4.1.
  4. Hoofdstuk 16 uit Manning et al. in zijn geheel.
  5. Hoofdstuk 6 uit Jurafsky en Martin, behalve paragraaf 6.7 (Pointwise Mutual Information).
  6. Lecture Notes Ordinale Classificatie.
  7. Slides van de colleges.