2L340: Kennissystemen

Kennissystemen zijn softwaresystemen, die kennis verwerven, op een expliciete manier voorstellen, over deze kennis redeneren en gebruiken om een opdracht uit te voeren. Het vak Kennissystemen bestaat uit hoorcolleges die de belangrijke onderwerpen presenteren uit het gebied van de kennissystemen. In Blok E worden de kennisvoorstelling en het redeneren besproken, in blok F - het verwerven van kennis en het gebruiken ervan.

Leerdoelen:

  1. Kennis van elementaire concepten op het gebied van kennissystemen.
  2. Kennis en praktische vaardigheid in het voorstellen van, het redeneren over, het verwerven van en het gebruiken van kennis.
  3. Praktische vaardigheid in het implementeren van kennissystemen.

Docent: Dr. Alexander Serebrenik
Les: Dinsdag, 1-2 lesuur (8.45-10.30)

Beoordeling:

·         Eindcijfer = 0.1*Opdracht0 + 0.4*Opdracht1 + 0.2*Opdracht2 + 0.3*Opdracht3 + Bonuspunten

·         Bonuspunten worden toegekend alleen voor het huiswerk die voldoende (zes of meer) heeft gekregen:  

 

Woordenboek.

Datum

Onderwerp

Transparanten

Aanbevolen lectuur

Huiswerk/opdracht

27 maart

Inleiding

Transparanten

 

Opdracht 0

 

Voorstellen van kennis

Transparanten

 

 

3 april

Kennisvoorstelling en basisredeneren

Transparanten

Lectuur

Opdracht 1, Huiswerk: 0, 1, 2

10 april

Niet-monotoon redeneren

Transparanten

Lectuur

Huiswerk: 3, 4, 5, 6

17 april

Redeneren met onzekerheid

Transparanten

Lectuur

Huiswerk: 7, 8, 9

24 april

Diagnose en uitleg

Transparanten

Lectuur

Huiswerk: 10, 11

1 mei

Efficiënt redeneren.  Het verwerven van kennis: kennisblootlegging en clustering.

Transparanten

Lectuur

Huiswerk: 12, 13

8 mei

Tentamenweek, geen les

 

 

 

15 mei

Clustering

Transparanten

Lectuur

Opdracht 2, Huiswerk: 14

22 mei

Classification

Transparanten

Lectuur

Huiswerk: 15, 16

29 mei

Data mining

gastcollege door Dr. Toon Calders

 

 

5 juni

Planning

Transparanten

Lectuur

Opdracht 3, Huiswerk: 17, 18

12 juni

Roosters

Transparanten

Lectuur

Huiswerk: 19, 20, 21.

19 juni

Genetische algoritmen

Transparanten

 

 

 

Industriële toepassingen van kennissystemen.

Mevr. Iulia Dobai (Philips Applied Technologies)

 

 

Dhr. Bob Huisman (NedTrain)

 

 

Lessenplan

  1.  
  2. Twee belangrijke kennisvoorstellingsformalismen: OWL en eerste-orde logica. De OWL-toren: URI, XML, RDF, RDFS, OWL. Eerste-orde logica: feiten, regels. Basisredeneren in eerste-orde logica: semantisch gevolg en bewijsbaarheid. Top-down vs. bottom-up. Breedte-eerst vs. diepte-eerst.
  1. Niet-monotoon redeneren. Tekortkomingen van het klassiek redeneren ten opzichte van uitzonderingen en gewoontes. Verschillende manieren om niet-monotoon redeneren te formaliseren: aanname van een gesloten wereld, negatie als falen, circumscriptie, verstekregels, autoepistemische logica.
  2. Onzekerheid en vaagheid. Tekortkomingen van het klassiek redeneren ten opzichte van onzekere en vage stellingen. Onzekerheid: modelleren met behulp van geloofsnetwerken. Combinatie van geloofsnetwerken en logische programma’s: Bayesiaans logisch programmeren. Vaagheid: manieren om met vage stellingen om te gaan. Relatie tussen onzekerheid en vaagheid.
  3. Diagnose en uitleg. Nood aan diagnose en uitleg in kennissystemen. Abductieve uitleg. Het berekenen van een abductieve uitleg. Consistentiegebaseerde uitleg. Het berekenen van een consistentiegebaseerde uitleg. Relatie tussen abductieve en consistentiegebaseerde uitleg.
  4.  
  5. Het verwerven van kennis: machinaal leren, niet gesuperviseerd leren, clustering. Scheidend clustering met behulp van grafentheorie (minimaal opspannende boom, max cut) en statistiek (k gemiddelde, k centroïden, vage k gemiddelde; aantal clusters bepalen).
  6. Het verwerven van kennis: machinaal leren, gesuperviseerd leren, classificatie. Classificatietechnieken: versieruimtes, beslisbomen, lineaire modellen met behulp van de kleinste kwadraten benadering, k dichtsbijzijnde buren.
  7. Data mining Gastcollege door Dr. Toon Calders
  8. Het gebruiken van kennis: planning. Klassieke planning: aannames, oplossingen (voorwaarts zoeken, achterwaarts zoeken, STRIPS). Reductie naar SAT. Het oplossen van SAT (Davis-Putnam, stochastisch).
  9. Roosteren. Wat is een roosteringprobleem? Welke parameters zijn van belang bij het omschrijven van een dergelijk probleem? Voorbeelden van roosteringproblemen. Onderbreekbare en niet onderbreekbare opdrachten. Benaderingsalgoritmen.
  10. Genetische algoritmen. Wat zijn genetische algoritmen? Hoe kan je genetische algoritmen gebruiken om NP-volledige problemen op te lossen?

Huiswerk (aanbevolen)

Opdrachten (verplicht)

Implementatie:

a)      Moet met een willekeurige tab-separated bestand kunnen werken. Het eerste colom bevat namen van de objecten, alle andere – verschillende eigenschappen (reële getallen).

b)      Moet op mijn laptop draaien (zorg indien nodig voor de installatiegids)

c)      Ik ben wel bereid om een kwartiertje te wachten op een clusteringprogramma maar zeker geen uur!

      De volgende punten moeten in het verslag toegelicht worden (ik gebruik een dataset van chemische elementen als voorbeeld):

a)       NB: ongelijkheidsmaat moet gebaseerd worden op ten minste twee eigenschappen per voorbeeld

a)       Hoe hebben jullie de bovengrens gekozen voor het aantal clusters (K)?

a)       Welke landen, objecten of sterrenbeelden horen samen?

b)       Kunnen jullie de clusters omschrijven in termen van de eigenschappen (bijv. het aantal isotopen is lager dan… en het smelttemperatuur is hoger dan…)

c)       Wat is de verschilmaat van de clusterverdeling (W)?

d)       Kunnen jullie in deze clusters bepaalde bekende groepen herkennen, bijv., metalen?

In te dienen tot 5 juni 2007, 12 uur 's middags in Alexander z'n brievenbus (naast HG 5.91).

 

Voorzie voldoende tijd voor het schrijven van het verslag!

 

           Drie voorbeelden van logs:

1.      KBS-log0.xml Log uit het artikel van Manilla, Toivonen en Verkamo.

2.      KBS-log1.xml. Nog steeds dezelfde log, deze keer ingedeeld in drie verschillende procesinstances.

3.      KBS-logReviews.xml. Beoordelen van wetenschappelijke publicaties.

Update 10 juli 2007:

1.      Op verzoek van Johan en Stef: zip met de bijkomende ProM documentatie (JavaDoc inbegrepen). Let op! Documentatie is misschien niet echt up-to-date.

2.      numSimilarInstances is het aantal identieke ProcesInstances.

In te dienen verslag en de implementatie. Deadline: 18 juli 2007, 12 uur 's middags elektronisch naar a.serebrenik @ tue.nl (naast HG 5.91).

NB: Deadline is strikt omwille van de sluiting van het onderwijssecretariaat.