Reinforcement learning del 1, 3 hp

Förstärkningslärande (Reinforcement learning - RL) är en metod för att lära sig att fatta ett optimalt beslut genom försök och misstag. Målet med RL är att uppnå en optimal policy för varje tillstånd i ett system. Kursen täcker den underliggande formalismen hos RL som kallas Markovska beslutsprocesser och grundläggande RL-algoritmer. Exempel är dynamisk programmering. Vi kommer att visa hur man modellerar ett problem som en Markovska-beslutsprocess och implementerar grundläggande RL-algoritmer för att lösa dem. Dessutom kommer vi att utforska olika sätt att jämföra och utvärdera prestanda för inlärningsmetoder.

Kursen riktar sig till dig som är yrkesverksam.

Fördjupning

Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav (A1N)

Institution

Institutionen för naturvetenskap och teknik

Kursen ges vid följande tillfällen

Förkunskapskrav: 180 högskolepoäng varav 15 högskolepoäng programmering samt Engelska 5/Engelska A.

Urval: Antal avklarade högskolepoäng tagna senast sista anmälningsdag (TPAV)

Kursplan

Anmälningskod: ORU-H5359

Anmäl dig nu