Datateknik, avancerad nivå, Reinforcement learning, 6 hp

Reinforcement learning är en maskininlärningsmetod som lär sig att lösa sekventiella beslutsfattande problem genom ”trial and error”. Detta innebär att en framgångsrik agent behöver fatta flera optimala beslut för att lösa problemet och att agenten måste lära sig av erfarenhet genom att knyta ihop olika lösningar. I den här kursen ger vi studenten grunden för att förstå och använda algoritmer för förstärkningsinlärningens diskreta och kontinuerliga miljöer, inklusive s.k. djup förstärkningsinlärning. Vi börjar med grundläggande dynamiska programmeringsbaserade algoritmer och inkluderar även state-of-the-art algoritmer för kontinuerliga tillstånd och aktionsutrymmen.

Kursen riktar sig till yrkesverksamma.

Fördjupning

Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav (A1N)

Institution

Institutionen för naturvetenskap och teknik

Kursen ges vid följande tillfällen

Förkunskapskrav: 180 högskolepoäng varav 15 högskolepoäng programmering samt Engelska 5/Engelska A.

Urval: Antal avklarade högskolepoäng tagna senast sista anmälningsdag (TPAV)

Kursplan

Anmälningskod: ORU-H5631

Anmäl dig nu