AI Reinforcement Learning - eLearning
4.950,00 SEK
- 30 hours
Kliv in i framtiden för AI med kursen i förstärkningsinlärning, där maskiner lär sig genom att interagera, anpassa sig och förbättras genom erfarenhet. Den här kursen introducerar dig till en av de mest kraftfulla grenarna inom maskininlärning, som används inom robotik, spel-AI, rekommendationssystem och autonomt beslutsfattande.
Nyckelfunktioner
Språk
Kurs och material på engelska
Nivå
Nybörjar- till avancerad nivå
Åtkomst
1 års tillgång till utbildningsplattformen
9 timmars videokurser på begäran
med 30+ timmars rekommenderad studietid
30 guidade praktiska övningar
8 automatisk rättade prov
46 repetitionsquiz
2 omfattande uppgifter
Certifikat
Intyg om genomfört program ingår
Lärandemål
I slutet av den här kursen kommer du att kunna förstå:
Grunder
Behärska grunderna i multiagent-förstärkningsinlärning (RL)
Grundläggande paradigm
Utforska de tre grundläggande paradigmerna inom maskininlärning
Balans
Förstå balansen mellan utforskande och utnyttjande
Tabular-Q
Lär dig tabellbaserad Q-inlärning och djup Q-inlärning
RLib
Träna flera agenter med RLib
Markov
Få en förståelse för Markovkedjor och beslutsprocesser

Kursöversikt
Introduktion till förstärkningsinlärning
Lektion 01
- Tre paradigm inom maskininlärning
- Framgångshistorier om RL
- Element i ett RL-problem
- Introduktion till gymmet
- Träna din första RL-agent med RLlib
Enstegs-RL: flerarmade banditer
Lektion 02
- Multi-armed bandit-miljö
- Avvägningen mellan utforskning och utnyttjande
- Grundläggande metoder för att balansera utforskning och exploatering
- Avancerade metoder för att balansera utforskning och utnyttjande
- Introduktion till kontextuella banditproblem
- Ett praktiskt exempel på kontextuella banditer
- Djupa kontextuella banditer
- Utforskning med djupa kontextuella banditer
- Ett praktiskt exempel med djupa kontextuella banditer
Flernivå-förstärkningsinlärning
Lektion 03
- Introduktion till Markovkedjor
- Markov-belöningsprocess
- Markovbeslutsprocess
- Utvärdering och iteration av policyer
- Tabellbaserad Q-inlärning
- Praktiskt exempel på tabellbaserad Q-inlärning
- Djup Q-inlärning
- Använda RLlib för att träna ett Deep Q-nätverk
- Policybaserade metoder
- Använda RLib för att träna en PPO‑agent
Metoder för förstärkningsinlärning i verkliga tillämpningar
Lektion 04
- Hantering av glesa belöningar och svår utforskning
- Implementera belöningsformning
- Nackdelar med belöningsformning
- Att använda minne för att hantera partiell observerbarhet
- Lösa stateless Cartpole med LSTM
- Att överbrygga sim‑till‑verklighet‑klyftan
- Introduktion till multiagent-förstärkningsinlärning
- Träna flera agenter med RLib
- Multiagentförstärkningsinlärning
- Offline förstärkningsinlärning
- Slutsats och andra avancerade ämnen

Vem bör anmäla sig till det här programmet?
Blivande AI- och maskininlärningsingenjörer
Data scientists som vill utöka sina kunskaper inom förstärkningsinlärning
Programvaruutvecklare som är intresserade av intelligenta system och automatisering
Entusiaster inom robotik och spelutveckling
Studenter och yrkesverksamma som utforskar avancerade AI-koncept
För alla som är nyfikna på hur AI lär sig genom trial and error
Förutsättningar
- Grundläggande förståelse av Core Java-programmering
- Förtrogenhet med objektorienterade programmeringskoncept (OOP)
- Grundläggande kunskaper i att använda en IDE (t.ex. Eclipse eller Spring Tool Suite)
- Allmän förståelse för hur webbapplikationer fungerar är hjälpsam men inte nödvändig
Uttalanden
Licensiering och ackreditering
Denna kurs erbjuds i enlighet med Partnerprogramavtalet och uppfyller kraven i licensavtalet
Likabehandlingspolicy
Kandidater uppmuntras att kontakta AVC för vägledning och stöd under hela processen för att ordna anpassningar.
Vanliga frågor

Behöver du företagslösningar eller LMS-integration?
Hittade du inte kursen eller programmet som skulle passa för ditt företag? Behöver du LMS-integration? Skriv till oss! Vi löser det!
