Reinforcement learning
Transcript:
Mijn naam is Fabian Akkerman, ik ben promovendus aan de Universiteit Twente. Ik doe onderzoek naar reinforcement learning. Dat is een vorm van AI. Ik doe dit onderzoek met name in de logistiek, dus de toepassing van reinforcement learning in de logistiek. Met name een toepassing en een focus op transport. Reinforcement learning wordt met name gebruikt voor sequentiële beslisproblemen. Dus er zijn problemen waar we een beslissing nemen, maar we weten nog niet alle toekomstige informatie. Je moet een beslissing nemen. Vervolgens krijgen we informatie binnen, en vervolgens moeten we weer opnieuw een beslissing nemen. Nou dat is iets wat we heel veel terug zien in de logistiek. dus we moeten een beslissing nemen maar we hebben niet alle informatie. Pas na de beslissing komt er nieuwe informatie binnen. Dus ik denk dat reinforcement learning heel krachtig kan zijn voor dynamische problemen in de logistiek. Dynamische problemen kunnen bijvoorbeeld het routeren van voertuigen zijn, waarbij we tijdens het rijden te horen krijgen dat er een nieuwe klant is. 'Kunnen we die nog misschien in de route stoppen?' Met reinforcement learning kunnen we bepalen of we die klant gaan toevoegen of we die klant toch aan een andere route gaan toevoegen, of misschien morgen doen. Andere dynamische problemen zijn bijvoorbeeld het inladen van containers op een schip. We weten nu van deze set met containers hebben we, die kunnen we nu inladen. Maar het kan ook zijn dat er morgen nog een een hele set met meer containers binnen komt. Dus misschien moeten we gewoon even wachten met een bepaalde set zodat we er meer tegelijk kunnen doen en meer kosten kunnen besparen. Dat zijn twee voorbeelden van dynamische problemen in de logistiek waar reinforcement learning heel krachtig voor kan zijn..