Featured image

Errefortzu bidezko ikaskuntza eta Ikasketa Sakona erabakiak hartzeko sistemak diseinatzeko

Errefortzu bidezko ikaskuntza (Reinforcement Learning) ikasketa automatikoaren (Machine Learning) arlo bat da, "saiatze eta hutsegite" bidez ikastearen ideian oinarritzen dena. Errefortzu bidezko ikaskuntza emaitza onak ematen ari da ingurune konplexuetan. “Go” joko txinatarra (joko taularen 10170 konfigurazio baino gehiago ditu) edo helikoptero baten hegaldiaren kontrola erreferentziazko bi adibide dira. Gidatze autonomoan (auto/robot mugikorra), marketin eta merkataritza elektronikoan gomendatzeko sistema automatizatuetan, hezkuntza tresna pertsonalizatuetan, finantzetan edo robotikan ere aplikatzen dira teknika horiek. Sare neuronal sakonek eta simulagailu aurreratuek eragin handia izan dute konplexutasun horri aurre egin ahal izateko.

Ikastaro honetan errefortzu bidezko ikaskuntzaren oinarrizko kontzeptuak jorratuko ditugu Python eta Pytorch programazio lengoaia eta edonorentzat eskuragarri dauden Googleren plataforma irekiak (Google Colab) erabilita.

 

Nori zuzenduta:

Programazioaz (ahal izanez gero, Python) eta oinarrizko estatistikaz ezagutzak dituzten eta erabakiak hartzeko adimen artifizialean oinarritutako sistemak ezarri nahi dituzten edozein jarduera sektoretako profesional teknikoak.

 

Programa:

  • M0 - Programazioaren sarrera (Python eta Pythorch)
  • M1 - Kasu errealak
  • M2 - Errefortzu bidezko ikaskuntzarako sarrera
  • M3 - Errefortzu bidezko ikaskuntzaren oinarriak formalizatzea
  • M4 - Programazio dinamikoaren bidez ikastea
  • M5 - Sistema eredurik gabeko ikastea
  • M6 - Sistema eredurik gabeko kontrolatzaileen diseinua
  • M7 - Hurbilketa funtzioen erabilera sare neuronalekin (Deep Learning)
  • M8 - Politikan oinarritutako kontrolatzaileak
  • M9 - Aktore kritikoetan oinarritutako kontrolatzaileak
  • M10 -Ikaskuntza prozesuaren hiperparametroen doikuntza automatikorako estrategiak