Περίληψη διδακτορικής διατριβής ΑΓΓΕΛΟΠΟΥΛΟΣ ΓΕΩΡΓΙΟΣ

Ο στόχος της διδακτορικής διατριβής είναι η ανάπτυξη αλγορίθμου τεχνητής ευφυίας, αυτόματης εκμάθησης της στρατηγικής παίκτη, στο επιτραπέζιο παιχνίδι Dominion, χρησιμοποιώντας τεχνικές βαθιάς μάθησης (νευρωνικών δικτύων). Θα εξεταστεί επίσης κατά πόσο μπορεί να επεκταθεί στη βαθιά μάθηση, η επέκταση της μεθόδου επιλογής καταστάσεων Forced ε-greedy, η οποία όταν εφαρμόστηκε στο ίδιο παιχνίδι με την μέθοδο Q Learning, επιτάχυνε την διαδικασία της εκπαίδευσης και βελτίωσε τα τελικά ποσοστά επιτυχίας. Κατά την διάρκεια των πειραμάτων θα προσπαθήσουμε να αναπτύξουμε και άλλες τεχνικές με σκοπό την βελτιστοποίηση της εκπαίδευσης, τόσο σε επίπεδο ταχύτητας αλλά και αποτελεσμάτων.