Περίληψη διδακτορικής διατριβής Αθανάσιου Ψάλτη

Ομόσπονδη, πολυπρακτορική, βαθιά και ενισχυμένη μάθηση

Στο πλαίσιο αυτής της Διατριβής, θα αναπτυχθούν νέες τεχνικές βαθιάς μάθησης για τον αποτελεσματικό εντοπισμό των περιοχών του χώρου για τις οποίες ένας πράκτορας (agent) δεν διαθέτει αρκετή πληροφορία, και την αναζήτηση δεδομένων που καλύπτουν αυτό το κενό γνώσης. Ειδικότερα, στο πλαίσιο της Διατριβής θα αξιοποιηθούν αλγόριθμοι ενεργής μάθησης ενίσχυσης (π.χ. Deep Q Learning, Actor-Critic, Policy Gradient) προκειμένου να αυξηθεί η απόδοση και να επιταχυνθεί η διαδικασία εκπαίδευσης (μειώνοντας τον απαιτούμενο αριθμό δειγμάτων κατάρτισης) των ανεπτυγμένων αλγορίθμων μηχανικής μάθησης (π.χ. ανίχνευση αντικειμένων, αναγνώριση δράσης κ.λπ.). Η επικοινωνία μεταξύ των πρακτόρων θα επιτευχθεί μέσω ενός πλαισίου ομόσπονδης μάθησης - ΟΜ (Federated Learning - FL), δηλαδή μέσω ενός μοντέλου αποκεντρωμένης εκπαίδευσης που επιτρέπει τη συμμετοχή κόμβων επεξεργασίας, η οποία στη βάσης της επιτρέπει τη δημιουργία πολιτικών υψηλής ποιότητας για τους πράκτορες υπό την προϋπόθεση ότι τα δεδομένα κατάρτισης δεν διαμοιράζονται μεταξύ τους. Επιπλέον, το πλαίσιο ΟΜ θα λειτουργεί ως γενικός όρος για κεντρικές στρατηγικές συντονισμού σε περιβάλλον πολλαπλών πρακτόρων, αξιοποιώντας παράλληλα βελτιωμένους τοπικούς πόρους σε κάθε συσκευή. Επιπλέον, ένα σύνολο ομόσπονδων αλγορίθμων ανάλυσης (π.χ. διαφορικά ιδιωτικά ομόσπονδα GANs) θα αξιοποιηθεί για να αποκαλύψει μοτίβα σε αποκεντρωμένα σύνολα δεδομένων που είναι δύσκολο να αναγνωριστούν από τα υπάρχοντα μοντέλα.