Περίληψη διδακτορικής διατριβής - Μποτσάϊ Ενκελέντα

"Τεχνικές Μηχανικής Μάθησης και οπτικοποίησης σε δεδομένα μεγάλης κλίμακας"

H παρούσα διδακτορική διατριβή επιχειρεί την μελέτη, ανάλυση, ανάπτυξη εννοιών και τεχνικών MηχανικήςMάθησης (MachineLearning), Βαθιάς Μάθησης (DeepLearning) και Οπτικοποίησης (Visualization), σε δεδομένα μεγάλου όγκου (BigData), έχοντας υπόψη συσκευές με χαμηλή υπολογιστική ισχύ (όπως για παράδειγμα φορητές συσκευές). Επιπροσθέτως, για την επεξεργασία τους θα εφαρμοστούν τεχνικές όπως τα ΣυνελικτικάΝευρωνικά Δίκτυα (CNNs) με στόχο την εξαγωγή χρήσιμης πληροφορίας. Τόσο τα επεξεργασμένα δεδομένα, όσο και η ερμηνεία τους, θα μελετηθούν για την κατανόηση ή αντίληψη της πληροφορίας. Οι στόχοι της προτεινόμενης διδακτορικής διατριβής είναι:
i. Συλλογή – Αποθήκευση – Προεπεξεργασία: Θα μελετηθούν και υλοποιηθούν βέλτιστες τεχνικές συλλογής και αποθήκευσης μεγάλου όγκου δεδομένων. Η αποθήκευση των δεδομένων θα γίνεται είτε τοπικά, εφόσον έχουν εφαρμοστεί σε αυτά τεχνικές προ-επεξεργασίας (Pre-processing), είτε απομακρυσμένα σε μη σχεσιακή βάση δεδομένων. Για την βέλτιστη και αποδοτικότερη αποθήκευση τους, θα μελετηθούν πλαίσια λογισμικού μεγάλου όγκου δεδομένων, π.χ. το SparkApache [8].
ii. Σχεδιασμός-Υλοποίηση Συμπιεσμένου Βαθέως Νευρωνικού Μοντέλου: Μοντέλα από CNNs και RNNs (RecurrentNeuralNetworks), θα μελετηθούν, σχεδιαστούν, υλοποιηθούν και αξιολογηθούν, προκειμένου να εξαχθεί το τελικό μοντέλο του συστήματος, έτσι ώστε να επιτευχθεί:
1. Αποτελεσματικότερη κατανεμημένη εκπαίδευση (More efficient distributed training)
2. Λιγότερη υπολογιστική επιβάρυνση κατά την εξαγωγή νέων μοντέλων (Lessover headwhenexportingnewmodelstoclients)
3. Εφικτή εγκατάσταση του αναπτυχθέντος μοντέλου σε συσκευές με χαμηλή υπολογιστική ισχύ.
iii. Τεχνικές Επαύξησης Δεδομένων: Θα αναπτυχθούν τεχνικές επαύξησης του συνόλου των δεδομένων (dataaugmentation), βασισμένες στη δημιουργία τεχνητών δειγμάτων αισθητήρων κίνησης, με στόχο την αύξηση της απόδοσης ταξινόμησης (classification) του μοντέλου σε ολιγάριθμα σύνολα δεδομένων.
iv. Οπτικοποίηση: Χρήση εργαλείων οπτικοποίησης (VisualizationsTools) για τα αποτελέσματα και την ερμηνεία τους (π.χ. διαδραστικά γραφήματα ή δυναμικοί πίνακες).