Ομιλία Τετάρτη 14 Φεβρουαρίου – Γενικό Σεμινάριο Τμήματος
Η επόμενη ομιλία θα διεξαχθεί διαδικτυακά.
Τα στοιχεία της ομιλίας έχουν ως εξής:
Παρουσίαση Διδακτορικής Διατριβής
Ημερομηνία: Τετάρτη 14 Φεβρουαρίου 2024. Ώρα: 14:00-15:00.
Ομιλητής: κ. Χρήστος Αριδάς, Υποψήφιος Διδάκτορας του Τμήματος Μαθηματικών, Πανεπιστήμιο Πατρών
Τίτλος ομιλίας: Υβριδικές Μέθοδοι Μηχανικής Μάθησης με Εφαρμογές σε μη Ισορροπημένα
και Μερικώς Ετικετοποιημένα Σύνολα ∆εδομένων
Περίληψη της ομιλίας:
Η παρούσα διατριβή εξετάζει ενδελεχώς τρεις διακριτικές θεματικές περιοχές,
οι οποίες συμβάλλουν στον κύριο στόχο της βελτίωσης της απόδοσης των
μοντέλων μηχανικής μάθησης. Το κύριο θέμα που τα ενώνει είναι η ανάπτυξη
και εφαρμογή υβριδικών προσεγγίσεων, οι οποίες ενσωματώνουν διάφορες
τεχνικές για την αποδοτικότερη προγνωστική ικανότητα.
Η αρχική θεματική περιοχή επικεντρώνεται σε στρατηγικές τροποποιήσεις σε
σύνολα δεδομένων εκπαίδευσης, με στόχο τη βελτίωση της απόδοσης των
μοντέλων. Σε μελέτη που διενεργήθηκε, προτάθηκε μια λύση η οποία επεκτείνει
τον χώρο χαρακτηριστικών ενός ομοιογενούς συνόλου ταξινομητών με την
ενσωμάτωση προγνωστικής πληροφορίας από ένα μοντέλο μηχανικής μάθησης.
Επιπλέον, ενσωματώθηκε τεχνική επιλογής παραδειγμάτων, για τη συμπίεση και
εξάλειψη θορύβου του συνόλου εκπαίδευσης, με απώτερο στόχο την βελτίωση της
προγνωστικής ακρίβειας αλλά και τη μείωση της πολυπλοκότητας της
αποθήκευσης των δεδομένων σε τοπικά εφαρμοσμένους ταξινομητές. Πειράματα
που διενεργήθηκαν σε πληθώρα συνόλων δεδομένων κατέδειξαν ότι η ενσωμάτωση
αυτών των στρατηγικών σημαντικά βελτιώνει την απόδοση, υπερβαίνοντας τις
αρχικές προσεγγίσεις και συναφείς τεχνικές.
Στη δεύτερη θεματική περιοχή, η έρευνα επικεντρώνεται στην αντιμετώπιση των
προκλήσεων στη μηχανική εκμάθηση όταν το μοντέλο καλείται να αξιοποιήσει
παραδείγματα χωρίς ετικέτα παράλληλα με τα παραδείγματα με ετικέτα. Γίνεται
μια ολοκληρωμένη ανασκόπηση των προσεγγίσεων που χρησιμοποιούν ταυτόχρονα
παραδείγματα με και χωρίς ετικέτα για την βελτίωση της εκάστοτε εργασίας. Η
συνεισφορά μας περιλαμβάνει την προσαρμογή ενός τοπικού ταξινομητή στο
ημιεποπτευόμενο πλαίσιο. Αναπτύχθηκε μεθοδολογία η οποία αυξάνει το
διαθέσιμο σύνολο προταξινομημένων παραδειγμάτων, ενσωματώνοντας
παραδείγματα υψηλής εμπιστοσύνης τα οποία έχουν φίλτρο επιλογής
παραδειγμάτων.
Η τρίτη θεματική περιοχή επικεντρώνεται στην αντιμετώπιση του προβλήματος
της μη ισορροπίας στα σύνολα δεδομένων κατά την εκτέλεση εργασιών
ταξινόμησης. Εδώ χρησιμοποιούνται υβριδικές λύσεις για να αντιμετωπιστούν
οι δυσκολίες που προκύπτουν. Οι προτεινόμενες λύσεις περιλαμβάνουν μια
υβριδική προσέγγιση υποδειγματοληψίας, χρησιμοποιώντας ενεργητική επιλογή
παραδειγμάτων επαναληπτικά. Στην πειραματική μελέτη, χρησιμοποιήθηκε ο
απλός ταξινομητής Bayes σε ένα ποικίλο σύνολο μη ισορροπημένων δεδομένων.
Επιπλέον, εξερευνηθηκε η εφαρμογή τυχαίων διαδικασιών επαναδειγματοληψίας
στη στρατηγική One-vs-Rest για να αντιμετωπιστεί το πρόβλημα που προκύπτει
κατά την εκπαίδευση δυαδικών ταξινομητών σε σύνολα δεδομένων πολλαπλών
κλάσεων. Τέλος, παρουσιάζεται το imbalanced-learn, μια βιβλιοθήκη γραμμένη
στη γλώσσα προγραμματισμού Python που σχεδιάστηκε για την αντιμετώπιση
θεμάτων που προκύπτουν από τη χρήση μη ισορροπημένων συνόλων δεδομένων σε
εργασίες μηχανικής μάθησης.
Join Zoom Meeting
https://upatras-gr.zoom.us/j/9880043…NPcDZ3dzJ5Zz09
Meeting ID: 988 0043 8925
Passcode: 840258