Τι είναι η Μηχανική Μάθηση; (Machine Learning)

Τι είναι η Μηχανική Μάθηση; (Machine Learning)


Επιμέλεια: Κωνσταντίνος Κίτρου, IT Manager - Computer Operator /Καθηγητής Τομέα Πληροφορικής & Ηλεκτρονικών / MSc Medical Informatics

Ο ανθρώπινος νους επιχειρεί να κατανοήσει το περιβάλλον του μέσω της παρατήρησης και δημιουργώντας μία απλοποιημένη εκδοχή που ονομάζεται "μοντέλο". Η δημιουργία ενός τέτοιου μοντέλου, ορίζεται ως "επαγωγική μάθηση", ενώ γενικότερα η διαδικασία ονομάζεται "επαγωγή". Επιπλέον, ο άνθρωπος χαρακτηρίζεται από την ικανότητα που έχει να οργανώνει και να συσχετίζει τις εμπειρίες και τις παραστάσεις που αποκομίζει , δημιουργώντας ολοκαίνουριες δομές που ονομάζονται "πρότυπα".  Η δημιουργία, συνεπώς, μοντέλων ή προτύπων από ένα σύνολο δεδομένων ονομάζεται Μηχανική Μάθηση.

Τα τελευταία χρόνια έχουν αναπτυχθεί πολλές τεχνικές Μηχανικής Μάθησης, οι οποίες χρησιμοποιούνται ανάλογα με τη φύση του προβλήματος και εμπίπτουν σε ένα από τα δύο παρακάτω είδη:

  • Μάθηση με Επίβλεψη (Supervised Learning)
  • Μάθηση χωρίς Επίβλεψη (Unsupervised Learning)

Στην περίπτωση της Μηχανικής Μάθησης με Επίβλεψη το σύστημα που σχεδιάζουμε και προγραμματίζουμε καλείται να "μάθει" μία έννοια ή συνάρτηση από ένα σύνολο δεδομένων (Βάση Γνώσης), η οποία αποτελεί περιγραφή ενός μοντέλου. Ο λόγος που χαρακτηρίζεται ως μάθηση "με επίβλεψη" είναι επειδή θεωρείται ότι υπάρχει κάποιος "επιβλέπων", ο οποίος παρέχει τη σωστή τιμή εξόδου της συνάρτησης, για τη Βάση Γνώσης που αναλύουμε.

Αντιθέτως, στη Μάθηση χωρίς Επίβλεψη, το σύστημα "οφείλει" μόνο του να ανακαλύψει συσχετίσεις ή ομάδες σε ένα σύνολο δεδομένων, αναπτύσσοντας πρότυπα, χωρίς να είναι εκ των προτέρων γνωστό αν όντως υπάρχουν, πόσα και ποια είναι.

Μάθηση Με Επίβλεψη

Σε αυτήν την κατηγορία Μηχανικής Μάθησης το σύστημα πρέπει να "μάθει" με επαγωγική μέθοδο μια συνάρτηση που ονομάζεται "συνάρτηση στόχος" (target function) και που αποτελεί έκφραση του μοντέλου που περιγράφει τα δεδομένα. Η συνάρτηση στόχος χρησιμοποιείται για την πρόβλεψη της τιμής μιας μεταβλητής, που ονομάζεται εξαρτημένη μεταβλητή ή μεταβλητή εξόδου.

Στη Μάθηση με Επίβλεψη εντάσσονται δύο κατηγορίες προβλημάτων (learning tasks) εξόρυξης γνώσης: Τα προβλήματα ταξινόμησης και τα προβλήματα παρεμβολής. Η ταξινόμηση (classification) αφορά στη δημιουργία μοντέλων πρόβλεψης διακριτών τάξεων, όπως για παράδειγμα η ομάδα αίματος, ενώ η παρεμβολή (regression) αφορά στη δημιουργία μοντέλων πρόβλεψης αριθμητικών τιμών.

Οι κυριότερες τεχνικές Μηχανικής Μάθησης με επίβλεψη είναι:

  • Μάθηση Εννοιών (Concept Learning)
  • Δέντρα Απόφασης (Decision Trees)
  • Μάθηση Κανόνων (Rule Learning)
  • Μάθηση κατά Περίπτωση (Instance Based Learning)
  • Μάθηση κατά Bayes
  • Γραμμική Παρεμβολή (Linear Regression)
  • Νευρωνικά Δίκτυα (Neural Networks)
  • Μηχανές Διανυσμάτων Υποστήριξης (Support Vector Machines)

Ένα σύστημα Μηχανικής Μάθησης απαιτεί μία γλώσσα αναπαράστασης του κόσμου του προβλήματος, δηλαδή των υποθέσεων. Επιπροσθέτως, απαιτείται ένα σύνολο από τελεστές (operators) οι οποίοι θα επιτρέψουν στο σύστημα να οδηγηθεί σε μία γενίκευση (επαγωγή), έναν ευριστικό κανόνα ή ένα πλάνο που ικανοποιεί τους στόχους του.

Μη Επιτηρούμενη Μάθηση

Σε αυτήν την κατηγορία Μηχανικής Μάθησης το Σύστημα έχει ως στόχο να ανακαλύψει "συσχετίσεις" και "ομάδες" από τη Βάση Γνώσης που του παρέχεται, βασιζόμενο αποκλειστικά και μόνο στις ιδιότητές τους. Σαν αποτέλεσμα (έξοδος) προκύπτουν πρότυπα (περιγραφές), κάθε ένα από τα οποία περιγράφει ένα μέρος από τα δεδομένα. Χαρακτηριστικά παραδείγματα προτύπων πληροφόρησης στη Μη Επιτηρούμενη Μάθηση (Μηχανική Μάθηση χωρίς Επίβλεψη) είναι (α) οι Κανόνες Συσχέτισης (association rules) και (β) οι Ομάδες (clusters), οι οποίες προκύπτουν από τη διαδικασία της ομαδοποίησης (clustering).