Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/13162
Title: Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση
Other Titles: Fuzzy decision trees : presentation and experimental evaluation
Authors: Πετρόπουλος, Δημήτριος
Keywords: Μηχανική μάθηση
Ασαφής λογική
Ασαφή σύνολα
Δέντρα απόφασης
Ασαφής δέντρα απόφασης
Αλγόριθμος ID3
Ασαφής αλγόριθμος ID3
Συνάρτηση συμμετοχής
Εντροπία
Κέρδος πληροφορίας
Λήψη αποφάσεων
Εξαγωγή γνώσης
Νευρωνικά δίκτυα
Ασαφής εντροπία
Keywords (translated): Machine learning
Fuzzy logic
Fuzzy sets
Decision trees
Fuzzy decision trees
ID3 algorithm
Fuzzy ID3 algorithm
Membership function
Entropy
Information gain
Decision making
Export of knowledge
Neural networks
Fuzzy entropy
Abstract: Η παρούσα μεταπτυχιακή εργασία πραγματεύεται το γενικότερο πρόβλημα της ταξινόμησης, αξιοποιώντας τις τεχνικές της ασαφούς λογικής. Κύριος στόχος της είναι η ανάπτυξη μεθοδολογιών εξαγωγής ερμηνεύσιμων μοντέλων ταξινόμησης για την αντιμετώπιση προβλημάτων που χαρακτηρίζονται από υψηλή διαστατικότητα του χώρου των χαρακτηριστικών. Για τον σκοπό αυτό θα υλοποιηθούν και θα συγκριθούν ως προς την απόδοση και την αποτελεσματικότητά τους, τα ασαφή δέντρα απόφασης τα οποία αντιμετωπίζουν αποτελεσματικά ένα ευρύ φάσμα προβλημάτων ταξινόμησης του πραγματικού κόσμου αλλά και τα κλασσικά δέντρα απόφασης, τα οποία αποτελούν μια από τις πιο ευρέως χρησιμοποιούμενες πρακτικές μεθόδους για την εξαγωγή γνώσης και συμπερασμάτων χρησιμοποιώντας τον επαγωγικό συλλογισμό. Ο αλγόριθμος ID3 ο οποίος αρχικά προτάθηκε από τον Quinlan, χρησιμοποιεί την θεωρία πληροφορίας για τον προσδιορισμό του χαρακτηριστικού με το μεγαλύτερο κέρδος πληροφορίας. Παρόλα ο αλγόριθμος ID3 είναι αρκετά ασταθής, όταν έχει να αντιμετωπίσει σύνολα δεδομένων εκπαίδευσης με μικρές διαταραχές. Ο ασαφής αλγόριθμος ID3 βελτιώνει τις αστάθειες αυτές, λόγω της ελαστικότητας του φορμαλισμού των ασαφών συνόλων. Οι δύο παραπάνω μεθοδολογίες εμφανίζουν πλεονεκτήματα και μειονεκτήματα ανάλογα με την διαστατικότητα του χώρου εισόδου καθώς και την ισορροπία μεταξύ ακρίβειας και ταξινόμησης των συνόλων δεδομένων. Ιδιαίτερο χαρακτηριστικό των προτεινόμενων μεθοδολογιών είναι η δημιουργία απλών και εύληπτων μοντέλων ταξινόμησης, βασισμένα σε κανόνες οι οποίοι δεν διαφέρουν καθόλου από τον τρόπο με τον οποίο η ανθρώπινη σκέψη οδηγείτε σε συμπερασματικές προτάσεις. Οι προτεινόμενοι ταξινομητές αλλά και τα νευρωνικά δίκτυα θα εφαρμοστούν σε διάφορα σύνολα δεδομένων του πραγματικού κόσμου προκειμένου να μελετηθεί ο τρόπος με τον οποίο ανταποκρίνονται στα σύνολα αυτά και θα γίνει μια συγκριτική μελέτη προκειμένου να προσδιορίσουμε εάν η εφαρμογή της ασαφούς λογικής στα κλασσικά δέντρα απόφασης έχει ως αποτέλεσμα την εξαγωγή γνώσης η οποία μας προσφέρει μεγαλύτερη ακρίβεια.
Abstract (translated): This master thesis studies the general problem of classification, using fuzzy logic techniques. Its main subject is to develop methodologies to derive interpretable classification models in order to deal with problems that characterized by high dimensionality of the attribute space. For this purpose, fuzzy decision trees will be implemented and compared in terms of their efficiency and effectiveness, which effectively tackle a wide range of real-world classification problems. On the other hand classical decision trees, which are one of the most widely used practical methods for drawing knowledge and conclusions using inductive reasoning, will be implemented. The ID3 algorithm is introduced by Quinlan, using information theory to determine the most informative attribute. ID3 has highly unstable classifiers with respect to minor perturbation in training data. However, the ID3 algorithm is quite unstable when it comes to handling training data sets with minor disorders. The fuzzy ID3 algorithm improves these instabilities due to the elasticity of fuzzy sets formalism. The two above methodologies have advantages and disadvantages depending on the dimensionality of the input space as well as the balance between accuracy and classification of the data sets. The proposed methodologies characterized by the creation of simple and comprehensible classification models based on rules that are no different from the way in which human thought leads you to conclusions. The proposed classifiers but also the neural networks will be applied to various real-world data sets. Subsequently a comparative study will be carried out in order to determine whether applying fuzzy logic to classical decision trees results in knowledge extraction which offer us greater accuracy.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΜΔΕ)



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.