Please use this identifier to cite or link to this item:
Title: Έρευνα και ανάπτυξη συστήματος αναγνώρισης και μείωσης της μεροληψίας σε μεθόδους μηχανικής μάθησης
Other Titles: Research and development a system of bias identification and mitigation in machine learning methods
Authors: Αρβανιτάκης, Σπυρίδων
Keywords: Μηχανική μάθηση
Μετριασμός προκατάληψης
Τεχνητή νοημοσύνη
Keywords (translated): Machine Learning
Bias mitigation
Artificial Inteligence
Deep learning
Abstract: Η μηχανική μάθηση όπως αναφέρεται και σε αυτή την διπλωματική εργασία είναι ένας τομέας που ολοένα και περισσότερο εισβάλλει στην καθημερινότητα των ανθρώπων. Μπορούμε πλέον να την βρούμε σε πολλές εφαρμογές έχοντας κυρίαρχο ρόλο στην λήψη των αποφάσεων σε διάφορα ζητήματα. Οι αποφάσεις αυτές επειδή βασίζονται σε αλγοριθμικά μοντέλα μάθησης μπορεί να είναι άδικες, αναπαράγοντας προκαταλήψεις στα δεδομένα που έχουμε. Επειδή ζούμε στην εποχή των μεγάλων δεδομένων αρκετές βιομηχανίες αναζητούν νέους τρόπους και αλγορίθμους για να επεξεργαστούν τα δεδομένα αυτά διότι από μόνα τους δημιουργούν προκατειλημμένες υποομάδες με αποτέλεσμα να έχουμε άδικα αποτελέσματα. Ακόμα οι τεχνικές μηχανικής μάθησης παρατηρούμε ότι υπάρχουν σε ολοένα και περισσότερους τομείς. Σε αυτή την διπλωματική εργασία κάνουμε μια αναφορά σε βασικές έννοιες όπως είναι η Τεχνητή νοημοσύνη, η Μηχανική μάθηση και το Deep learning. Στην συνέχεια αναφερόμαστε στον μετριασμό της προκατάληψης σε διάφορες κατηγορίες αλγορίθμων όπου αυτός είναι και ο σκοπός της συγγραφής του συγκεκριμένου εγγράφου. Αναφερόμαστε στους διάφορους αλγορίθμους που μπορούμε να χρησιμοποιήσουμε για να μπορέσουμε να μειώσουμε την προκατάληψη. Για τον σκοπό αυτό έχει δημιουργηθεί μια εφαρμογή η οποία χρησιμοποιεί μια σειρά από διάφορους αλγορίθμους με σκοπό να καταφέρουμε να εξάγουμε τις καλύτερες δυνατές αποφάσεις για τα δεδομένα μας. Τα δεδομένα που χρησιμοποιούμε προέρχονται από το αποθετήριο του UCI και πιο συγκεκριμένα αναφέρονται στο σύνολο δεδομένων Adult το οποίο αποτελείται από 14 μεταβλητές και τα χαρακτηριστικά του δεν χρησιμοποιούν την ομοιόμορφη κατανομή. Τέλος, η παρουσίαση των αποτελεσμάτων γίνεται με γραφικές παραστάσεις οι οποίες παρουσιάζουν πόσο κατάφερε ο κάθε αλγόριθμος να μετριάσει την προκατάληψη των δεδομένων μας και πόσο κοντά βρίσκεται η επεξεργασία που κάναμε στην σωστή λήψη των αποτελεσμάτων.
Abstract (translated): Machine learning as mentioned in this thesis is an area that is increasingly invading people's daily lives. It is now found in many applications having a dominant role in decision making on various issues. These decisions, because they are based on algorithmic learning models, can be unfair reproducing biases in the data we have. Because we live in an age of big data, many industries are looking for new ways and algorithms to elaborate on this data because by themselves they create biased subgroups, resulting in unfair results. Still machine learning techniques are observed to exist in more and more areas. In this thesis, we make a reference to basic concepts such as artificial intelligence, machine learning and Deep learning. In the following, we refer to the mitigation of bias in various categories of algorithms where this is the purpose of writing this particular thesis. We are referring to the various algorithms that we can use in order to reduce bias. For the purpose mentioned, an application has been created which uses a series of various algorithms in order to manage to extract the best possible decisions for our data. The data we use comes from the repository of UCI and more specifically refers to the Adult dataset, which consists of 14 variables and its attributes do not use the uniform distribution. Finally, the presentation of the results is done with graphs that show how each algorithm managed to mitigate the bias of our data and how close the processing we made to the correct reception of the results.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Διπλωματική εργασία.pdf2.32 MBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.