Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/14159
Title: Τεχνικές μηχανικής μάθησης για κατηγοριοποίηση βιοϊατρικών πολυδιάστατων σημάτων
Other Titles: Machine learning techniques for classification of biomedical multidimensional signals
Authors: Βλαχοσπύρος, Σπυρίδων
Keywords: Μηχανική μάθηση
Μεγάλου όγκου δεδομένα
Μάθηση πολλαπλών στιγμιότυπων
Τανυστική αποδόμηση
Επεξεργασία σημάτων
Εξαγωγή χαρακτηριστικών
Keywords (translated): Machine learning
Big data
Feature extraction
Tensor decomposition
Multi instance learning
Abstract: Τα τελευταία χρόνια λόγω της τεχνολογικής προόδου και ανάπτυξης της επιστήμης των υπολογιστών κατέστη δυνατή η ύπαρξη και παρατήρηση τεράστιων συλλογών δεδομένων, η επεξεργασία των οποίων οδηγεί πολλές φορές σε αστείρευτη γνώση. Έτσι και στον τομέα της υγείας τα δεδομένα υπάρχουν και η επεξεργασία τους μπορεί να οδηγήσει σε μεγάλη βελτίωση των συστημάτων υγείας, σε έγκαιρες διαγνώσεις ασθενειών, σε ανάλυση της κλινικής εικόνας των ασθενών και κατά συνέπεια σε αύξηση του προσδόκιμου ζωής. Στόχος της παρούσας διπλωματικής εργασίας είναι η παρατήρηση διαφόρων τεχνικών επεξεργασίας βιοϊατρικών δεδομένων. Οι τεχνικές αυτές χωρίστηκαν σε δύο μεγάλες κατηγορίες. Πρώτα, αναλύθηκαν τεχνικές μηχανικής μάθησης για την ταξινόμηση των δεδομένων. Στη συνέχεια, παρουσιάστηκαν τεχνικές διαχείρισης και μείωσης του όγκου των δεδομένων. Πέραν του θεωρητικού υποβάθρου που αναπτύχθηκε και αναλύθηκε, δημιουργήθηκε σε πειραματικό επίπεδο ένα μοντέλο πρόβλεψης της κλινικής εικόνας ηλικιωμένων μέσω της κατηγοριοποίησης βιοϊατρικών σημάτων καθώς και διαχείρισης του όγκου τους. Τα δεδομένα αυτά συλλέχθηκαν στο πλαίσιο ενός ευρωπαϊκού προγράμματος και περιείχαν δεδομένα για το κλινικό προφίλ των ηλικιωμένων μέσω της χρήσης ενός γιλέκου με τοποθετημένους αισθητήρες μέτρησης καρδιακού και πνευμονικού ρυθμού. Το μοντέλο κλήθηκε να ταξινομήσει τα δείγματα ως προς την ευθραυστότητά τους (Frailty) σε τρεις κατηγορίες: frail, pre-frail, no-frail. Για την επίτευξη αυτού του σκοπού αναπτύχθηκε μια μέθοδος η οποία στηρίχθηκε στη Μάθηση Πολλαπλών Στιγμιότυπων (Multi Instance Learning - MIL). Τα σήματα αναλύθηκαν με τεχνικές εξαγωγής χαρακτηριστικών με κυλιόμενα παράθυρα (sliding windows) και όχι στην «ωμή» (raw) μορφή τους, με σκοπό τη μείωση του όγκου των δεδομένων, και αποθηκεύτηκαν σε έναν τανυστή. Τέλος, για να επιτευχθεί η διαστατική μείωση των δεδομένων χρησιμοποιήθηκαν τεχνικές τανυστικής αποδόμησης φτάνοντας έτσι στα τελικά δεδομένα που χρησιμοποιήθηκαν σε αλγόριθμους τόσο μηχανικής μάθησης όσο και αλγόριθμων πολλαπλών στιγμιοτύπων.
Abstract (translated): In recent years, due to the technological progress of computer science, it has become possible to have and observe huge data sets. The processing of which often leads to inexhaustible knowledge. Thus, in the field of health, the data also exist and their processing can lead to a great improvement of the health systems, to the initial diagnoses of patients, to the analysis of the clinical picture of the patients and consequently to an increase in the life expectancy. The aim of this thesis is to observe various biomedical data processing techniques. These techniques were divided into two major categories. Machine learning techniques for data classification were first analyzed. Then, data volume management techniques as well as their dimensional reduction were presented. In addition to the theoretical background that was developed and analyzed, an experimental model for predicting the clinical picture of the elderly was created through the categorization of biomedical signals as well as their tumor management. This data was collected as part of a European program and contained data on the clinical profile of the elderly using a vest with sensors measuring heart and lung rate. The model was asked to classify the samples in terms of their Frailty into three categories: frail, pre-frail, no-frail. To achieve this goal a method was developed which was based on Multi Instance Learning (MIL). The signals were analyzed by extracting statistical features from them using sliding windows techniques and not their raw form, in order to reduce the volume of data. Then they were stored in a tensor. Finally, to achieve dimensional reduction to the data, tensor decomposition techniques were used, thus reaching the final data used in both machine learning and multiple instance learning algorithms.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Vlachospyros Thesis.pdf2.56 MBAdobe PDFView/Open
codes.rar19.18 kBrarView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.