Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/13767
Title: Κατηγοριοποίηση ιστοπαθολογικών εικόνων με χρήση διαφορετικών προ-εκπαιδευμένων συνελικτικών δικτύων
Other Titles: Categorization of histopathological images using different pre-trained convolutional neural networks
Authors: Φακωτάκης, Ορέστης
Keywords: Συνελικτικά νευρωνικά δίκτυα
Ιστοπαθολογικές εικόνες
Μηχανική μάθηση
Keywords (translated): Convolutional neural networks
Hispopathological images
Abstract: Η παρούσα διπλωματική εργασία, αναφέρεται στην κατηγοριοποίηση Ιστοπαθολογικών Εικόνων με τη χρήση διαφόρων μοντέλων Συνελικτικών Νευρωνικών Δικτύων. Σκοπός της εργασίας αποτέλεσε η μελέτη της χρήσης των νευρωνικών δικτύων και ιδιαίτερα των τεχνικών βαθιάς μάθησης, στην αυτόματη κατηγοριοποίηση (ταξινόμηση) ιατρικών εικόνων. Οι διαδικασίες ταξινόμησης που δοκιμάστηκαν βασίζονται σε τεχνικές βαθιών νευρωνικών δικτύων (DNN) και συγκεκριμένα των Συνελικτικών Νευρωνικών Δικτύων (ΣΝΔ). Σήμερα, τα δίκτυα αυτά εντάσσονται στο state-of-the-art των τεχνικών αναγνώρισης προτύπων και ιδιαίτερα στις τεχνικές που αφορούν ταξινόμηση ιατρικών δεδομένων (εικόνων). Τα ΣΝΔ υπάρχουν σε διάφορες αρχιτεκτονικές, με διαφορετικό βάθος, διαφορετικό πλήθος συνελίξεων, διαφορετικές συναρτήσεις ενεργοποίησης και πολλές άλλες παραμέτρους και τεχνολογίες. Στην παρούσα εργασία εξετάσαμε αρχιτεκτονικές που παρουσιάζουν ξεχωριστή συμπεριφορά στην ταξινόμηση ιατρικών δεδομένων. Από αυτές επιλέξαμε οκτώ τις οποίες δοκιμάσαμε κατά την πειραματική διαδικασία: (Vgg16, Vgg19, ResNet50, ResNet101, ResNet152, MobileNet, MobileNetV2, DenseNet121). Για την εκπαίδευση και τον έλεγχο των συστημάτων, ως ιατρικά δεδομένα, χρησιμοποιήθηκαν ιστοπαθολογικές εικόνες καρκίνου του μαστού οι οποίες ταξινομήθηκαν (διαχωρίστηκαν) σε θετικές (κακοήθη) και αρνητικές (καλοήθη), ως προς την ύπαρξη όγκου. Συγκεκριμένα, χρησιμοποιήθηκε η Ιστοπαθολογική Βάση Δεδομένων, καρκίνου του μαστού (BreaKHis) που περιέχει συνολικά 7.909 εικόνες, που συλλέχθηκαν από 82 ασθενείς: 58 με καρκίνο (5.429 κακοήθη δείγματα) και 24 με καλοήθη νεοπλασία (2.480 καλοήθη). Η ανάλυση των εικόνων είναι των 700x460 εικονοστοιχείων, RGB 3 καναλιών, βάθους 8-bit (κάθε κανάλι). Οι εικόνες στην βάση, είναι χωρισμένες (περίπου ισομερώς) ανάλογα με την μεγέθυνση του μικροσκοπίου σε τέσσερις κατηγορίες: 40x, 100x, 200x και 400x. Να σημειωθεί ότι όλα τα ΣΝΔ που χρησιμοποιήσαμε ήταν αρχικά εκπαιδευμένα (προεκπαίδευση) στον τεράστιο όγκο των δεδομένων της ImageNet. Τα οκτώ αυτά δίκτυα, εκπαιδεύτηκαν και ελέγχθηκαν σε τρεις πειραματικές διαδικασίες: μια χωρίς προεπεξεργασία, μία με προεπεξεργασία ZCA, και μια με προεπεξεργασία PCA. Τέλος, όλα τα πειράματα επαναλήφθηκαν τέσσερις φορές, που αντιστοιχούν στις διαφορετικές κατηγορίες δεδομένων εστίασης (40x, 100x, 200x, 400x). Έτσι, το σύνολο των πειραμάτων που διεξήχθησαν ήταν 96 πειράματα, και τα αποτελέσματα αναρτώνται σε 31 συγκεντρωτικούς πίνακες και 8 διπλά σχήματα. Τα οκτώ δίκτυα που ελέγξαμε συγκρίθηκαν μεταξύ τους και αβίαστα καταλήξαμε στο συμπέρασμα ότι δίκτυο DenseNet121 έχει την καλύτερη απόδοση. Ήταν κάτι αναμενόμενο, αφού αυτό αποτελεί εξέλιξη των δικτύων ResNet. Ενδιαφέρον ακόμα είχε το γεγονός ότι εικόνες με χαμηλή εστίαση έδωσαν καλύτερα αποτελέσματα από αυτές με υψηλή εστίαση. Στα πειράματα, όπου στα δεδομένα είχε προηγηθεί προεπεξεργασία με την τεχνική ZCA και την PCA τα αποτελέσματα δεν θα μπορούσαμε να τα χαρακτηρίσουμε αναμενόμενα. Η προεπεξεργασία με βάση την τεχνική ZCA έδωσε ελαφρώς καλύτερα αποτελέσματα από αυτήν της PCA. Συγκρίνοντας όμως τις δύο αυτές προσεγγίσεις με την χωρίς προεπεξεργασία προσέγγιση, διαπιστώσαμε σαφή υπεροχή της χωρίς προεπεξεργασία. Η εξήγηση που μπορούμε να δώσουμε για τα αποτελέσματα αυτά είναι ότι ο περιορισμένος όγκος των δεδομένων εκπαίδευσης και ελέγχου δεν επέτρεψε να αναδειχθεί η σημαντική συνεισφορά του σταδίου της προεπεξεργασίας.
Abstract (translated): This thesis has as a main subject the categorization of Histopathological Images, using various models of Convolutional Neural Networks (CNN). The purpose of this study was to examine the use of machine learning and, specifically, deep learning approaches, in the automatic categorization (classification) of medical images. The classification procedures are tested based on deep neural networks (DNN) and, specifically, Convolutional Neural Networks. Today, these networks belong to the scientific field of pattern recognition, constituting the state-of-the-art and they are techniques for classifying images of medical databases. CNNs exist in different architectures, with different depth, multitude of convolutions, activation functions and many other parameters and technologies. In the present work we examined architectures that exhibit distinctive behavior in the classification of medical data. From these we selected eight CNN which we tested during the experimental process: Vgg16, Vgg19, ResNet50, ResNet101, ResNet152, MobileNet, MobileNetV2 and DenseNet121. For training and testing the systems, histopathological images of breast cancer were used as medical data, which were classified into positive (malignant) and negative (benign), for tumor recognition. Specifically, the Histopathological Database Breast Cancer (BreaKHis) was used, containing 7,909 images, collected from 82 patients: 58 with cancer (5,429 malignancies) and 24 with benign neoplasms (2,480 benign). Image resolution is 700x460 pixels, RGB 3 channels, 8-bit depth. The images in the database are divided (approximately equally), depending on the magnification of the microscope into four categories: 40x, 100x, 200x and 400x. Note that all CNNs we used were initially trained (pre-trained), in the vast amount data of ImageNet database. These eight networks were trained and tested in three experimental procedures: one without pre-process, one with ZCA pre-preprocess, and one with PCA. Finally, all experiments were repeated four times, corresponding to the different categories of focus data (40x, 100x, 200x, 400x). Thus, the total number of experiments carried out was 96 experiments, and the results are posted in 31 confusion matrices and 8 figures. The eight networks that we tested were compared with each other and we easily came to the conclusion that DenseNet121 network has the best performance. It was expected, as this is an evolution of the ResNet networks. It was also interesting to note that low-focus images performed better results, than high-focus images. In the experiments, where the data had been previously preprocessed, with the ZCA technique and the PCA, the results could not be characterized as expected. The pre-processed based on the ZCA technique gave slightly better results than that of the PCA. However, comparing these two approaches with the non-pre-processed approach, we found a clear superiority without pre-processed. The explanation we can give for these results is that the limited volume of training and testing data did not allow the contribution of the preprocessing stage to emerge.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Nemertes_Fakotakis(com).pdf3 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.