Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/12106
Title: Σχεδιασμός και υλοποίηση αλγοριθμικής ανάλυσης και οπτικοποίησης δικτύων με χρήση τεχνολογιών cloud computing
Authors: Αλεξόπουλος, Γεώργιος
Keywords: Οπτικοποίηση
Παραλληλοποίηση
Keywords (translated): Visualization
Parallelization
Cloud computing
Abstract: Η ανάλυση δικτύων μπορεί να μας δώσει πολλές πληροφορίες σχετικά με τα σημαντικότερα τμήματά τους και την τοπολογία τους ενώ επίσης μπορεί να χρησιμοποιηθεί και για την επικύρωσή τους. Ο πιο απλοϊκός τρόπος για την ανάλυση δικτύων είναι η οπτικοποίησή τους αλλά αυτό δεν είναι ένα απλό πρόβλημα κυρίως όταν αναφερόμαστε σε δίκτυα υψηλής κλίμακας με χιλιάδες κόμβους και ακμές. Σκοπός της παρούσας πτυχιακής εργασίας αποτέλεσε ο σχεδιασμός και η υλοποίηση μεθοδολογίας ολοκληρωμένης αλγοριθμικής ανάλυσης και οπτικοποίησης δικτύων με χρήση τεχνικών παραλληλοποίησης και τεχνολογίες cloud computing . Συγκεκριμένα, σαν ένα πρώτο βήμα προεπεξεργασίας των δικτύων προς ανάλυση, αρχικά απλοποιούνται με χρήση τεχνικών φιλτραρίσματος και μετά διαμερίζονται σε υποδίκτυα αναζητώντας τις συνδεδεμένες συνιστώσες τους αλλά και εφαρμόζοντας επαναληπτικά τον αλγόριθμο ελάχιστου κοψίματος. Στην συνέχεια, τα επιμέρους υποδίκτυα οπτικοποιούνται ξεχωριστά με χρήση διαθέσιμων πακέτων και βιβλιοθηκών οπτικοποίησης δικτύων όπως για παράδειγμα το Cytoscape . Η ανάλυση των υποδικτύων πραγματοποιείται παράλληλα με χρήση κατάλληλων Εικονικών Μηχανών (Virtual Machines) έτσι ώστε να ελαχιστοποιηθούν οι υπολογιστικές απαιτήσεις σε μνήμη αλλά και χρόνο ανάλυσης. Η μεθοδολογία που υλοποιήθηκε αξιολογήθηκε κυρίως με χρήση βιολογικών δικτύων και συγκεκριμένα δίκτυα πρωτεϊνικών αλληλεπιδράσεων και δίκτυα γονιδιακής συνέκφρασης. Χρησιμοποιήθηκαν το δίκτυο πρωτεϊνικών αλληλεπιδράσεων του ανθρώπου όπως αυτό περιέχεται στην βάση δεδομένων HINTKB αλλά και τα δίκτυα γονιδιακής συνέκφρασης που έχουν προκύψει από ασθενείς Parkinson και από μη ασθενείς και είναι αποθηκευμένα στο http://beta.insybio.com. Η μεθοδολογία που υλοποιήθηκε συγκρίθηκε με γνωστά πακέτα οπτικοποίησης και ανάλυσης δικτύων όπως είναι το Cytoscape και το Graphviz. Για την σύγκριση μεταξύ των διαφορετικών μεθοδολογιών χρησιμοποιήθηκαν ως μετρικές αξιολόγησης ο χρόνος εκτέλεσης, οι απαιτήσεις σε μνήμη υπολογιστή και η ποιοτική ερμηνεία σημαντικών συνιστωσών των δικτύων που έχουν εντοπιστεί με την ανάλυση και την ποιότητα των δικτύων.
Abstract (translated): Network analysis provides various information regarding their most important parts and their topology while also it can be additionally used for their validation. The simplest way for network analysis is their visualization, however this is not a trivial problem, mainly when dealing with large scale networks with thousands of nodes and edges. The object of this thesis is the design and implementation of an integrated algorithmic network analysis and visualization with use of parallelization techniques and cloud computing technology. Specifically, as a first preprocessing step, the networks are simplified with filtering techniques and then they are split to subnetworks by identifying their connected components and applying min-cut iteratively to each connected component. Afterwards the subnetworks are visualized separately with use of available network visualization libraries and packages such as Cytoscape. The visualization of the subnetworks is performed on parallel with use of suitable virtual machines, so as to minimize the needs of computer memory and the analysis time. The implemented methodology was evaluated using as input biological networks and more specifically networks of Protein-Protein Interactions (PPI) and Gene co-expression networks. The human PPI network, as it’s contained in HINTKB database, and Gene co-expression networks derived from Parkinson patients and non-patients and are stored at http://beta.insybio.com were used. The implemented methodology was compared with known visualization and network analysis software packages like Cytoscape and Graphviz . The comparison of the different methodologies was done using as evaluation metrics the execution time, the computer memory consumption and the qualitative interpretation of the important network components that have been identified through network analysis and quality.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΜΔΕ)

Files in This Item:
File Description SizeFormat 
alexopoulos_report_final.pdf3.47 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.