Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/10696
Title: Ανάπτυξη αλγοριθμικών τεχνικών βιοπληροφορικής και συστημικής βιολογίας : μελέτη της κυτταρικής λειτουργίας με χρήση ετερογενών βιολογικών δεδομένων
Other Titles: Algorithmic techniques development for bioinformatics and systems biology : cellular function study using heterogeneous biological data
Authors: Βραχάτης, Αριστείδης
Keywords: Υπολογιστική συστημική βιολογία
Αλγόριθμοι
Κυτταρική λειτουργία
Keywords (translated): Computational systems biology
Algorithms
Cell function
Abstract: Η «Βιολογία Συστημάτων» (Systems Biology) αφορά μια ολιστική προσέγγιση, η οποία μελετά και περιγράφει τις υποκείμενες βιολογικές διεργασίες χρησιμοποιώντας τη θεωρία των συστημάτων. Διανύουμε την εποχή της ακμής της Βιολογίας Συστημάτων, η οποία άρχισε να κερδίζει έδαφος μετά την ολοκλήρωση του ‘Human Genome Project’, το οποίο έκανε εμφανές ότι η Βιολογία είναι Επιστήμη Πληροφορίας. Μια σημαντική ερευνητική περιοχή της Βιολογίας Συστημάτων, αποτελεί η ανάλυση βιολογικών γράφων με χρήση ετερογενών δεδομένων που παράγονται από ομικες τεχνολογίες. Η επιτυχής ανάλυση του, δύναται να αποκρυπτογραφήσει την εγγενή πολυπλοκότητα των βιολογικών διεργασιών και να αποσαφηνίσει την πολυπλοκότητα των βιολογικών ασθενειών. Προς αυτή την κατεύθυνση κινείται η παρούσα διατριβή, η οποία στα δύο πρώτα κεφάλαιο κάνει μια εισαγωγή και μια βιβλιογραφική ανασκόπηση στην συγκεκριμένη ερευνητική περιοχή. Στα υπόλοιπα κεφάλαιο, εντοπίζει και επιλύει διάφορα ερευνητικά προβλήματα σχετικά με αυτή την περιοχή. Η επίλυση πραγματοποιήθηκε μέσα από το σχεδιασμό και την υλοποίηση αλγοριθμικών τεχνικών, οι οποίοι ξεπέρασαν σε αποτελεσματικότητα αντίστοιχα εργαλεία τελευταίας αιχμής και η εφαρμογή σου σε πραγματικά βιολογικά δεδομένα έδωσε σημαντικά αποτελέσματα και βιολογικές αποδείξεις. Πιο συγκεκριμένα, στο τρίτο κεφάλαιο παρουσιάζεται μια μεθοδολογία που ενσωματώνει ετερογενή δεδομένα από ομικές τεχνολογίες για την εύρεση λειτουργικών υποδομών σε ένα πρωτεϊνικό δίκτυο. Μέσα από τις λειτουργικές υποδομές, εντοπίζει τους μηχανισμούς που προκαλούν μια ασθένεια ή μια βιολογική διεργασία αποκρυπτογραφώντας παράλληλα τη συνεργατική επίδραση των microRNAs στις συγκεκριμένες λειτουργικές υποδομές. Η μεθοδολογία εφαρμόζεται σε πολλαπλά ανεξάρτητα δεδομένα μεταγραφόματος που μελετούν το φαινόμενο της καρδιακής γήρανσης, παρουσιάζοντας μια μετα-ανάλυση η οποία ενσωματώνεται στο μεθοδολογικό πλαίσιο. Τα βιολογικά αποτελέσματα δείχνουν τη σημαντικότητα της μεθόδου τόσο μέσα από την επιβεβαίωση τους από παρόμοιες μελέτες της σύγχρονης βιβλιογραφίας, όσο και από τις νέες προτάσεις που προέκυψαν και αξίζουν προς περαιτέρω μελέτη και πειραματική επιβεβαίωση. Στο τέταρτο κεφάλαιο περιγράφεται μια μεθοδολογία εύρεσης λειτουργικών υποδομών, η οποία βασίζεται σε πρωτεϊνικές αλληλεπιδράσεις από πολλαπλές πηγές και γονιδιακές εκφράσεις από πολλαπλούς ιστούς του ίδιου πειράματος, οι οποίες προκύπτουν από τεχνικές μικροσυστοιχειών (microarrays). Η μεθοδολογία εφαρμόζεται σε δεδομένα έκφρασης της γήρανσης από πολλαπλούς ιστούς του ποντικού και επιτυγχάνει την κατηγοριοποίηση των λειτουργικών υποδομών που εξάγονται καταγράφοντας τη συχνότητα εμφάνισης τους στους εν λόγω ιστούς. Η κατηγοριοποίηση αυτή ξεφεύγει από τις συνηθισμένες αντίστοιχες κατηγοριοποιήσεις και υιοθετεί τρία νέα σχήματα που αποτυπώνουν εκτενέστερα την επικάλυψη των λειτουργικών υποδομών μεταξύ των ιστών. Στο πέμπτο κεφάλαιο, περιγράφεται το λογισμικό πακέτο CHRONOS (time-vaRying enriCHment integrOmics Subpathway aNalysis tOol), ένα εργαλείο το οποίο εντοπίζει σημαντικά εμπλουτισμένα και miRNA-ρυθμιζόμενα υπομονοπάτια από χάρτες σηματοδοτικών μονοπατιών KEGG ενσωματώνοντας χρονοσειρές γονιδιακής έκφρασης mRNA/miRNA με mRNA/miRNA αλληλεπιδράσεις. Η κύρια βιολογική μας υπόθεση είναι ότι κατά τη διάρκεια της διεξαγωγής ενός πειράματος (time course) ενεργοποιούνται διαφορετικές υποπεριοχές της τοπολογίας ενός σηματοδοτικού μονοπατιού, με τις μεταβάσεις της δραστηριότητας των υπομονοπατιών μια χρονική στιγμή t να εξαρτώνται μόνο από την προηγούμενη. Στο πλαίσιο της βιολογικής ανάλυσης ο CHRONOS εφαρμόστηκε σε ένα σύνολο δεδομένων χρονοσειρών γονιδιακής έκφρασης mRNA/miRNA, το οποίο προέκυψε μετά από διέγερση της κυτταρικής σειράς του ανθρώπινου A375 μελανώματος με ιντερφερόνη γάμμα (IFN-g). Στο έκτο κεφάλαιο, παρουσιάζεται μια μεθοδολογία, η οποία εντοπίζει διαφορικά εκφρασμένα μονοπάτια τα οποία σχετίζονται με ένα πρόβλημα που είναι υπό μελέτη και τη ταυτόχρονη επίδραση τους από microRNAs. Η μέθοδος βασίζεται σε δίκτυα μονοπατιών της KEGG όπου ενσωματώνει πληροφορία από γονιδιακές εκφράσεις mRNA και από τη ροή πληροφορίας στη τοπολογία του δικτύου. Το κίνητρο για τη συγκεκριμένη εργασία ήταν η παρατήρηση ότι ακόμη και αν κάποια γονίδια δεν είναι ιδιαίτερα εκφρασμένα, η θεώρηση τους ως μια ενιαία οντότητα μπορεί να μας βοηθήσει στην κατανόηση της υποκείμενης βιολογικής διεργασίας. Η εφαρμογή της μεθοδολογίας σε δεδομένα που σχετίζονται με τη γήρανση, έδωσε τόσο νέα βιολογική γνώση όσο και ταυτοποίηση της ήδη υπάρχουσας γνώσης όμως μέσα από ολόκληρα υπομονοπάτια γονιδίων και όχι από μεμονωμένα γονίδια - βιοδείκτες. Στο έβδομο κεφάλαιο, παρουσιάζεται το λογισμικό πακέτο DEsubs (Differentially expressed subpathways), ένα εργαλείο που ανιχνεύει μέσα σε ένα δίκτυο μονοπατιών, «διαταραγμένα από ασθένειες υπομονοπάτια» (disease-perturbed subpathways) όπως αυτά καταγράφονται από RNA-seq πειράματα. Περιέχει ένα εκτενές και προσαρμοσμένο από το χρήστη μεθοδολογικό πλαίσιο, το οποίο προσφέρει ένα ευρύ φάσμα επιλογών σε όλα τα στάδια μιας ανάλυσης υπομονοπατιών. Περιέχει διάφορες επιλογές λειτουργίας αναφορικά με (α) την κατασκευή του γράφου μονοπατιών, (β) την επεξεργασία του γράφου μονοπατιών, (γ) την εξαγωγή υπομονοπατιών, (δ) την ανάλυση εμπλουτισμού τους σε διάφορα βιολογικά και φαρμακολογικά χαρακτηριστικά και (ε) την άρτια οπτικοποίηση των τελικών αποτελεσμάτων. Οι δυνατότητες του, το καθιστούν ένα εργαλείο-οδηγό για τον κάθε ερευνητή συστημικής βιολογίας, για την εύρεση πιο εύρωστων συστημικού τύπου στόχους φαρμάκων και βιοδεικτών για πολύπλοκες ασθένειες.
Abstract (translated): Systems biology is the computational and mathematical modeling of complex biological systems. An emerging engineering approach applied to biological scientific research, systems biology is a biology-based inter-disciplinary field of study that focuses on complex interactions within biological systems, using a holistic approach (holism instead of the more traditional reductionism) to biological research. After the Human Genome Project (HGP), we are in the era of Systems Biology, therefore there is an urgent need for novel methods and frameworks under this perspective. A crucial scientific area of Systems Biology, is the network-based approaches integrating biological networks with multiple heterogeneous data from omics technologies. Such type of analysis can decipher the inherent complexity of biological processes and clarify the complexity of biological diseases. This doctoral thesis follows the specific direction by designing and implementing novel systems biology methods and algorithmic techniques. Initially, the two first chapters contain an introduction and a literature review in this research area respectively. The rest chapters, contain five methods and algorithmic techniques which are developed under this doctoral thesis. More specifically, in the third chapter we present a meta-analysis scheme that integrates transcriptome expression data from multiple cardiac-specific independent studies in mouse and human along with proteome and micronome interaction data in the form of multiple independent weighted networks. Modularization of each weighted network produced modules, which in turn were further analyzed so as to define consensus modules across datasets that change substantially during lifespan. Also, we established a metric that determines - from the modular perspective – the synergism of microRNA-microRNA interactions as defined by significantly functionally associated targets. In the fourth chapter we present a novel methodological framework that combines diverse ‘omics’ data with network-based approaches, with the scope to define modular markers of aging. Based on a large cohort of diverse tissue datasets in mouse model, we successfully identified well-established as well as recently implicated age-related pathways. Meta-analysis of the identified modules managed to designate them as tissue-specific or cross-tissue markers. The modular meta-analysis provides novel information about the involvement of several established as well as recently re-ported longevity-associated pathways across different tissues. In the fifth chapter we present a time-vaRying enriCHment integrOmics Subpathway aNalysis tOol (CHRONOS) by integrating time series mRNA/microRNA expression data with KEGG pathway maps and microRNA-target interactions. Specifically, microRNA-mediated subpathway topologies are extracted and evaluated based on the temporal transition and the fold change activity of the linked genes/microRNAs. Further, we provide measures that capture the structural and functional features of subpathways in relation to the complete organism pathway atlas. Our application to synthetic and real data shows that CHRONOS outperforms current subpathway-based methods into unraveling the inherent dynamic properties of pathways. In the sixth chapter we present we present a methodological pipeline for the identification of differentially expressed subpathways along with their miRNA regulators by using KEGG signaling pathway maps, miRNA-target interactions and expression profiles from paired miRNA/mRNA experiments. Our pipeline offered new biological insights on a real application of paired miRNA/mRNA expression profiles with respect to the dynamic changes from colostrum to mature milk whey; several literature supported genes and miRNAs were recontextualized through miRNA-mediated differentially expressed subpathways. In the seventh chapter we present the R package for flexible identification of differentially expressed subpathways using RNA-seq experiments. It contains an extensive and customized framework with a broad range of operation modes at all stages of the subpathway analysis, enabling so a case-specific approach. The operation modes include pathway network construction and processing, subpathway extraction, visualization and enrichment analysis with regard to various biological and pharmacological features. Its capabilities render it as a tool-guide for both the modeler and experimentalist for the identification of more robust systems-level drug targets and biomarkers for complex diseases.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΔ)

Files in This Item:
File Description SizeFormat 
Vrachatis(com).pdf5 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.