Please use this identifier to cite or link to this item:
Title: Ανάπτυξη βάσης δεδομένων για τον προσδιορισμό του δικτύου πρωτεϊνικών αλληλεπιδράσεων στον άνθρωπο
Other Titles: Towards the development of a database for the human protein - protein interaction network (Interactome)
Authors: Τσάφου, Καλλιόπη
Issue Date: 2011-04-20T09:03:59Z
Keywords: Πρωτεϊνικές αλληλεπιδράσεις
Δίκτυο πρωτεϊνών
Βάση δεδομένων
Πειράματα υψηλής απόδοσης
Σύμπλοκο πρωτεϊνών
Keywords (translated): Protein interactions
Protein network
Protein database
High-throughtput analysis
Protein complexes
Abstract: Με την αλληλούχιση του ανθρώπινου γονιδιώματος αλλά και άλλων οργανισμών, μια νέα εποχή άρχισε για την επιστήμη της βιολογίας, γνωστή ως "μεταγονιδιωματική εποχή". Ο όρος σε καμιά περίπτωση δεν σηματοδοτεί το τέλος της αλληλούχισης ή της ανάλυσης των ήδη αλληλουχημένων γονιδιωμάτων, απλά δηλώνει πως οι τεχνικοί περιορισμοί για την ανίχνευση γονιδιωματικής πληροφορίας έχουν σε μεγάλο βαθμό αντιμετωπισθεί . Η επόμενη μεγάλη πρόκληση είναι η κατανόηση του πρωτεόματος, δηλαδή του συνόλου των πρωτεϊνών που εκφράζονται σε ένα κύτταρο. Εξαιρετικά σημαντικό βήμα προς την κατεύθυνση αυτή αποτελεί η μελέτη του δικτύου των πρωτεϊνικών αλληλεπιδράσεων. Οι πρωτεϊνικές αλληλεπιδράσεις αποτελούν ένα ιδιαίτερα σημαντικό πεδίο έρευνας καθώς ρυθμίζουν ένα τεράστιο αριθμό διεργασιών οι οποίες είναι βασικές για τη δομή και τη λειτουργία του. Εκτιμάται πως το δίκτυο των πρωτεϊνικών αλληλεπιδράσεων στον άνθρωπο αφορά περίπου 130,000 ζεύγη αλληλεπιδράσεων, ενώ ο αριθμός των αλληλεπιδράσεων που έχουν ταυτοποιηθεί αλλά παραμένει ως ζητούμενο η επιβεβαίωση των αντίστοιχων πειραματικών αποτελεσμάτων, αποτελεί μόνο το 8%, περίπου, του πραγματικού δικτύου. Ο κύριος όγκος πληροφορίας στο πεδίο αυτό δίνεται μέσα από βάσεις δεδομένων και έρχεται από μεγάλης κλίμακας πειράματα υψηλής απόδοσης τα οποία όμως, έχει βρεθεί πως δίνουν σε μεγάλο ποσοστό ανακριβή αποτελέσματα εξ αιτίας μιας σειράς εγγενών προβλημάτων των μεθόδων και της φύσεως των πρωτεϊνών. Η εκτίμηση του πραγματικού μεγέθους του δικτύου των πρωτεϊνικών αλληλεπιδράσεων υποδεικνύει και τον όγκο των δεδομένων που θα παραχθεί στο εγγύς μέλλον αλλά και την ανάγκη για βελτίωση της αξιοπιστίας της πληροφορίας που διατίθεται στις σχετικές βάσεις δεδομένων. Σκοπός αυτής της εργασίας είναι η ανάπτυξη μιας αναλυτικής βάσης δεδομένων γνώσης για την ταυτοποίηση δικτύων πρωτεϊνικών αλληλεπιδράσεων αντλώντας πληροφορία από επιλεγμένες μετά από αξιολόγηση, δημόσιες βάσεις πρωτεϊνικών αλληλεπιδράσεων. Η συλλογή αυτή της πληροφορίας θα οδηγήσει μεσοπρόθεσμα στη δημιουργία μιας βάσης δεδομένων για τη διαχείριση της συλλογής, της οργάνωσης και της ανάκτησης δεδομένων πρωτεϊνικών αλληλεπιδράσεων όπου κατάλληλα υπολογιστικά εργαλεία θα αναπτυχθούν ώστε να αξιολογηθεί ο βαθμός αξιοπιστίας της καταχωρημένης σχετικής πληροφορίας σε μια μεγάλη ομάδα δημόσιων γονιδιωματικών βάσεων δεδομένων. Επίσης θα υπάρξει η δυνατότητα χρήσης εργαλείων για την ανάλυση των αξιολογημένων δεδομένων πρωτεϊνικών αλληλεπιδράσεων, την μελέτη πρωτεϊνών με άγνωστη λειτουργία αλλά και τον προσδιορισμό μη καταγεγραμμένων έως τώρα πρωτεϊνικών συμπλεγμάτων.
Abstract (translated): The elucidation of protein-protein interaction (PPI) networks (protein interactomes) is a major objective of systems biology. This task is crucial for furthering our understanding of the cellular machinery dynamics, in light of the fundamental role of proteins in cellular function. The development of high-throughput methods for PPI identification, including the widely used yeast two hybrid and the mass spectrometry of co-immunoprecipitated complexes, drastically increased the PPI data in model organisms and the human. However, these methods suffer from intrinsic detection biases and >70% of false positives. Moreover, independent public databases (dbs) of experimentally derived PPIs exhibit a remarkably limited overlap, mainly due to uncoordinated data validation and curation criteria. These limitations scale up in highly complex systems like the human for which only 8-10% of the estimated PPIs have been determined. Furthermore, new PPI prediction is affected by the current data quality and quantity along with predictive algorithm limitations to incorporate the available protein information. Thus, there is initially a need for a systematic curation of multiple datasets into one common db. We have integrated high- and low- throughput experimental data, ortholog protein interactions, protein domain interactions, and protein structure/function and expression data from twelve highly informative and updated dbs into one local db using the Microsoft_SQL_Server. The db selection was based on their unique gene content, PPIs recorded, annotation depth, curation methodology and relational scheme. This data will be enriched with PPI information mined from the literature. The final dataset will be appropriately scored to rank and validate the PPIs with increased confidence, forming the basis for a human interactome knowledge base.
Appears in Collections:Τμήμα Ιατρικής (ΜΔΕ)

Files in This Item:
File Description SizeFormat 
Nimertis_Tsafou(i).pdfΚείμενο εργασίας4.55 MBAdobe PDFView/Open

This item is licensed under a Creative Commons License Creative Commons