Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/1796
Title: Προσαρμογή, προσομοίωση και διάγνωση μοντέλων εκθετικών τυχαίων γραφημάτων
Authors: Βραχνός, Χρήστος
Issue Date: 2009-08-26T11:26:37Z
Keywords: Προσαρμογή
Προσομοίωση
Διάγνωση
Εκθετικά τυχαία γραφήματα
Κοινωνικά δίκτυα
Keywords (translated): Fit
Simulate
Diagnose
Exponential random graphs
Social networks
Statnet
R-project
Ergm
Sna
Abstract: Η παρούσα διπλωματική εργασία βρίσκεται στον ευρύτερο χώρο της μαθηματικής στατιστικής θεωρίας των γραφημάτων. Κύριος στόχος μας, όπως αναφέρει και ο τίτλος, είναι η μοντελοποίηση γραφημάτων, με απώτερο σκοπό την προσαρμογή, προσομοίωση και διάγνωση αυτών μέσω μοντέλων εκθετικών τυχαίων γραφημάτων. Το πρώτο κεφάλαιο δίνει μια συνοπτική παρουσίαση της διατύπωσης του προβλήματος και της θεωρίας των μοντέλων των εκθετικών τυχαίων γραφημάτων. Η βασική ιδέα είναι να θεωρήσουμε ως τυχαίες μεταβλητές τους δυνατούς δεσμούς μεταξύ των κόμβων ενός δοθέντος γραφήματος. Η γενική μορφή ενός μοντέλου εκθετικά τυχαίου γραφήματος καθορίζεται από κάποιες υποθέσεις σχετικές με τις εξαρτήσεις μεταξύ αυτών των τυχαίων μεταβλητών. Παρουσιάζουμε κάποιες διαφορετικές υποθέσεις εξάρτησης και τα αντίστοιχα μοντέλα, όπως τα γραφημάτα Bernoulli, τα δυαδικώς - ανεξάρτητα και τα τυχαία γραφήματα Markov. Επίσης, εξετάζουμε την ενσωμάτωση των χαρακτηριστικών, που μπορούν να έχουν οι κόμβοι, σε μοντέλα κοινωνικής επιλογής, δηλαδή, σε περιπτώσεις που οι συνδέσεις του γραφήματος μπορούν να προβλέψουν τα χαρακτηριστικά των κόμβων. Συνοψίζουμε κάποιες καινούργιες υποθέσεις εξάρτησης, που είναι πολυπλοκότερες των πρώτων τέτοιων υποθέσεων της σχετικής βιβλιογραφίας. Συζητούμε τις διαδικασίες της στατιστικής εκτίμησης, συμπεριλαμβανομένων των νέων μεθόδων για την εκτίμηση της μέγιστης πιθανοφάνειας Monte Carlo. Τέλος, παρουσιάζουμε τις νέες προδιαγραφές για μοντέλα εκθετικών τυχαίων γραφημάτων, που έχουν προτείνει οι Snijders et al., οι οποίες βελτιώνουν σημαντικά τα αποτελέσματα της προσαρμογής εμπειρικών δεδομένων για εκθετικά μοντέλα ομοιογενών τυχαίων γραφημάτων Markov. Επιπλέον, οι νέες αυτές προδιαγραφές μας βοηθούν να αποφύγουμε το πρόβλημα του σχεδόν-εκφυλισμού, που συχνά παρεμβάλλεται στη διαδικασία της προσαρμογής μοντέλων εκθετικών τυχαίων γραφημάτων Markov, ιδιαίτερα όταν αυτά προέρχονται από εμπειρικά δεδομένα, που έχουν υψηλό βαθμό μεταβατικότητας. Η μελέτη μιας τέτοιας νέας στατιστικής με υψηλότερης τάξης μεταβατικότητα επιτρέπει την εκτίμηση των παραμέτρων των μοντέλων των εκθετικών γραφημάτων σε πολλές (αλλά όχι όλες) περιπτώσεις, στις οποίες διαφορετικά θα ήταν αδύνατο να εκτιμηθούν οι παράμετροι των μοντέλων των ομοιογενών γραφημάτων Markov. Στο δεύτερο, τρίτο και τέταρτο κεφάλαιο της εργασίας εφαρμόζουμε τις παραπάνω μεθόδους, αντιστοίχως, για τρείς αναλύσεις εμπειρικών δεδομένων: το δίκτυο Florentine, το δίκτυο Faux Magnolia High και τα δίκτυα IPRED και SWPAT. Σε αυτά τα κεφάλαια, παρουσιάζουμε τις διαδικασίες της προσαρμογής, προσομοίωσης και διάγνωσης με παράθεση των αντίστοιχων εντολών, χρησιμοποιώντας τα πακέτα statnet - ermg και sna, τα οποία δουλεύουν στο περιβάλλον του πακέτου ελεύθερου λογισμικού R. Τέλος, στο παράρτημα της εργασίας δίνουμε μια σύντομη εισαγωγή στο περιβάλλον R και σε κάποιες γενικές εντολές αυτού.
Abstract (translated): This specific project has to do with mathematical statistical graph theory. Our main target is to fit, simulate and diagnose models through exponential random graph models. In the first chapter we give a short presentation of the problem and the theory of exponential random graph models. The main idea is to consider each tie of a given network (graph) as a random variable. The general form of an exponential random graph model is defined from some relative assumptions that have to do with the dependence between those random variables. We present some different dependence assumptions and the corresponding models, such as Bernoulli graphs, dyadic-independent and Markov random graphs. We also examine the incorporation of the characteristics that a node may have in social networks. We also discuss the process of statistical estimation, including three new methods for the estimation of Monte Carlo maximum likelihood. Finally, we present new specifications for exponential random graph models, which Snijders et al. have proposed. These new specifications allow us to avoid the problem of degeneration. In the second, third and fourth chapter we apply the above methods in order to analyze Florentine network data, Faux Magnolia High data and IPred And Swpat data. In those chapters, we present the procedures of fit, simulate and diagnose exponential random graph models displaying the corresponding commands of statnet-ergm and sna packages that work in R. Finally we give a short introduction to R and to some relative commands.
Appears in Collections:Τμήμα Μαθηματικών (ΜΔΕ)

Files in This Item:
File Description SizeFormat 
diplwmatiki.pdf1.53 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.