Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/14838
Title: Εντοπισμός κόμβων μεγάλης επιρροής σε κοινωνικά δίκτυα συνδυάζοντας τα τοπολογικά χαρακτηριστικά και την ενσωμάτωση των δικτύων με τη μηχανική μάθηση
Other Titles: Identification of influential nodes in social networks combining topological features and node embedding with machine learning techniques
Authors: Τσαρδίκου, Μαρία-Ραφαέλλα
Keywords: Κόμβοι με μεγάλη επιρροή
Ταξινόμηση κόμβων
Μετρικές κεντρικότητας
Μοντέλο επιδημίας SIR
Απεικόνιση κόμβων
Μηχανική μάθηση
Keywords (translated): Influential nodes
Node classification
Centrality measurements
SIR
Node embeddings
Machine learning
Abstract: Ανάμεσα σε εκατομμύρια χρήστες, οι οποίοι ανήκουν σε κοινωνικά δίκτυα, είναι εύκολα αναγνωρίσιμο, ότι οι δραστηριότητες ορισμένων, γίνονται πιο γρήγορα αντιληπτές και εξαπλώνονται μέσω του δικτύου, συγκριτικά με άλλους χρήστες. Αυτοί οι χρήστες ασκούν στο δίκτυο μεγάλη επιρροή. Ο εντοπισμός των κόμβων με μεγάλη επιρροή σε κοινωνικά δίκτυα, έχει χρησιμοποιηθεί ευρέως για την κατανόηση της διάδοσης φημών, πληροφοριών και τον έλεγχο της εξάπλωσης επιδημιών και ασθενειών. Η αναγνώριση των κόμβων αυτών στα σύνθετα δίκτυα είναι σημαντική για το σχεδιασμό στρατηγικών και για την επιτάχυνση της διάδοσης πληροφοριών που είναι χρήσιμες για διάφορες εφαρμογές, όπως το μάρκετινγκ ή η παρεμπόδιση της διάδοσης ενοχλητικών πληροφοριών, όπως η εξάπλωση ιών, αρνητικών συμπεριφορών στο διαδίκτυο και ο εκφοβισμός στον κυβερνοχώρο. Ωστόσο, η επίτευξη υψηλής ακρίβειας και πληρότητας στην κατάταξη επιρροής των κόμβων είναι μια διαδικασία χρονοβόρα και πολύπλοκη. Στην παρούσα διπλωματική εργασία, το πρόβλημα αναγνώρισης των ισχυρών κόμβων στα κοινωνικά δίκτυα έχει μετατραπεί σε πρόβλημα ταξινόμησης και ο εντοπισμός των κόμβων αυτών, πραγματοποιείται συνδυάζοντας τις μεθόδους μηχανικής μάθησης με τις μετρικές κεντρικότητας του δικτύου (Degree centrality, Closeness centrality, Betweenness centrality, Eigenvector centrality, Page Rank και KTruss) και με την απεικόνιση των κόμβων σε χώρο με λιγότερες διαστάσεις (node2vec). Επίσης, χρησιμοποιήθηκε το μοντέλο επιδημίας SIR για την προσομοίωση διαδικασιών διάδοσης σε δίκτυα και για την αξιολόγηση της απόδοσης των προτεινόμενων μεθόδων. Εφαρμόστηκαν έξι αλγόριθμοι μηχανικής μάθησης για την εκκένωση των κανόνων ταξινόμησης, βάσει των χαρακτηριστικών των κόμβων. Τα πειραματικά αποτελέσματα, τα οποία προέκυψαν από τρία δίκτυα πραγματικού κόσμου, έδειξαν ότι οι προτεινόμενες μέθοδοι, σχετικά με την ορθότητα και την αποτελεσματικότητά τους, παρουσιάζουν εξαιρετική απόδοση, καθώς η διερεύνηση και η αναγνώριση σημαντικών κόμβων μέσω του συνδυασμού των τοπολογικών χαρακτηριστικών τους και της απεικόνισης των δικτύων με τη μηχανική μάθηση, επιτυγχάνεται με ικανοποιητική ακρίβεια.
Abstract (translated): Among the millions of users in social networks, it is easily recognizable that the activities of some, are perceived faster and spread through the network, compared to other users. These users are the influencers of the network. Identifying spreaders in social networks, has been widely used to understand the spread of rumours, information and control the spread of epidemics and diseases. Identifying these nodes in complex networks is important for designing strategies and accelerating the dissemination of information, that is useful for various applications, such as marketing or preventing the dissemination of annoying information, such as the spread of viruses, negative behaviours via Internet, and cyberbullying. However, achieving high accuracy and completeness in the influence classification of nodes is time consuming and complex process. In present thesis, the problem of identifying nodes, that are influencers, in social networks has become a problem of classification and the identification of these nodes is done by combining machine learning methods with network centrality measurements (Degree centrality, Closeness centrality, Betweenness centrality, Eigenvector centrality, Page Rank and K-Truss) and by embedding nodes in a smaller space (node2vec). Furthermore, the SIR epidemic model was also used to simulate network diffusion processes and to evaluate the performance of the proposed methods. Six machine learning algorithms were applied to evacuate the classification rules, based on the characteristics of the nodes. The experimental results, which came from three real-world networks, showed that the proposed methods, in terms of their accuracy and efficiency, are extremely effective, as the investigation and identification of important nodes through the combination of their topological features and network embedding with machine learning, is achieved with satisfactory accuracy.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Diplomatiki_ergasia_Tsardikou.pdf2.87 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.