Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/14175
Title: Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης
Other Titles: Graph models for the problem of TOP-N recommendations : implementation and performance analysis
Authors: Κολόης, Άλκης
Keywords: Μηχανική μάθηση
Graph-based αλγόριθμοι
Ανάκτηση πληροφορίας
Συστήματα προτάσεων
Top-N συστάσεις
Keywords (translated): Machine learning
Graph-based algorithms
Information retrieval
PageRank
Recommendation systems
TOP-N recommendation
Abstract: Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτηκε κατεξοχήν σε ένα σύστημα TOP-N προτάσεων. Η ιδέα πίσω από αυτά ονομάζεται Collaborative Filtering και στοχεύει στην κατάλληλη μοντελοποίηση χρηστών και αντικειμένων ως σύνολα ratings. Η μοντελοποίηση του προβλήματος συστάσεων, με οποιαδήποτε μέθοδο, καταλήγει σε ένα αραιό user-item μητρώο, του οποίου η ανάλυση οδηγεί σε προτάσεις αντικειμένων στους χρήστες, ώστε να αυξηθούν οι συνολικές πωλήσεις του συστήματος. Κατά γενική ομολογία, οι αλγόριθμοι προσπαθούν να παροτρύνουν τον χρήστη να χρησιμοποιήσει υπηρεσίες που ακόμα δεν έχει δοκιμάσει. Τ ο πρόβλημα των TOP-N συστάσεων φέρει μεγάλο ερευνητικό ενδιαφέρον με αποτέλεσμα να έχουν προταθεί πολλοί αλγόριθμοι επίλυσης του. Μια πιθανή προσέγγιση αποτελεί η χρήση γραφημάτων. Οι Graph-Based αλγόριθμοι καταφέρνουν να αντεπεξέλθουν καλά στο πρόβλημα του sparsity.Το βασικό χαρακτηριστικό τους είναι ότι επιτρέπουν την αλληλεπίδραση χαρακτηριστικών των δεδομένων, ακόμα και σε περιπτώσεις που δεν υπάρχει άμεση σύνδεση μεταξύ τους, μεταδίδοντας πληροφορία μέσω των ακμών του γραφήματος. Ο δημοφιλέστερος graph-based αλγόριθμος είναι ο PageRank, ο ιθύνων νους πίσω από την επιτυχία της Google. Κατά την διάρκεια της έρευνας που πραγματοποιήθηκε εξετάστηκαν τρεις graph-based αλγόριθμοι, συγκρίθηκαν και εξήχθησαν πληροφορίες για αυτούς μέσω μετρικών αξιολόγησης απόδοσης. Οι υλοποιήσεις ονομάζονται ως εξής: Personalized PageRank, Katz centrality και Parameter Supported PageRank. Οι μετρικές σύμφωνα με τις οποίες αξιολογήθηκαν είναι οι: Precision-Recall, MRR, Ndcg.
Abstract (translated): One of the most widely known technologies that is based in machine learning methods and knowledge mining from data, is the TOP-N systems of recommendation. Their implementations are presented in popular online systems such as Netflix and Amazon, whose commercial success was based primarily on a TOP-N proposal system. The idea behind them is called Collaborative Filtering and aims at the proper modeling of users and objects as sets of ratings. The modeling of the recommendation problem, by any method, results in a sparse user-item matrix, the analysis of which leads to object suggestions to users in order to increase the overall sales of the system. Admittedly, algorithms try to encourage the user to use services he has not yet tried. The problem of TOP-N recommendation is of great interest, as a result of which many algorithms have been proposed to solve it. One possible approach is to use graphs. Graph-Based algorithms manage to cope well with the problem of sparsity. Their main feature is that they allow the interaction of data features, even in cases where there is no direct connection between them, transmitting information through the edges of the graph. The most popular graph-based algorithm is PageRank, the mastermind behind Google’s success. During tis research three graph-based algorithms, including PageRank, were implemented and compared. Information was extracted through their performance evaluation with different metrics. The implementations are named accordingly: Personalized PageRank, Katz centrality, Parameter Supported PageRank. The metrics on which they were evaluated are : Precision-Recall, MRR, Ndcg.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Διπλωματικη-Κολοης-Αλκης-5794.pdf1.57 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.