Please use this identifier to cite or link to this item:
Title: Detecting spam in sharing economy : a case study on Airbnb
Other Titles: Αναγνώριση ανεπιθύμητων σχολίων στην διαμοιραζόμενη οικονομία : μια μελέτη στον ιστότοπο Airbnb
Authors: Τσεκούρα, Μαρία
Keywords: Sharing economy
Keywords (translated): Διαμοιραζόμενη οικονομία
Abstract: Internet social networks (OSN) are an aspect of the daily life of the world. However, spammers are also attracted to the success of OSN. Spam is a threat to the economy. In particular, it imposes negative external effects on users without giving them an advantage or an exception. Negative externalities include the financial loss (if any) suffered by the recipients and the time and effort required to read and analyze the unwanted comment. Given all the above, in this dissertation, we dealt with the detection of spam in the OSN using a machine learning algorithm. More specifically, we selected the microblogging service Twitter as a representative of OSN, collected 7304 comments listed on Airbnb as a representative of the most successful hosting industry in the sharing economy and after processing the data, we applied the Naive Bayes classifier as well as 10 - fold cross - validation for better accuracy in the result. The experimental results show that the preferred classification model received relatively high evaluation results, with an average accuracy of 84%.
Abstract (translated): Τα κοινωνικά δίκτυα στο Διαδίκτυο (OSN) είναι μια πτυχή της καθημερινής ζωής του κόσμου. Ωστόσο, οι spammers προσελκύονται επίσης από την επιτυχία του OSN. Το Spam αποτελεί απειλή για την οικονομία. Συγκεκριμένα, επιβάλλει αρνητικά εξωτερικά αποτελέσματα στους χρήστες χωρίς να τους δίνει πλεονέκτημα ή εξαίρεση. Τα αρνητικά εξωτερικά στοιχεία περιλαμβάνουν την οικονομική απώλεια (εάν υπάρχει) που επιβλήθηκε στους παραλήπτες και τον χρόνο και την προσπάθεια που απαιτείται για την ανάγνωση και ανάλυση του ανεπιθύμητου σχολίου. Δεδομένων όλων των παραπάνω, σε αυτή τη διατριβή, ασχοληθήκαμε με την ανίχνευση ανεπιθύμητων μηνυμάτων στο OSN χρησιμοποιώντας έναν αλγόριθμο μηχανικής μάθησης. Πιο συγκεκριμένα, επιλέξαμε την υπηρεσία microblogging Twitter ως εκπρόσωπο του OSN, συλλέξαμε 7304 σχόλια που αναφέρονται στο Airbnb ως εκπρόσωπος της πιο επιτυχημένης βιομηχανίας φιλοξενίας στην οικονομία κοινής χρήσης και μετά απο την επεξεργασία των δεδομένων, εφαρμόσαμε τον ταξινομητή Naive Bayes καθώς και 10 - διπλή διασταυρούμενη επικύρωση για καλύτερη ακρίβεια στο αποτέλεσμα. Τα πειραματικά αποτελέσματα δείχνουν ότι το προτιμώμενο μοντέλο ταξινόμησης έλαβε σχετικά υψηλά αποτελέσματα αξιολόγησης, με μέση ακρίβεια 84%.
Appears in Collections:Τμήμα Οικονομικών Επιστημών (ΜΔΕ)

Files in This Item:
File Description SizeFormat 
Διπλωματική εργασία_workingdoc_v.pdf659.94 kBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.