Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/14112
Title: Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
Other Titles: Study of immediate response learning algorithms in strategic enviroments
Authors: Κοτρώτσου, Παναγιώτα
Keywords: Αλγόριθμοι σε στρατηγικά περιβάλλοντα
Υπομονετικοί αγοραστές
Keywords (translated): Multi-armed bandit problem
Abstract: Στην συγκεκριμένη διπλωματική εργασία ασχοληθήκαμε με την περίπτωση των Multi – Armed Bandit Προβλημάτων, παρουσιάσαμε τις βασικές τους έννοιες, το μοντέλο τους και έναν βασικό αλγόριθμο που προσπαθεί να δώσει λύσεις προς αυτή την κατεύθυνση, τον Exp3. Ειδικεύσαμε στην περίπτωση του αγοραστή – πωλητών και πέρα από την κλασική περίπτωση, μελετήσαμε την περίπτωση των υπομονετικών αγοραστών. Εστιάσαμε σε έναν Online Αλγόριθμο δημοσίευσης τιμών και σε έναν δεύτερο Αλγόριθμο που τον εκτελεί και δημιουργεί τις εισόδους, παρουσιάζοντας το θεωρητικό τους υπόβαθρο και την μετρική αξιολόγησής τους (Regret). Οι αλγόριθμοι αυτοί υλοποιήθηκαν σε περιβάλλον Matlab και αξιολογήθηκε η συμπεριφορά τους, όσον αφορά το Regret και λαμβάνοντας υπόψη παραμέτρους, όπως ο χρονικός ορίζοντας, η χρησιμοποιούμενη κατανομή και η τιμή της μέγιστης υπομονής.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Nemertes_Kotrotsou(com).pdf799.06 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.