Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/14045
Title: Έξυπνη διαχείριση ροών δεδομένων ενέργειας
Other Titles: Intelligent way of managing energy data flow
Authors: Κουτρουμπίνα, Χριστίνα
Keywords: Ενέργεια
Κατανάλωση
Μηχανική μάθηση
Επιβλεπόμενη μάθηση
Ταξινόμηση
Κατηγοριοποίηση
Keywords (translated): Energy
Consumption
Machine learning
Supervised learning
Classification
DinRail Cerberus
Apache Spark
Scala
Abstract: Στη σημερινή εποχή, η εξέλιξη της τεχνολογίας μας δίνει την δυνατότητα να γνωρίζουμε την ενέργεια που καταναλώνουμε. Κάτι τέτοιο είναι ιδιαίτερα χρήσιμο, καθώς μπορούμε να προσαρμόσουμε την συμπεριφορά μας και να έχουμε οικονομικά οφέλη και καλύτερη ποιότητα ζωής. Ο μετρητής DinRail Cerberus της Meazon S.A. παρέχει την δυνατότητα στο χρήστη να μετράει τη συνολική ενέργεια που καταναλώνει. Πιο συγκεκριμένα, ο μετρητής αυτός λαμβάνει μία μέτρηση κάθε 20ms. Κατανοούμε λοιπόν πως το μέγεθος των συλλεγόμενων δεδομένων είναι τεράστιο και οι μετρήσεις γίνονται τόσο συχνά που δεν χάνεται πληροφορία. Δεδομένου των συνθηκών, δημιουργείται η ανάγκη διαχείρισης των δεδομένων αυτών με ευφυή τρόπο. Στόχος της παρούσας διπλωματικής εργασίας είναι η επεξεργασία μεγάλου όγκου δεδομένων ενέργειας καθώς και η ανάπτυξη ενός συστήματος που θα μπορεί να προβλέψει εάν μία συσκευή λειτουργεί ή όχι, με βάση την μέτρηση που του δίνεται. Πρόκειται λοιπόν, για την δημιουργία ενός αποδοτικού μοντέλου επιβλεπόμενης μηχανικής μάθησης που προβλέπει σε ποια από τις δύο διαθέσιμες κλάσεις ανήκει μία μέτρηση. Στην πρώτη κλάση ανήκουν οι μετρήσεις κατά τις οποίες η συσκευή που μας ενδιαφέρει λειτουργούσε. Αντίθετα, στην δεύτερη κλάση ανήκουν αυτές κατά τις οποίες η συσκευή δεν λειτουργούσε. Για την υλοποίηση του εν λόγω συστήματος, επιλέχθηκε το κατανεμημένο σύστημα υπολογισμού Apache Spark, το οποίο διαθέτει την βιβλιοθήκη MLlib που προσφέρει υλοποιημένους αλγορίθμους μηχανικής μάθησης.
Abstract (translated): Nowadays, the evolution of technology enables us to know the energy we consume. This is especially useful as we can adjust our behavior and have financial benefits and a better quality of life. The DinRail Cerberus meter from Meazon S.A. enables the user to measure the total energy consumed. More specifically, this meter takes a measurement every 20ms. So we understand that the size of the data collected is huge and the measurements are made so often that no information is lost. Given the circumstances, there is a need to manage this data intelligently. The aim of this thesis is the processing of large volumes of energy data as well as the development of a system that can predict whether a device works or not, based on the measurement given to it. It is, therefore, about creating an efficient model of supervised machine learning that predicts which of the two available classes a measurement belongs to. The first class includes the measurements, during which the device we are interested in, worked. On the contrary, the second class includes those in which the device did not work. For the implementation of this system, it was chosen to use the distributed computing system Apache Spark, which has the MLlib library that offers implemented machine learning algorithms.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Koutroumpina_Christina_Thesis.pdf4.23 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.