Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/13160
Title: Αυτόματη αναγνώριση μουσικού οργάνου με χρήση τεχνικών μηχανικής μάθησης
Other Titles: Automatic musical instrument recognition using machine learning techniques
Authors: Αρβανίτης, Νικόλαος
Keywords: Μηχανική μάθηση
Αναγνώριση οργάνου
Σπεκτρόγραμμα
Keywords (translated): Machine learning
Instrument recognition
Spectrogramm
Abstract: Η παρούσα εργασία έχει στόχο την αυτόματη αναγνώριση μουσικού οργάνου. Αυτή επιτυγχάνεται μέσω διαφορετικών αλγορίθμων μηχανικής μάθησης. Συγκεκριμένα, μελετήθηκαν και υλοποιήθηκαν τρεις διαφορετικοί αλγόριθμοι (Μηχανές Διανυσμάτων Υποστήριξης, Τεχνητά Νευρωνικά Δίκτυα, Συνελικτικά Νευρωνικά Δίκτυα) οι οποίοι δέχτηκαν ως είσοδο κάθε φορά ένα από τα έξι ηχητικά χαρακτηριστικά που εξήχθησαν (Σπεκτρόγραμμα, Mel-Σπεκτρόγραμμα, Συντελεστές MFCC, Χρωματόγραμμα, Χρωματόγραμμα Σταθεράς-Q, Φασματικό Κεντροειδές) με σκοπό την ανάλυση της συμπεριφοράς και την σύγκριση των αποτελεσμάτων τόσο των ηχητικών χαρακτηριστικών όσο και των αλγορίθμων μηχανικής μάθησης. Είναι παραδεκτό πως ο ήχος πολλών μουσικών οργάνων δεν είναι εύκολα αναγνωρίσιμος από άλλα. Βέβαια στην αναγνώριση παίζει σημαντικό ρόλο και το ακουστικό σύστημα του εκάστοτε δέκτη και για τον λόγο αυτό, το πρώτο κεφάλαιο ξεκινάει αναλύοντας το ανθρώπινο ακουστικό σύστημα. Στη συνέχεια, δεύτερο και τρίτο κεφάλαιο, η εργασία κάνει μία σύντομη αναδρομή στο μετασχηματισμό Fourier, αφού αυτόν έχουν ως βάση τους όλα τα ηχητικά χαρακτηριστικά που χρησιμοποιήθηκαν. Παρουσιάζει αναλυτικά τα έξι ηχητικά χαρακτηριστικά, όντας άλλα πιο συναφή και άλλα λιγότερο, ως προς τα ποιοτικά χαρακτηριστικά που επιτρέπουν την αναγνώριση του μουσικού οργάνου. Έπειτα αναλύονται γενικότερα ζητήματα μηχανικής μάθησης όσον αφορά το τι είναι και πως χρησιμοποιείται η οικογένεια αυτή αλγορίθμων. Βέβαια μεγαλύτερη βαρύτητα δίνεται στους τρεις αλγορίθμους που χρησιμοποιήθηκαν στην εργασία. Το τελευταίο κεφάλαιο της εργασίας παρουσιάζει την υλοποίηση αυτής. Πραγματοποιήθηκαν τρία διαφορετικά πειράματα (αναγνώριση κατηγορίας μουσικού οργάνου, αναγνώριση μουσικού οργάνου μεταξύ οργάνων ίδιας κατηγορίας, αναγνώριση μουσικού οργάνου μεταξύ 12 οργάνων). Κλείνοντας, τα αποτελέσματα των πειραμάτων για κάθε αλγόριθμο και κάθε χαρακτηριστικό σχολιάζονται και συγκρίνονται. Διατυπώνονται κάποιες τελευταίες σκέψεις όσον αφορά την βελτίωση των αποτελεσμάτων και πιθανούς εναλλακτικούς αλγόριθμους για πιο σίγουρη αναγνώριση.
Abstract (translated): This master thesis, discusses different ways of solving the problem of automatic musical instrument recognition. This is achieved using different machine learning algorithms. Specifically, there have been studied and implemented three different algorithms that is, Support Vector Machines, Artificial Neural Networks and Convolutional Neural Networks. These three algorithms take as input each time one of the next features, Spectrogram, Mel-Spectrogram, MFCC coefficients, Chromagram and Spectral Centroid. The goal is to analyse the behaviour and compare the results of the audio features but also the machine learnig algorithms. It is undoubtable that the sound of some musical instruments is not easily recognisable among the sound of others. Of course, the receiver's auditory system plays a crucial role in recognition of an instrument and this is the reason why the first chapter presents the human auditory system. In the second and the third chapter, the thesis talks about basic Fourier transform aspects, as this is the basis (STFT) of most of the features used. Later on the third chapter, all six audio features are presented in detail, while some of them are more relevant and other less, with the qualitatively characteristics that allow the recognition of a musical instrument. General aspects of machine learning are analysed next, emphasizing on what the family of these algorithms is and how they are used. However the importance was attached on the three algorithms used here. The last chapter introduces the implementation of the thesis. Three different experiments were carried out, that is, musical instrument category recognition, musical instrument recognition among instruments of the same category and musical instrument recognition among twelve instruments. As a conclusion, the results of the three experiments are compared and discussed. Some last thoughts are put forth in the matter of the improvement of the results and alternative methods for more robust accuracy.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΜΔΕ)

Files in This Item:
File Description SizeFormat 
Διπλωματικη_1040457_ΑΡΒΑΝΙΤΗΣ_ΝΙΚΟΣ.pdf3.88 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons