Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/2068
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorΦακωτάκης, Νίκος-
dc.contributor.authorΜπόρας, Ιωσήφ-
dc.contributor.otherMporas, Iosif-
dc.date.accessioned2009-10-19T12:25:00Z-
dc.date.available2009-10-19T12:25:00Z-
dc.date.copyright2009-07-02-
dc.date.issued2009-10-19T12:25:00Z-
dc.identifier.urihttp://nemertes.lis.upatras.gr/jspui/handle/10889/2068-
dc.description.abstractΗ παρούσα διατριβή εισάγει μεθόδους για τον αυτόματο τεμαχισμό σημάτων ομιλίας. Συγκεκριμένα παρουσιάζονται τέσσερις νέες μέθοδοι για τον αυτόματο τεμαχισμό σημάτων ομιλίας, τόσο για γλωσσολογικά περιορισμένα όσο και μη προβλήματα. Η πρώτη μέθοδος κάνει χρήση των σημείων του σήματος που αντιστοιχούν στα ανοίγματα των φωνητικών χορδών κατά την διάρκεια της ομιλίας για να εξάγει όρια ψευδό-φωνημάτων με χρήση του αλγορίθμου δυναμικής παραμόρφωσης χρόνου. Η δεύτερη τεχνική εισάγει μια καινοτόμα υβριδική μέθοδο εκπαίδευσης κρυμμένων μοντέλων Μαρκώφ, η οποία τα καθιστά πιο αποτελεσματικά στον τεμαχισμό της ομιλίας. Η τρίτη μέθοδος χρησιμοποιεί αλγορίθμους μαθηματικής παλινδρόμησης για τον συνδυασμό ανεξαρτήτων μηχανών τεμαχισμού ομιλίας. Η τέταρτη μέθοδος εισάγει μια επέκταση του αλγορίθμου Βιτέρμπι με χρήση πολλαπλών παραμετρικών τεχνικών για τον τεμαχισμό της ομιλίας. Τέλος, οι προτεινόμενες μέθοδοι τεμαχισμού χρησιμοποιούνται για την βελτίωση συστημάτων στο πρόβλημα της σύνθεσης ομιλίας, αναγνώρισης ομιλίας και αναγνώρισης γλώσσας.en
dc.language.isogren
dc.relation.isformatofΗ ΒΥΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της.en
dc.rights0en
dc.subjectΤεμαχισμός ομιλίαςen
dc.subjectΚρυμμένα μοντέλα Μαρκώφen
dc.subjectΑναγνώριση ομιλίαςen
dc.subjectΣύνθεση ομιλίαςen
dc.subjectΑναγνώριση γλώσσαςen
dc.subjectΑλγόριθμος Βιτέρμπιen
dc.subjectΜαθηματική παλινδρόμησηen
dc.subjectΔυναμική παραμόρφωση χρόνουen
dc.subject.ddc006.454en
dc.titleΑυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσαςen
dc.title.alternativeAutomatic segmentation of digital speech signals and application to speech synthesis, speech recognition and language recognitionen
dc.typeThesisen
dc.contributor.committeeΦακωτάκης, Νίκος-
dc.contributor.committeeΜουρτζόπουλος, Ιωάννης-
dc.contributor.committeeΔερματάς, Ευάγγελος-
dc.contributor.committeeΑναστασόπουλος, Βασίλειος-
dc.contributor.committeeΓαλατσάνος, Νικόλαος-
dc.contributor.committeeΜπερμπερίδης, Κωνσταντίνος-
dc.contributor.committeeΠαλιουράς, Βασίλειος-
dc.description.translatedabstractThe present dissertation introduces methods for the automatic segmentation of speech signals. In detail, four new segmentation methods are presented both in for the cases of linguistically constrained or not segmentation. The first method uses pitchmark points to extract pseudo-phonetic boundaries using dynamic time warping algorithm. The second technique introduces a new hybrid method for the training of hidden Markov models, which makes them more effective in the speech segmentation task. The third method uses regression algorithms for the fusion of independent segmentation engines. The fourth method is an extension of the Viterbi algorithm using multiple speech parameterization techniques for segmentation. Finally, the proposed methods are used to improve systems in the task of speech synthesis, speech recognition and language recognition.en
dc.subject.alternativeSpeech segmentationen
dc.subject.alternativeHidden Markov modelsen
dc.subject.alternativeSpeech recognitionen
dc.subject.alternativeSpeech synthesisen
dc.subject.alternativeLanguage recognitionen
dc.subject.alternativeViterbi algorithmen
dc.subject.alternativeRegressionen
dc.subject.alternativeDynamic time warpingen
dc.degreeΔιδακτορική Διατριβήen
Appears in Collections:Τμήμα Ηλεκτρολ. Μηχαν. και Τεχνολ. Υπολογ. (ΔΔ)

Files in This Item:
File Description SizeFormat 
Μπόρας - Διδακτορική Διατριβή.pdf2.63 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons