NeuralVoc
Lauterkennung mit adaptiven neuronalen Netzen. (PostScript) (AcroRead-PDF) (WinWord-DOC) (RichTextFormat)
- Sprachsignale werden mit Hilfe spezieller UNIX-Routinen über das Mikrofon eingelesen.
- Die Daten werden durch numerische Vorverarbeitung entsprechend aufbereitet. (Fast Fourier Transformation und Smoothing)
- Entwicklung eines Feed-Forward-Neuronalen Netzes. (MLP)
- Trainieren des neuronalen Netzes mit überwachten Lernverfahren. (Backpropogation)
- Graphische Darstellung der Parameter des neuronalen Netzes (Gewichte und Schwellen), sowie des Lernerfolges (Trainings- und Test-Fehler)
- Ein -und Ausgabe der Daten in verschiedenen Dateiformaten (GnuPlot?, .au-Audio, NN-neur.Net).
Das Projekt läßt sich in folgende Entwicklungsphasen aufteilen: 1. Wissenschaftliche Recherche: Analyse und mathematische Formulierung des Problems, Entwicklung der Ansätze zur Lösung des Problems, Vorverarbeitung der Ansätze, Optimierung der Lösungsverfahren bezüglich des Speicher- und Zeitverbrauchs; 2. Implementierung von Teillösungen in der Sprache C/C++: Aufteilen des Gesamtproblems in Teilprobleme, Verteilung der Teilaufgaben auf die Mitglieder der Arbeitsgruppe, Modellierung komplexer Vorgänge als Struktogramme; 3. Erstellen einer komfortablen graphischen Benutzeroberfläche mit der C++-Library Qt: Analysieren des Datenflusses, Erstellen von Dateneingabemasken und Integration deren in die Gesamtoberfläche, Visualisieren der Ergebnisse durch graphische Darstellungen im 2D- und ggf. 3D-Räumen, ggf. Erstellen einer Animation; 4. Dokumentation: Erstellen eines Benutzerhandbuches, Erstellen einer Programmers-Reference-Manuals, Klarlegung interner Vorgänge des Systems durch diverse Diagramme, Klarlegung mathematischer Vorgänge durch die wissenschaftliche Recherche zum Thema der Projektaufgabe.