Sprachsignale werden mit Hilfe spezieller UNIX-Routinen über das Mikrofon eingelesen.
Die Daten werden durch numerische Vorverarbeitung entsprechend aufbereitet. (Fast Fourier Transformation und Smoothing)
Entwicklung eines Feed-Forward-Neuronalen Netzes. (MLP)
Trainieren des neuronalen Netzes mit überwachten Lernverfahren. (Backpropogation)
Graphische Darstellung der Parameter des neuronalen Netzes (Gewichte und Schwellen), sowie des Lernerfolges (Trainings- und Test-Fehler)
Ein -und Ausgabe der Daten in verschiedenen Dateiformaten (GnuPlot?, .au-Audio, NN-neur.Net).
Das Projekt läßt sich in folgende Entwicklungsphasen aufteilen:
1. Wissenschaftliche Recherche:
Analyse und mathematische Formulierung des Problems,
Entwicklung der Ansätze zur Lösung des Problems,
Vorverarbeitung der Ansätze,
Optimierung der Lösungsverfahren bezüglich des Speicher- und Zeitverbrauchs;
2. Implementierung von Teillösungen in der Sprache C/C++:
Aufteilen des Gesamtproblems in Teilprobleme,
Verteilung der Teilaufgaben auf die Mitglieder der Arbeitsgruppe,
Modellierung komplexer Vorgänge als Struktogramme;
3. Erstellen einer komfortablen graphischen Benutzeroberfläche mit der C++-Library Qt:
Analysieren des Datenflusses,
Erstellen von Dateneingabemasken und Integration deren in die Gesamtoberfläche,
Visualisieren der Ergebnisse durch graphische Darstellungen im 2D- und ggf. 3D-Räumen,
ggf. Erstellen einer Animation;
4. Dokumentation:
Erstellen eines Benutzerhandbuches,
Erstellen einer Programmers-Reference-Manuals,
Klarlegung interner Vorgänge des Systems durch diverse Diagramme,
Klarlegung mathematischer Vorgänge durch die wissenschaftliche Recherche zum Thema der Projektaufgabe.