Improving Diarization in Speech-to-Text Applications

Bei polizeilichen oder juristischen Gesprächstranskriptionen ist die Erkennung der sprechenden Personen wichtig und algorithmisch ein schwieriges Problem. Eine bestehende Lösung soll erweitert und verbessert werden durch zusätzliche Ansätze wie Encoder-Decoder-Attractors oder Multimodal Transcription. Die Studierenden können sich selber aktiv in die Definition der Arbeit einbringen.

  • Informationen

    • Semester- oder Masterarbeit für 1-2 Personen
    • 40% Theorie, 60% Umsetzung
    • Voraussetzungen: Signalverarbeitung, Python

Haben wir dein Interesse geweckt?

Ich bin an der Studienarbeit Improving Diarization in Speech-to-Text Applications interessiert und möchte mehr erfahren.