Fehlende Plug-In: Untertitelung // Missing plug-in: Subtitling

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

  • Fehlende Plug-In: Untertitelung // Missing plug-in: Subtitling

    Sehr geehrtes VTi-Entwicklungsteam,

    Ich schätze Ihre Open-Source-Software für digitale Set-Top-Boxen sehr und bin dankbar für ihr langjähriges Bestehen.

    Allerdings vermisse ich eine wichtige Funktion: ein Plug-in für die automatische Untertitelung durch Spracherkennung mit künstlicher Intelligenz.

    Wozu benötigen wir alle dies?
    Viele private, unverschlüsselte und frei empfangbare Fernsehsender bieten oft keine Untertitelung für Nachrichten-, Sport-, und Dokusender sowie bei vielen kleinen lokalen Fernsehsendern. Untertitelung ist in unserem digitalen Zeitalter ein kostbares und unverzichtbares Hilfsmittel, um allen Zuschauern mit Hörbehinderungen und Gehörlosigkeit einen barrierefreien Zugang zu Fernsehmedien zu ermöglichen. Auch anderen Zuschauern können den gesprochenen Inhalt verfolgen, selbst in lauten Umgebungen wie Bars, Clubs oder Fitnesscentern.

    Wie sieht das aus?
    Aktuell existiert eine Open-Source Künstliche Intelligenz, die eine Spracherkennung besitzt und gesprochene Stimmen schnell in Text umwandeln kann. Es gibt zwei verschiedene, aber identische Open-Source-Systeme: 'Whisperer.cpp' und 'Fast-Whisperer'. Ich stelle mir vor, dass eines der beiden als Plug-In für digitale Set-Top-Boxen entwickelt und eingefügt wird. Die Daten der gesprochenen Stimme werden an das Whisperer-System übermittelt und automatisch in Text umgewandelt. Wenn wir online sprechen, muss die gesprochene Stimme über das Internet mit den Whisperer-Servern verbunden werden. Wenn wir offline sprechen, könnte ein externer USB-Speicherstick genutzt werden (hochwertige digitale Set-Top-Boxen haben oft zwei USB-Anschlüsse). Ein USB-Anschluss kann für das Sprachpaket zur Spracherkennung genutzt werden, um eine automatische Umwandlung in Text zu ermöglichen. Ich denke, dass die Offline-Option eine gute Möglichkeit für alle ist, da nicht immer eine Internetverbindung verfügbar sein muss. Dies gilt insbesondere für Zuschauer in abgelegenen Ortschaften, die nur über Satellit Fernsehen empfangen können.

    Whisperer.ccp ttps://github.com/ggerganov/whisper.cpp

    Fast-Whisperer github.com/SYSTRAN/faster-whisper

    Wenn die Anforderungen der Technik nicht ausreichen, sollte die Möglichkeit bestehen, auf andere kostenlose Dienste der Spracherkennung zuzugreifen und sie zu nutzen.

    Abschließend möchte ich mich im Voraus für Ihre Bemühungen bedanken, sofern diese realisierbar sind. Ich danke allen, die an der Entwicklung der Software beteiligt sind, und wünsche ihnen viel Erfolg.
  • Glaubst du ernsthaft, dass unsere Boxen mit den Low-cost-ARM-SoC's genug Rechenpower dafür zu besitzen? Abgesehen davon ist VTi mehr oder weniger tot. Auf Weiterentwicklung wirst du vermutlich vergeblich warten.

    Versuch dein Glück einfach mal bei den Images, die aktiv weiterentwickelt werden - vielleicht findet das dort ja jemand spannend. Und vielleicht ist meine Annahme bezüglich Rechenpower ja doch falsch...
    Diskutiere nie mit einem Idioten. Er zieht dich auf sein Niveau runter und schlägt dich mit seiner Erfahrung.