В моей работе встречаются видео с плохим качеством звука или сильным фоновым шумом (записи с конференций).
Существуют ли специализированные сервисы или инструменты, которые справляются с такими сложными случаями и могут достаточно точно извлечь текст?
Готов рассмотреть варианты с ручной коррекцией результата.