Мне нужно было сделать текстовую версию подкаста, чтобы люди могли читать вместо прослушивания. Попробовал Microsoft Azure Speech to Text. Работает вроде нормально, но если фон шумный, ошибки случаются. Да, руками всё равно пришлось править, но это проще, чем делать всю работу самому. Если у тебя есть время, можешь потестить этот инструмент.