Доброго времени суток. Надоело слушать синтез речи голосом говна. Может у кого то есть норм варианты. Про silero знаю, у меня оч. долго конвертирует. Может руки кривые, хз. Может есть готовое решение на python которое легко установить и не жалко поделиться с хорошими людьми.
Куду включи, будет в 5 раз быстрей обрабатывать. Код (Text): print(f'Cuda: {torch.cuda.is_available()}') device=torch.device('cpu') if torch.cuda.is_available(): device=torch.device('cuda') torch.cuda.synchronize() synthesis_model=torch.package.PackageImporter(os.path.dirname(os.path.abspath(__file__))+symthesis_path).load_pickle("tts_models","model") synthesis_model.to(device) Кроме силеро ничего приличного нет. Если надо быстрей, есть piper. Единственный в своем роде уникальный и неповторимый картавый синтез. Больше всего проблем сейчас с нормализацией, а не синтезом.