Посоветуйте хороший синтез речи

Тема в разделе "WASM.HEAP", создана пользователем Research, 24 май 2026.

  1. Research

    Research Active Member

    Публикаций:
    1
    Регистрация:
    6 янв 2024
    Сообщения:
    553
    Доброго времени суток.

    Надоело слушать синтез речи голосом говна. Может у кого то есть норм варианты.
    Про silero знаю, у меня оч. долго конвертирует. Может руки кривые, хз.

    Может есть готовое решение на python которое легко установить и не жалко поделиться с хорошими людьми.
     
    Последнее редактирование: 24 май 2026
  2. f13nd

    f13nd Well-Known Member

    Публикаций:
    0
    Регистрация:
    22 июн 2009
    Сообщения:
    2.184
    Куду включи, будет в 5 раз быстрей обрабатывать.
    Код (Text):
    1.  
    2. print(f'Cuda: {torch.cuda.is_available()}')
    3. device=torch.device('cpu')
    4. if torch.cuda.is_available():
    5.     device=torch.device('cuda')
    6.     torch.cuda.synchronize()
    7. synthesis_model=torch.package.PackageImporter(os.path.dirname(os.path.abspath(__file__))+symthesis_path).load_pickle("tts_models","model")
    8. synthesis_model.to(device)
    9.  
    Кроме силеро ничего приличного нет. Если надо быстрей, есть piper. Единственный в своем роде уникальный и неповторимый картавый синтез. Больше всего проблем сейчас с нормализацией, а не синтезом.
     
    Research нравится это.