Emotion transplantation approach for VLSP 2022
Tác giả: Van Thang Nguyen, Thanh Long Luong, Huan Vu
Số trang:
P. 369-380
Số phát hành:
Tập 39 - Số 4
Kiểu tài liệu:
Tạp chí trong nước
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
005
Ngôn ngữ:
Tiếng Anh
Từ khóa:
Emotional speech synthesis, emotion transplantation, text-to-speech
Chủ đề:
Data conversion
Tóm tắt:
This paper presents our approach that addresses the problem of transplanting a source speaker's emotional expression to a target speaker, one of the Vietnamese Language and Speech Processsing (VLSP) 2022 TTS tasks. Our approach includes a complete data pre-processing pipeline and two training algorithms. We first train a source speaker's expressive TTS model, then adapt the voice characteristics for the target speaker. Empirical results have shown the efficacy of our method in generating the expressive speech of a speaker under a limited training data regime.
Tạp chí liên quan
- Đánh giá tác động của đào tạo nâng cao năng lực đến sự tự tin trong chăm sóc sức khoẻ tâm thần cho người bệnh ung thư của điều dưỡng viên
- Thực trạng phát triển kinh tế tư nhân ở Việt Nam : thành tựu, thách thức và triển vọng
- Những động lực giúp Việt Nam tăng trưởng 8% trong năm 2025 : thực trạng và giải pháp
- Đẩy mạnh giải ngân vốn đầu tư công đối với các dự án trong ngành đường sắt ở Việt Nam
- Nghiên cứu mối quan hệ giữa phân cấp tài khóa và chất lượng dịch vụ công tại Việt Nam