15-09-2025 , 16-09-2025
Một số giọng nói của chúng tôi hỗ trợ thay đổi ngữ điệu. Bạn có thể xem điều này trên trang so sánh tất cả người dẫn chuyện. Nếu có dấu "+" bên cạnh giọng nói trong bảng, điều đó có nghĩa là giọng nói đó hỗ trợ công nghệ này:
Với ngữ điệu, bạn có thể tạo câu hỏi tu từ và thay đổi trọng âm của một từ trong câu. Tuy nhiên, đây là một cài đặt nâng cao. Cần có kinh nghiệm và thực hành để làm việc với nó. Hãy đi sâu vào chi tiết cách thức hoạt động của nó.
Thẻ SSML "contour" cho phép bạn kiểm soát cách cao độ (độ "cao" hoặc "thấp" của âm thanh) thay đổi khi văn bản được nói. Bạn có thể đặt các điểm cụ thể mà cao độ nên thay đổi và mức độ thay đổi. Các điểm này được đặt dưới dạng phần trăm tổng thời lượng của văn bản.
Đây là cách nó hoạt động bằng cách sử dụng ví dụ bạn đã cung cấp:
<prosody contour="(0%,+20Hz) (10%,-2st) (40%,+10Hz)">
Bằng cách thử nghiệm với các tham số này, bạn có thể làm cho đầu ra giọng nói trở nên sống động và biểu cảm hơn.
Ký hiệu này có nghĩa là ngay từ đầu câu (0%), bạn nên tăng ngữ điệu lên 30%, sau đó giữa câu (50%), giảm xuống 70%, và gần cuối (90%), lại tăng giọng lên 50%.
Chọn câu mà bạn muốn điều chỉnh ngữ điệu và nhấn nút ngữ điệu. Giao diện này sẽ xuất hiện.
Bạn sẽ thấy một biểu đồ với bốn điểm mặc định. Bạn có thể thêm tối đa năm điểm. Mỗi điểm trên biểu đồ theo sau điểm kia. Khi bạn thay đổi điểm đầu tiên, hãy chú ý đến gif bên dưới để xem mục nhập đầu tiên trong thẻ thay đổi như thế nào, sau đó là mục thứ hai, thứ ba, thứ tư và thứ năm. Mỗi điểm thay đổi bản ghi của nó trong dấu ngoặc một cách nghiêm ngặt theo thứ tự.
Nhờ giao diện, bạn có thể:
Lưới tọa độ được sắp xếp theo các khoảng tăng 20%. Nó không trùng với ranh giới từ trong văn bản. Hãy chú ý cách các từ được phân tách. Đây là hình ảnh hóa thời lượng của mỗi từ trong câu. Tôi đã vẽ một số đường màu xanh minh họa để cho thấy bạn có thể ảnh hưởng đến từng từ trên biểu đồ.
Cách sắp xếp điểm này tạo ngữ điệu cho từ "pink". Tôi đã đặt cách phát âm của từ này từ đầu, sau đó hạ thấp ngữ điệu, rồi đột ngột tăng lên ở giữa từ. Đây là phần nhấn mạnh kết quả:
Để thay đổi ngữ điệu, bạn không cần tạo nhiều điểm. Luôn bắt đầu với 2-3 điểm. Đây là ví dụ về cách tôi nhấn mạnh từ "where" bằng hai điểm.
Nghe ví dụ về kết quả:
Và đây là ví dụ về phiên bản "trước", một câu không có trọng âm được đặt.
Sự khác biệt là rõ rệt.
Từ "why" có thể được làm nổi bật khác đi, với một biến thể phát âm khác. Như thế này:
Nghe như thế này:
Trong ví dụ này, sự khác biệt là tôi đã hạ thấp ngữ điệu trước, sau đó tăng đột ngột, và sau đó lại hạ thấp. Điều này tạo ra hiệu ứng ít "chói tai" hơn.
Nhấn mạnh từ được thực hiện giống như đặt câu hỏi. Đây là một ví dụ
Nghe kết quả:
So sánh với phiên bản "trước", không có thay đổi ngữ điệu.
Có một cách khác để nhấn mạnh "impress" - tăng đột ngột ngữ điệu ở từ tiếp theo.
Nghe kết quả:
Có một sự nhấn mạnh, nhưng hơi khác.
Bây giờ nếu tôi di chuyển kiểu zigzag này xa hơn, tôi sẽ nhấn mạnh vào từ "people", như thế này:
Nghe kết quả:
Trong các câu khác nhau, bạn sẽ cần thử nghiệm với các độ cao cụ thể, điều chỉnh các điểm một chút. Thay đổi ngữ điệu sẽ không hoạt động trong mọi câu. Trong một số trường hợp sẽ rõ ràng, trong những trường hợp khác thì không.
Rất khó để phát triển các ví dụ phổ quát. Nhiều thứ phụ thuộc vào độ dài của câu, độ dài của từ và giọng nói tái tạo chúng. Tuy nhiên, có những mẫu nhất định mà bạn có thể thử nghiệm trong các trường hợp cụ thể.
Câu hỏi cơ bản: Trong hầu hết các trường hợp, đối với một câu hỏi, bạn sẽ thấy cấu trúc với một sự hạ thấp nhẹ ở đầu và một sự tăng đột ngột ở giữa từ là phù hợp.
Độ cao cụ thể của các điểm phụ thuộc vào chính từ đó. Mỗi lần là một thử nghiệm. Thay đổi độ cao và các điểm ở đầu, giữa và cuối từ.
Nhấn mạnh vào Từ Nghi Vấn: Để nhấn mạnh vào một từ nghi vấn ở đầu, hãy tạo một hình tam giác sắc nét như sau:
Hai tùy chọn này sẽ hữu ích ở hầu hết mọi nơi. Bạn hoặc hạ thấp, sau đó tăng giọng, hoặc ngay lập tức tăng lên. Điều này mang lại kết quả đáng chú ý nhất khi thay đổi ngữ điệu.
Để chọn ngữ điệu phù hợp, cần phải kiểm tra và thực hành. Theo thời gian, bạn sẽ bắt đầu nhận thấy các mẫu về cách giọng điệu và sự nhấn mạnh thay đổi tùy thuộc vào các mẫu độ cao khác nhau.