Dùng AI để tái tạo giọng nói ảo tiếng Việt

Công nghệ do Xinapse phát triển cho phép tổng hợp và tái tạo giọng nói ảo tiếng Việt, ngay cả khi đó là của người đã khuất.

Tái tạo giọng nói ảo tiếng Việt bằng trí tuệ nhân tạo (AI) là dịch vụ do Xinapse cung cấp. Đây là start-up công nghệ có trụ sở tại Seoul (Hàn Quốc). Công ty này vừa thành lập liên doanh để tiến vào thị trường Việt Nam.

Được thành lập vào năm 2017 và sở hữu hơn 100 nhân viên, Xinapse chuyên phát triển các công nghệ tương tác sử dụng AI. Sản phẩm chính của Xinapse là máy nói với các giọng nói ảo được tạo thành nhờ AI.

Dựa trên dữ liệu giọng nói thu thập được, máy nói của Xinapse sẽ tổng hợp và tạo ra giọng nói ảo bằng công nghệ AI. Đây cũng là công ty đầu tiên trên thế giới tiến hành thương mại hóa giọng nói ảo chất lượng cao ở tần số 32.000 Hz.

Trên thực tế, Xinapse từng tập hợp tiếng nói của 100 người để tạo ra giọng nói ảo của một người không hề tồn tại. Giọng nói ảo này sau đó được sử dụng để lồng tiếng cho một video quảng cáo trên truyền hình.

Công nghệ xử lý ngôn ngữ tự nhiên để chuyển văn bản thành giọng nói còn được ứng dụng trong các nội dung sách nói và đọc tin tức. Cấu trúc và cao độ của giọng nói ảo có thể được tùy chỉnh dựa theo ý muốn và nhu cầu, mục đích của người dùng.

Hiện Xinapse đang là đối tác cung cấp 59.000 dữ liệu chỉ đường bằng giọng nói ảo cho TMAP Mobility. Đây là ứng dụng bản đồ số 1 tại Hàn Quốc với hơn 19 triệu người sử dụng.

Dùng AI để tái tạo giọng nói ảo tiếng Việt - Ảnh 1.

Xinapse cung cấp 59.000 dữ liệu chỉ đường bằng giọng nói ảo cho TMAP Mobility

Không chỉ biết tạo ra giọng nói ảo bằng AI, công cụ của Xinapse còn có khả năng tái tạo giọng nói của một con người cụ thể dựa trên các đặc điểm phát âm của họ.

Tại Hàn Quốc, Xinapse từng gây tiếng vang khi phát đi thông điệp với giọng nói ảo của một vị cố tổng thống nước này. Một huyền thoại bóng chày Hàn Quốc là Choi Dong Won (mất năm 2011) cũng từng tái xuất trước công chúng thông qua giọng nói ảo AI do Xinapse phát triển.

Trong năm 2023, Xinapse đang có dự định ra mắt dịch vụ lưu trữ danh tính bằng giọng nói. Các dữ liệu này được sử dụng để một người cha, người mẹ quá cố gửi lời chúc tới con mình. Dữ liệu giọng nói cũng có thể được dùng để cung cấp dịch vụ sách nói cho trẻ dựa trên giọng đọc ảo của ông bà, bố mẹ.

Dịch vụ tái tạo giọng nói bằng AI của Xinapse hiện mới chỉ hỗ trợ tiếng Hàn và tiếng Anh. Với nỗ lực tuyển dụng người Việt để thu âm tạo nguồn dữ liệu giọng nói thời gian gần đây, tiếng Việt sẽ là ngôn ngữ thứ 3 được Xinapse hỗ trợ.

Theo ông Lee Hyung Sung - tổng giám đốc Xinapse Việt Nam: "Chúng tôi đang thu thập và gán nhãn giọng nói tiếng Việt để sớm tung ra thị trường dịch vụ tái tạo giọng nói ảo cho người Việt Nam. Người dùng Việt Nam sẽ sớm được trải nghiệm giọng nói ảo bằng tiếng Việt".

"Việc mở rộng hoạt động ra khắp thế giới, trong đó có Việt Nam là bước đi quan trọng của Xinapse nhằm tiếp cận gần hơn nữa các khách hàng toàn cầu", ông Lee Hyung Sung nói.