KHÁC BIỆT CÁC GIỌNG ĐỌC NHÂN TẠO ĐA VÙNG MIỀN CỦA VIETTEL AI

04:12 | 24-12-2019

Tại Việt Nam, lĩnh vực AI nói chung và Giọng nói nhân tạo nói riêng vẫn còn là một lĩnh vực mới mẻ, chưa thực sự được đầu tư phát triển. Sự phát triển của các lĩnh vực này trong tương lai có thể giúp giải quyết các vấn đề như hỗ trợ học tập dễ dàng hơn, trở thành “phát thanh viên” chuyên nghiệp trong các công việc như đọc truyện, đọc báo, tổng đài trả lời thông tin tự động; lĩnh vực chăm sóc khách hàng từ đó cũng trở nên dễ dàng và tiết kiệm chi phí hơn rất nhiều. 

Giờ đây chỉ cần truy cập vào một số tờ báo điện tử có tích hợp AI do Tập đoàn Viettel cung cấp, bạn đã có thể chọn “nghe báo” và thỏa sức tùy chỉnh giọng nam hoặc nữ, miền Bắc, miền Trung hay miền Nam tùy theo sở thích. Một số người lần đầu lắng nghe đã nhầm tưởng liệu đây có phải là giọng người thật ghi âm hay không, bởi chất giọng được tạo ra từ AI khá truyền cảm, mượt mà và nhịp điệu vừa phải. 

 

Giọng đọc nhân tạo theo giới tính, vùng miền, tính cách, từng bước cá nhân hóa các chất giọng theo yêu cầu riêng biệt. Ứng dụng cụ thể vào từng lĩnh vực, giải quyết nhiều bài toán cụ thể một cách tự nhiên.

Không riêng gì báo chí, mà lĩnh vực công vụ hành chính cũng sẽ thu được nhiều lợi ích lớn lao từ những loại hình công nghệ mang tính cá nhân hoá cao. Ví dụ, một người Hà Nội mới chuyển vào sinh sống ở Huế, do chưa quen giọng địa phương nên chắc chắn sẽ gặp nhiều khó khăn trong việc trao đổi với những nhân viên hành chính tại đây. Trong trường hợp này, các tổ chức hành chính có thể sử dụng công nghệ tiếng nói nhân tạo, với thiết lập tông giọng riêng biệt cho từng khách hàng, tuỳ theo vùng miền địa phương của họ, để tiện việc trao đổi.


Ví dụ: Báo giọng Huế

Nhờ ứng dụng công nghệ TTS, tổng đài tự động trở thành những trợ lý ảo giúp doanh nghiệp phục vụ khách hàng hiệu quả, nhanh chóng.

Hệ thống hỗ trợ doanh nghiệp tạo nội dung và gọi tự động tới các nhóm thuê bao đã được phân loại để phục vụ cho các mục đích riêng biệt như quảng cáo, chăm sóc khách hàng, bán hàng tự động...với tốc độ xử lý lên cả ngàn cuộc gọi mỗi ngày, tiếp cận số lượng lớn người dùng trong thời gian ngắn.

Các lĩnh vực khác, dù là điện ảnh, kinh tế hay giáo dục, nếu được ứng dụng các loại hình công nghệ với tính cá nhân hoá cao, đều có thể mang lại những lợi ích tương tự cho cộng đồng.  


Ví dụ: Nghe báo

Việc đưa các giải pháp Text to Speech phục vụ chăm sóc khách hàng rõ ràng giúp các doanh nghiệp chuyên nghiệp hơn, nhanh chóng hơn trong vấn đề tiếp cận và hỗ trợ cho chính khách hàng của mình, từ đó mở rộng được đối tượng khách, giúp người dùng có những trải nghiệm ấn tượng khi sử dụng dịch vụ và mua sắm của doanh nghiệp.

Chị Hương (Hà Nội) chia sẻ: “Bây giờ ngay cả khi đang lái xe, tôi cũng có thể dễ dàng nghe báo điện tử để cập nhật đa dạng các tin tức bằng các giọng đọc rất dễ nghe, thay vì chỉ nghe nhạc và radio như trước”.

Công nghệ Chuyển đổi văn bản thành âm thanh (Text to Speech) đang được xem là bước tiến quan trọng trong xu hướng nghiên cứu, phát triển ứng dụng từ Trí tuệ nhân tạo (AI), và khi đó người dùng sẽ ngày càng quan tâm hơn là tính cá nhân hóa mà các giọng nói nhân tạo này đem đến thị trường, giọng thật, tự nhiên và phục vụ các nhu cầu riêng biệt ắt hẳn sẽ chiếm lĩnh thị trường.