Mozilla Cộng đồng ’Tiếng nói chung - Cơ sở dữ liệu đám đông để cải thiện nhận dạng giọng nói


Tôi nhận được rất nhiều lời khen về giọng Scotland sâu sắc của mình nhưng khi nói đến các ứng dụng giọng nói như Siri và Alexa, giọng nói của tôi là một trách nhiệm nhiều hơn một tài sản. Khi Apple và Amazon làm trợ lý giọng nói, họ dường như không có chuyên gia tư vấn giọng nói Scotland về quay số nhanh.

Nếu nhận dạng giọng nói được cho là tương lai - và được cho là nơi chúng tôi dự định hướng tới - sau đó các công cụ tìm kiếm và trợ lý giọng nói cần bắt đầu thực hiện công việc tốt hơn để hiểu các dấu khó. Tất cả chúng ta đều không có giọng học sinh tiếng Anh công khai.

Mozilla (nhà sản xuất trình duyệt Firefox) đang cố gắng giải quyết vấn đề bằng cách yêu cầu mọi người tình nguyện lên tiếng với cơ sở dữ liệu có tên là Tiếng nói chung. Bằng cách kết hợp các giọng nói để đặt cụm từ, Mozilla hy vọng rằng cơ sở dữ liệu của họ cuối cùng sẽ là một công cụ vô giá trong tương lai cho bất kỳ ứng dụng nào tùy thuộc vào nhận dạng giọng nói.

Đăng ký 'Tiếng nói chung'

Trước khi chúng ta tiến xa hơn, trước tiên hãy giải quyết các vấn đề riêng tư, vì tôi đã có thể nghe thấy chúng xuất hiện.

Mặc dù bạn có thể đăng ký bằng tài khoản Firefox, tài khoản Github hoặc tài khoản Google của mình, thay vào đó bạn có thể đăng ký qua email . Chỉ cần mở một tài khoản email vứt đi ẩn danh và không ai sẽ là người khôn ngoan hơn bạn đang nói.

Khi bạn đã tạo tài khoản và đăng nhập, bạn sẽ xem bảng điều khiển của bạn.

Có hai phần - NóiNghe. Phần Nóilà nơi bạn được yêu cầu đóng góp tiếng nói của chính mình. Lắng nghelà nơi bạn lắng nghe tiếng nói của những người khác và so sánh họ với cụm từ họ phải nói. Sau đó, bạn sẽ cho biết nếu nó đúng.

Nói

Để tham gia vào phần nói, bạn sẽ cần một micrô hoạt động sẽ thu âm giọng nói của bạn rõ ràng. Bạn cũng cần cấp cho trang web Mozilla quyền truy cập vào micrô đó.

Khi bạn nhấp vào phần Nói, bạn sẽ được cung cấp một bộ năm cụm từ ngẫu nhiên để nói. Các hướng dẫn rất rõ ràng trên màn hình và dễ làm theo.

Bạn chỉ cần nhấp vào biểu tượng micrô bên dưới và sau đó đọc câu với giọng điệu bình thường. Don Tiết nói một giọng không tự nhiên hoặc nói thật chậm.

Toàn bộ vấn đề của bài tập là cơ sở dữ liệu học cách hiểu giọng của người dân theo cách họ thường nói. Nói theo một cách khác chỉ làm cho toàn bộ điều này trở nên vô nghĩa.

Khi cụm từ đầu tiên được thực hiện, bạn sẽ thấy ở góc trên bên phải các tùy chọn để phát lại clip và ghi lại clip nếu bạn không hài lòng với nó.

Nếu bạn hài lòng với nó, nó sẽ di chuyển vào câu tiếp theo và tiếp tục cho đến khi tất cả năm cụm từ được thực hiện. Sau đó nhấp vào nút Gửi màu xanh để gửi clip của bạn tới Mozilla để kiểm tra.

Nếu bây giờ bạn quay lại vào bảng điều khiển của bạn, bạn sẽ thấy rằng bạn đã được ghi có cho các cụm từ đó.

Sau đó, đó là một trường hợp đơn giản để rửa và lặp lại. Càng có nhiều đóng góp và các điểm nhấn khác nhau mà Mozilla có thể có trong cơ sở dữ liệu của họ, dự án sẽ càng thành công.

Nghe

Khi mọi người đã gửi cụm từ của họ tới Mozilla, họ cần được kiểm tra để đảm bảo clip thoại khớp với cụm từ. Đây là một cái gì đó cũng đang được đông đảo các tình nguyện viên.

Quay lại trên bảng điều khiển, bạn sẽ thấy phần Ngheở bên phải. Bạn có thể thấy từ phần Người đóng góp hàng đầurằng một số số liệu thống kê nghiêm trọng đã được cung cấp.

Để bắt đầu xác thực cụm từ giọng nói, hãy truy cập các Nghe  phần và bạn sẽ được cung cấp một cụm từ và nút phát.

Nhấp vào nút phát (đảm bảo loa của bạn được bật!) và bạn sẽ nghe thấy giọng nói được ghi. Nếu bạn quyết định cụm từ được nói chính xác, hãy nhấp vào . Nếu có phát âm sai, có điều gì đó đã nói hoặc bất kỳ lỗi nào khác, hãy nhấp vào NO.

Kết luận

Đây chỉ là một trong nhiều dự án mà Mozilla đang thực hiện (đi đến trang web chính của Mozilla và nhấp vào Dự ánở trên cùng - nó thay đổi mọi lúc). Dịch vụ đám đông là một cách tuyệt vời để các dự án xứng đáng xảy ra và luôn đáng để bạn dành thời gian để giúp xây dựng một cái gì đó hữu ích cho tương lai.

bài viết liên quan:


5.08.2019