Máy ảnh thông minh dạng đeo có thể phát hiện ra lệnh nói im lặng

Hai nhà nghiên cứu từ Đại học Cornell đã tạo ra một camera thông minh hồng ngoại có thể đeo được có thể phát hiện lệnh thoại ngay cả khi người nói không phát ra âm thanh bằng cách đo cổ và mặt từ dưới cằm.

Tính hữu ích của tính năng phát hiện giọng nói im lặng

Cheng Zhang, trợ lý giáo sư khoa học thông tin tại Đại học Máy tính và Khoa học Thông tin Cornell Ann S. Bowers, và nghiên cứu sinh tiến sĩ Ruidong Zhang của Đại học Cornell đã phát triển chiếc máy ảnh đeo được và đặt tên cho nó là “SpeeChin”. Đây là thiết bị nhận dạng giọng nói im lặng dựa trên vòng cổ đầu tiên có thể phát hiện 54 lệnh giọng nói im lặng bằng tiếng Anh và 44 lệnh nói im lặng tiếng Trung Quốc.

Zhang nói: “Hãy tưởng tượng khi đôi tay của bạn bị chiếm dụng hoặc đơn giản là bạn không muốn tiếp cận với các thiết bị thông minh của mình để tương tác với chúng, bạn có thể muốn sử dụng điều khiển bằng giọng nói. “Tuy nhiên, nếu bạn đang ở một nơi ồn ào hoặc trong một cuộc họp, điều khiển bằng giọng nói sẽ không hiệu quả hoặc không phù hợp về mặt xã hội. Đây là lúc nói im lặng được đưa ra. ”

SpeeChin sử dụng một camera hồng ngoại gắn ở cổ có thể ghi lại chuyển động của cằm từ bên dưới, cho phép nó xác định những từ đang được nói ngay cả khi không nghe thấy âm thanh nào. Vị trí đặt máy ảnh phần lớn loại bỏ mọi lo ngại về quyền riêng tư và cũng cho phép nó tinh tế hơn nhiều so với vị trí gắn phía trước.

Độ tin cậy cao trong môi trường hạn chế

Gizmodo báo cáo rằng hai sinh viên đã thử nghiệm SpeeChin với 20 người tham gia: 10 người nói 54 cụm từ đơn giản bao gồm số và lệnh trợ lý giọng nói thông thường bằng tiếng Anh và 10 người nói 44 từ và cụm từ đơn giản bằng tiếng Trung. Một khi máy ảnh và logic được đào tạo, nó có thể nhận dạng các lệnh bằng tiếng Anh với độ chính xác 90,5% và tiếng Trung với độ chính xác 91,6%.

Tuy nhiên, những điểm cao này chỉ đạt được khi những người tham gia đó ngồi yên tại chỗ. Một khi họ được yêu cầu di chuyển, độ tin cậy của việc nhận dạng suy giảm do kết quả của sự thay đổi trong dáng đi và chuyển động của đầu. Thật không may, điều này làm giảm đáng kể số lượng nơi có thể sử dụng thiết bị SpeeChin.

Yêu cầu đeo cố định có thể là một vấn đề với sự lặp lại này của SpeeChin, nhưng về mặt lý thuyết sẽ có thể khắc phục điều này bằng cách đào tạo lâu hơn với logic hoặc một camera hồng ngoại được cải tiến. Thiết bị được sử dụng trong lần lặp lại đầu tiên này rõ ràng là vẫn còn khá mới, vì vậy việc nhìn thấy những thay đổi này trong các lần lặp lại sau này dường như không có gì khó hiểu.