Các nhà nghiên cứu ở ĐH Công nghệ Nanyang và ĐH Công nghệ Sydney đã phát triển một cấu trúc học máy có khả năng nhận dạng các cử chỉ của con người. Để làm được điều này, cấu trúc sẽ phân tích các hình ảnh tổng hợp từ các cảm biến có khả năng co dãn. Bài báo về cấu trúc mới của nhóm nghiên cứu đã được công bố trên tạp chí Nature Electronics.
Khung học máy liên kết với thông tin hình ảnh và thông tin cảm giác thân thể. Nguồn: Wang et al.
“Ý tưởng của chúng tôi bắt nguồn từ cách bộ não của con người xử lý thông tin”, Xiaodong Chen, một trong các nhà nghiên cứu thực hiện đề tài, cho biết. “Trong bộ não của con người, các hoạt động nhận thức cao như suy nghĩ, lên kế hoạch, truyền cảm hứng, không chỉ phụ thuộc vào thông tin của một giác quan cụ thể mà còn bắt nguồn từ sự tổng hợp toàn diện các thông tin đa giác quan từ nhiều cảm biến. Điều này đã truyền cảm hứng cho chúng tôi kết hợp các thông tin hình ảnh và thông tin cảm giác thân thể (somatosensory) để triển khai phương pháp nhận dạng cử chỉ với độ chính xác cao.”
Khi con người thực hiện các công việc trong thực tế, chúng ta thường tích hợp các thông tin hình ảnh và thông tin cảm giác thân thể từ môi trường xung quanh lại với nhau. Khi kết hợp hai dạng thông tin này lại, chúng sẽ giúp con người nảy sinh ra các ý tưởng tốt hơn bao gồm tất cả các yếu tố liên quan đến vấn đề cần giải quyết.
Do đó, kỹ thuật nhận dạng cử chỉ của Chen và các cộng sự có khả năng tích hợp được các loại thông tin cảm giác khác nhau từ nhiều cảm biến. Mục tiêu cuối cùng của họ là xây dựng được một cấu trúc có khả năng nhận diện được các động tác của con người với độ chính xác cao. “Để đạt được mục tiêu này, chúng tôi đã nâng cao chất lượng dữ liệu cảm biến bằng cách thiết kế và chế tạo các cảm biến phù hợp và có khả năng co dãn, đồng thời tổng hợp được các thông tin cảm giác thân thể về các cử chỉ tay một cách chính xác hơn so với các cảm biến khác hiện nay”, Chen cho biết. “Ngoài ra, chúng tôi đã phát triển một cấu trúc học tập trực quan - cảm giác thân thể phỏng sinh học (BSV) có khả năng hợp nhất hai thông tin này, tương tự như hệ thống phân cấp hợp nhất hình ảnh - cảm giác thân thể ở trong não.”
Cấu trúc học tập BSV do Chen và các cộng sự sáng chế mô phỏng lại cách mà não người tổng hợp các thông tin cảm giác - thị giác theo nhiều cách khác nhau. Đầu tiên, cấu trúc đa lớp và phân cấp của nó bắt chước theo cấu trúc của não bộ, tuy nhiên thay mạng lưới thần kinh sinh học bằng các mạng lưới nhân tạo.
Cùng với đó, một số mạng lưới cục bộ trong cấu trúc cũng sẽ xử lý các dữ liệu cảm giác giống với các dữ liệu được xử lý bởi các mạng lưới thần kinh ở trong não. Chẳng hạn như, khi một mạng lưới thần kinh tích chập (CNN) cục bộ thực hiện một hoạt động tích chập cụ thể, nó mô phỏng lại chức năng của trường tiếp nhận cục bộ (local receptive field) trong hệ thống thần kinh sinh học theo cách nhân tạo, và do đó bắt chước quá trình xử lý thông tin hình ảnh ban đầu vốn diễn ra ở các bộ phận chịu trách nhiệm về thị giác trong não người.
Cuối cùng, cấu trúc này sẽ hợp nhất các điểm đặc trưng bằng cách sử dụng một mạng lưới thần kinh thưa thớt (sparse neural network) mới được phát triển gần đây. Mạng lưới này phỏng theo cách những tế bào thần kinh đa cảm giác có trong não bộ tái hiện các tương tác ban đầu và tiết kiệm hiệu năng giữa thông tin hình ảnh và thông tin cảm giác thân thể.
“Kỹ thuật mà chúng tôi đã phát triển có ba đặc điểm độc nhất”, Chen giải thích. “Thứ nhất, nó có thể xử lý được các tương tác sớm giữa thông tin hình ảnh và thông tin cảm giác thân thể. Thứ hai, các hoạt động tích chập được thực hiện bởi mạng lưới CNN có sự tương đồng với chức năng của trường tiếp nhận cục bộ (local receptive field) trong hệ thống thần kinh sinh học - một hệ thống có khả năng tự động tìm hiểu các đặc trưng không gian sâu phân cấp và trích xuất các đặc trưng bất biến thay đổi (shift-invariant features) từ những hình ảnh gốc. Cuối cùng, chúng tôi có một chiến lược giản lược mới dựa trên vào hệ số điều hòa Frobenius (Frobenius condition number) để hình thành mạng lưới thần kinh thưa thớt tiết kiệm năng lượng”. □
Mỹ Hạnh dịch
Nguồn: https://techxplore.com/news/2020-07-brain-inspired-architecture-human-gesture-recognition.html
Ý kiến bạn đọc