Nhận dạng khuôn mặt là một trong những vấn đề cốt lõi của thị giác máy tính và đã được nghiên cứu tích cực trong hơn hai thập kỷ. Khi nhận diện khuôn mặt với video hoặc hình ảnh, mục tiêu là xác định xem chúng có thuộc cùng một người hay không. Nhiều thuật toán đã được chứng minh là hoạt động tốt trên các hình ảnh được thu thập. Tuy nhiên, hiệu suất của các thuật toán này thường giảm đáng kể trên các hình ảnh có sự thay đổi lớn về tư thế, ánh sáng, biểu cảm, mỹ phẩm và sự lão hóa của con người.
Máy chấm công với công nghệ nhận dạng khuôn mặt không bị giới hạn (Học sâu) và chống giả mạo là những cột mốc mới, đại diện cho cấp độ lịch sử mới của công nghệ nhận dạng khuôn mặt. Bằng cách cho phép học sâu các chỉ số trên khuôn mặt để so sánh các đặc điểm khuôn mặt của người nhằm đạt được độ chính xác cao hơn so với phương pháp truyền thống. Thông tin về độ sâu pixel để có độ chính xác cao so với độ chính xác bằng cách phân chia giữa khuôn mặt và hình dạng tại chỗ.
Công nghệ nhận diện khuôn mặt không bị giới hạn
Nhận dạng khuôn mặt không giới hạn (học sâu) là gì?
Nhận diện khuôn mặt không bị giới hạn đóng một vai trò quan trọng trong quá trình học các số liệu chính xác để so sánh các đặc điểm khác nhau trên khuôn mặt con người.
Khác với phương pháp truyền thống như FaceNet, Face Net chuẩn bị bộ dữ liệu nhận diện khuôn mặt bao gồm trích xuất khuôn mặt trước thông qua hệ thống nhận diện khuôn mặt và sau đó trích xuất các đặc điểm khuôn mặt thông qua nhúng khuôn mặt.
Nhận diện khuôn mặt không giới hạn chỉ tập trung vào các tính năng tốt nhất. Do đó, nó định hình không gian và quyết định bằng cách học cách biểu diễn tiềm ẩn, trong đó các cặp phù hợp và không khớp được ánh xạ vào các phân phối mục tiêu được phân tách rõ ràng và xát minh một cách tốt nhất.
Ưu điểm của việc nhận dạng khuôn mặt không bị giới hạn
Tận dụng lợi thế của việc sử dụng MetricNet (Mạng số liệu), nó luôn đạt được độ chính xác cao hơn so với phương pháp truyền thống. Độ chính xác cao hơn từ 98,06% đến 99,80% bằng cách học số liệu hình ảnh và so sánh với các đặc điểm trên khuôn mặt.
Trong khi đó, các thuật toán cho phép tìm hiểu số liệu tốt nhất trong mạng số liệu và tuân theo các phân phối mục tiêu để cải thiện độ chính xác và kết quả.
Cách hoạt động của tính năng nhận dạng khuôn mặt không bị giới hạn
– Bước 1: Mạng lưới tính năng (Feature Net)
Mạng lưới tính năng về cơ bản là mạng lưới các máy dò được sắp xếp thành từng lớp. Lớp dò tính năng là cách mô hình được đặt tên. Lớp tiếp theo lên liên quan đến các đối tượng có kích thước lớn hơn. Và sau đó chúng lại di chuyển lên các đối tượng lớn hơn rồi đến lớp cuối cùng.
– Bước 2: Nối và xâu chuổi các dữ kiện (Concat)
– Bước 3: Mạng lưới số liệu (MetricNets)
– Bước 4: Phân phối mục tiêu (Target distribution)
Công nghệ nhận diện khuôn mặt chống giả mạo
Công nghệ chống giả mạo trong nhận diện khuôn mặt là gì?
Hệ thống sinh trắc học thường dễ bị hack bởi các thủ thuật gian lận khác nhau. Ví dụ điển hình như là in, video, mặt nạ 3D và trang điểm. Công nghệ nhận diện khuôn mặt chống giả mạo khuôn mặt (FAS) đóng một vai trò quan trọng trong việc bảo mật hệ thống nhận dạng khuôn mặt. Với thuật toán phát hiện thông minh, FAS giúp hệ thống nhận dạng khuôn mặt bảo mật tốt và thu hút nhiều sự chú ý hơn từ các ngành công nghiệp khác nhau.
Công nghệ chống giả mạo khuôn mặt mới nhất áp dụng kỹ thuật tiến tiến nhất hiện nay là sử dụng máy ảnh 3D. Mặc dù các cuộc tấn công 3D vẫn gây ra những khó khăn cho nhận dạng khuôn mặt, nhưng hiệu suất ổn định của FAS khiến cho tính năng chống giả mạo này hứa hẹn nhất.
Công nghệ chống giả mạo nhận diện khuôn mặt hoạt động như thế nào?
– Bước 1: Khối Residual (Residual Block)
Việc xếp chồng các lớp sẽ không làm giảm hiệu suất mạng. Chúng ta có thể đơn giản xếp chồng các ánh xạ đồng nhất lên mạng hiện tại và hiệu quả của kiến trúc không thay đổi. Điều này giúp cho kiến trúc sâu ít nhất là không kém hơn các kiến trúc nông. Hơn nữa, với kiến trúc này, các lớp ở phía trên có được thông tin trực tiếp hơn từ các lớp dưới nên sẽ điều chỉnh trọng số hiệu quả hơn.
Ý tưởng chính của ResNet (mạng học sâu) là sử dụng kết nối tắt đồng nhất để xuyên qua một hay nhiều lớp. Một khối như vậy được gọi là một residual block.
– Bước 2: Mô hình đa cấp độ
Mô hình đa tỷ lệ đề cập đến một phong cách mô hình hóa trong đó nhiều mô hình ở các quy mô khác nhau được sử dụng đồng thời để mô tả một hệ thống. Các mô hình khác nhau thường tập trung vào các thang độ phân giải khác nhau
– Bước 3: Mô-đun Attention (Attention Module)
– Bước 4: Tính năng kết hợp
– Bước 5: Bản đồ quyết định (Decision Mapping)
Lập bản đồ quyết định là một phương pháp để cải thiện việc ra quyết định bằng cách tạo ra một sơ đồ trực quan về cấu trúc logic của quá trình ra quyết định.
Bảng thống kê thông số nhận dạng khuôn mặt chính xác và tỉ lệ sai
Thuật toán nhận dạng khuôn mặt mới nhất có tốc độ nhận dạng vô cùng ấn tượng:
– Tốc độ nhận dạng khuôn mặt thực tế sau khi cài đặt và nâng cấp firmware mới: 0,3 giây
– Tốc độ thuật toán nhận dạng khuôn mặt: 0,15 giây (tốc độ tăng gấp đôi so với phiên bản trước)
Version/Type | FAR (False Acceptance Rate) | FRR (False Rejection Rate) |
East Asia (e.g. China, Korea, Japan) | 0.01% | 0.02% |
Europe and the United States (e.g. Europe, Russia, North America) | 0.19% | 0.03% |
Latin America (e.g. Mexico, Peru, Chile) | 0.25% | 0.04% |
South Asia (e.g. India, Thailand, Vietnam) | 0.29% | 0.04% |
Middle East (e.g. Dubai, Saudi Arabia, Egypt) | 0.33% | 0.04% |
Africa (e.g. South Africa) | 0.55% | 0.05% |