Teknologi pengecaman muka ialah era baharu dalam analisis video, pengawasan video dan sistem kawalan akses. Pengiktirafan muka dalam runcit. Bagaimana kereta melihat

Dengan kerap dicemburui, artikel muncul di Habré bercakap tentang pelbagai kaedah pengecaman muka. Kami memutuskan bukan sahaja untuk menyokong topik yang menarik ini, tetapi untuk menerbitkan dokumen dalaman kami, yang merangkumi, jika tidak semua, tetapi banyak pendekatan untuk menghadapi pengiktirafan, kekuatan dan kelemahan mereka. Ia telah disusun oleh Andrey Gusak, jurutera kami, untuk pekerja muda jabatan penglihatan mesin, untuk tujuan pendidikan, boleh dikatakan. Hari ini kami menawarkannya kepada semua orang yang menginginkannya. Pada akhir artikel terdapat senarai rujukan yang mengagumkan untuk yang paling ingin tahu.

Jadi, mari kita mulakan.
Walaupun pelbagai jenis algoritma yang dibentangkan, struktur umum proses pengecaman muka boleh dikenal pasti:

Proses umum memproses imej muka semasa pengecaman

Pada peringkat pertama, wajah dikesan dan disetempatkan dalam imej. Pada peringkat pengecaman, imej muka dijajarkan (geometrik dan kecerahan), ciri dikira dan pengecaman dilakukan secara langsung—membandingkan ciri yang dikira dengan piawaian yang disimpan dalam pangkalan data. Perbezaan utama antara semua algoritma yang dibentangkan adalah pengiraan ciri dan perbandingan set mereka antara satu sama lain.

1. Kaedah perbandingan fleksibel pada graf (Pemadanan graf anjal).

Intipati kaedah datang kepada padanan anjal graf yang menerangkan imej muka. Muka diwakili sebagai graf dengan bucu dan tepi berwajaran. Pada peringkat pengecaman, salah satu graf - satu rujukan - kekal tidak berubah, manakala yang satu lagi cacat agar sesuai dengan yang pertama. Dalam sistem pengecaman sedemikian, graf boleh sama ada kekisi segi empat tepat atau struktur yang dibentuk oleh titik ciri (antropometrik) muka.

Contoh struktur graf untuk pengecaman muka: a) kekisi sekata b) graf berdasarkan titik antropometri muka.

Pada bucu graf, nilai ciri dikira, selalunya menggunakan nilai kompleks penapis Gabor atau set tertibnya - Wavelet Gabor (tatasusunan Gabor), yang dikira di beberapa kawasan tempatan puncak graf secara setempat dengan menggabungkan nilai kecerahan piksel dengan penapis Gabor.

Set (bank, jet) penapis Gabor

Contoh lilitan imej muka dengan dua penapis Gabor

Tepi graf ditimbang dengan jarak antara bucu bersebelahan. Perbezaan (jarak, ciri diskriminasi) antara dua graf dikira menggunakan beberapa fungsi kos ubah bentuk yang mengambil kira kedua-dua perbezaan antara nilai ciri yang dikira pada bucu dan tahap ubah bentuk tepi graf.
Ubah bentuk graf berlaku dengan mengalihkan setiap bucunya dengan jarak tertentu ke arah tertentu berbanding dengan lokasi asalnya dan memilih kedudukan sedemikian di mana perbezaan antara nilai ciri (tindak balas penapis Gabor) pada puncak ubah bentuk graf dan puncak sepadan graf rujukan adalah minimum. Operasi ini dilakukan satu demi satu untuk semua bucu graf sehingga jumlah perbezaan terkecil antara ciri-ciri graf yang cacat dan rujukan dicapai. Nilai fungsi kos ubah bentuk dalam kedudukan graf ubah bentuk ini akan menjadi ukuran perbezaan antara imej muka input dan graf rujukan. Prosedur ubah bentuk "relaksasi" ini mesti dilakukan untuk semua individu rujukan yang termasuk dalam pangkalan data sistem. Hasil pengecaman sistem adalah standard dengan nilai terbaik bagi fungsi harga ubah bentuk.

Contoh ubah bentuk graf dalam bentuk kekisi sekata

Sesetengah penerbitan menunjukkan kecekapan pengecaman 95-97% walaupun dengan kehadiran pelbagai ekspresi emosi dan perubahan sudut muka sehingga 15 darjah. Walau bagaimanapun, pembangun sistem perbandingan anjal pada graf menyebut kos pengiraan yang tinggi bagi pendekatan ini. Sebagai contoh, membandingkan imej muka input dengan 87 imej rujukan mengambil masa kira-kira 25 saat apabila dijalankan pada komputer selari dengan 23 transputer (Nota: penerbitan bertarikh 1993). Penerbitan lain mengenai topik ini sama ada tidak menunjukkan masa atau mengatakan bahawa ia panjang.

Kelemahan: kerumitan pengiraan yang tinggi bagi prosedur pengecaman. Teknologi rendah dalam menghafal standard baru. Kebergantungan linear masa operasi pada saiz pangkalan data muka.

2. Rangkaian saraf

Pada masa ini, terdapat kira-kira sedozen jenis rangkaian saraf (NN). Salah satu pilihan yang paling banyak digunakan ialah rangkaian yang dibina pada perceptron berbilang lapisan, yang membolehkan anda mengklasifikasikan imej/isyarat input mengikut konfigurasi/latihan awal rangkaian.
Rangkaian saraf dilatih pada satu set contoh latihan. Intipati latihan adalah untuk melaraskan berat sambungan interneuron dalam proses menyelesaikan masalah pengoptimuman menggunakan kaedah penurunan kecerunan. Semasa proses latihan NN, ciri utama diekstrak secara automatik, kepentingannya ditentukan, dan perhubungan di antara mereka dibina. Diandaikan bahawa NN yang terlatih akan dapat menggunakan pengalaman yang diperoleh semasa proses latihan kepada imej yang tidak diketahui kerana kebolehan generalisasinya.
Keputusan terbaik dalam bidang pengecaman muka (mengikut hasil analisis penerbitan) ditunjukkan oleh Convolutional Neural Network atau rangkaian neural convolutional (selepas ini dirujuk sebagai CNN), yang merupakan perkembangan logik idea-idea seni bina rangkaian saraf tersebut. sebagai kognitron dan neocognitron. Kejayaan itu adalah kerana keupayaan untuk mengambil kira topologi dua dimensi imej, berbeza dengan perceptron berbilang lapisan.
Ciri tersendiri CNN ialah medan reseptor tempatan (menyediakan sambungan dua dimensi neuron setempat), pemberat dikongsi (menyediakan pengesanan ciri tertentu di mana-mana dalam imej) dan organisasi hierarki dengan pensampelan spatial (subsampel spatial). Terima kasih kepada inovasi ini, CNN menyediakan rintangan separa terhadap perubahan dalam skala, anjakan, putaran, perubahan dalam perspektif dan herotan lain.

Ilustrasi skematik seni bina rangkaian saraf konvolusi

Menguji CNN pada pangkalan data ORL yang mengandungi imej wajah dengan sedikit perubahan dalam pencahayaan, skala, putaran ruang, kedudukan dan pelbagai emosi menunjukkan 96% ketepatan pengecaman.
CNN menerima perkembangannya dalam pembangunan DeepFace, yang diperoleh oleh
Facebook untuk mengenali wajah pengguna rangkaian sosialnya. Semua ciri seni bina ditutup.

Cara DeepFace berfungsi

Kelemahan rangkaian saraf: menambah orang rujukan baharu ke pangkalan data memerlukan latihan semula rangkaian yang lengkap pada keseluruhan set sedia ada (prosedur yang agak panjang, bergantung pada saiz sampel dari 1 jam hingga beberapa hari). Masalah sifat matematik yang dikaitkan dengan latihan: mencapai optimum tempatan, memilih langkah pengoptimuman optimum, latihan semula, dsb. Peringkat memilih seni bina rangkaian (bilangan neuron, lapisan, sifat sambungan) sukar untuk diformalkan. Merumuskan semua perkara di atas, kita boleh membuat kesimpulan bahawa rangkaian saraf adalah "kotak hitam" dengan keputusan yang sukar untuk ditafsir.

3. Model Markov Tersembunyi (HMM, HMM)

Salah satu kaedah statistik untuk pengecaman muka ialah model Markov tersembunyi masa diskret (HMM). HMM menggunakan sifat statistik isyarat dan secara langsung mengambil kira ciri spatialnya. Unsur-unsur model ialah: satu set keadaan tersembunyi, satu set keadaan yang diperhatikan, matriks kebarangkalian peralihan, kebarangkalian awal keadaan. Masing-masing mempunyai model Markov sendiri. Apabila mengenali objek, model Markov yang dijana untuk asas objek tertentu disemak dan kebarangkalian maksimum diperhatikan dicari bahawa urutan pemerhatian untuk objek tertentu dijana oleh model yang sepadan.
Sehingga kini, masih belum dapat mencari contoh aplikasi komersial HMM untuk pengecaman muka.

Kelemahan:
- adalah perlu untuk memilih parameter model untuk setiap pangkalan data;
- HMM tidak mempunyai keupayaan diskriminatif, iaitu algoritma pembelajaran hanya memaksimumkan tindak balas setiap imej terhadap modelnya, tetapi tidak meminimumkan tindak balas kepada model lain.

4. Analisis komponen utama (PCA)

Salah satu yang paling terkenal dan dibangunkan adalah analisis komponen utama (PCA), berdasarkan transformasi Karhunen-Loev.
Pada mulanya, kaedah komponen utama mula digunakan dalam statistik untuk mengurangkan ruang ciri tanpa kehilangan maklumat yang ketara. Dalam tugas pengecaman muka, ia digunakan terutamanya untuk mewakili imej muka dengan vektor dimensi rendah (komponen utama), yang kemudiannya dibandingkan dengan vektor rujukan yang disimpan dalam pangkalan data.
Matlamat utama kaedah komponen utama adalah untuk mengurangkan dengan ketara dimensi ruang ciri supaya ia menerangkan imej "tipikal" kepunyaan ramai individu sebaik mungkin. Menggunakan kaedah ini, adalah mungkin untuk mengenal pasti pelbagai variasi dalam set latihan imej muka dan menerangkan kebolehubahan ini berdasarkan beberapa vektor ortogon, yang dipanggil eigenfaces.

Set vektor eigen yang diperoleh sekali pada set latihan imej muka digunakan untuk mengekod semua imej muka lain, yang diwakili oleh gabungan wajaran vektor eigen ini. Menggunakan bilangan vektor eigen yang terhad, anggaran termampat kepada imej muka input boleh diperolehi, yang kemudiannya boleh disimpan dalam pangkalan data sebagai vektor pekali, yang juga berfungsi sebagai kunci carian dalam pangkalan data muka.

Intipati kaedah komponen utama adalah seperti berikut. Mula-mula, keseluruhan set latihan muka ditukar kepada satu matriks data biasa, di mana setiap baris mewakili satu contoh imej muka yang diuraikan menjadi satu baris. Semua muka dalam set latihan mesti dikecilkan kepada saiz yang sama dan dengan histogram yang dinormalkan.

Transformasi set latihan muka kepada satu matriks umum X

Kemudian data dinormalisasi dan baris dikurangkan kepada 0 min dan 1 varians, dan matriks kovarians dikira. Untuk matriks kovarians yang terhasil, masalah menentukan nilai eigen dan vektor eigen yang sepadan (eigenfaces) diselesaikan. Seterusnya, vektor eigen diisih dalam susunan nilai eigen yang menurun dan hanya vektor k pertama yang ditinggalkan mengikut peraturan:

Algoritma PCA

Contoh sepuluh vektor eigen pertama (eigenfaces) yang diperoleh daripada set muka terlatih

= 0.956*-1.842*+0.046 …

Contoh membina (mensintesis) muka manusia menggunakan gabungan muka eigen dan komponen utama

Prinsip memilih asas daripada vektor eigen terbaik yang pertama

Contoh memetakan muka ke dalam ruang metrik tiga dimensi yang diperoleh daripada tiga muka eigen dan pengecaman selanjutnya

Kaedah komponen utama telah membuktikan dirinya dengan baik dalam aplikasi praktikal. Walau bagaimanapun, dalam kes di mana imej muka mengandungi perubahan ketara dalam pencahayaan atau ekspresi muka, keberkesanan kaedah berkurangan dengan ketara. Masalahnya ialah PCA memilih subruang dengan matlamat memaksimumkan penghampiran set data input, dan tidak membezakan antara kelas muka.

Penyelesaian kepada masalah ini telah dicadangkan menggunakan diskriminasi linear Fisher (dalam literatur nama "Eigen-Fisher", "Fisherface", LDA ditemui). LDA memilih subruang linear yang memaksimumkan nisbah:

di mana

Matriks serakan antara kelas, dan

Matriks penyebaran intrakelas; m – bilangan kelas dalam pangkalan data.

LDA mencari unjuran data di mana kelas boleh dipisahkan secara linear secara maksimum (lihat rajah di bawah). Sebagai perbandingan, PCA mencari unjuran data yang memaksimumkan sebaran merentas seluruh pangkalan data muka (mengabaikan kelas). Mengikut keputusan eksperimen dalam keadaan tangki yang kuat dan teduhan bawah imej muka, Fisherface menunjukkan kecekapan 95% berbanding 53% Eigenface.

Perbezaan asas antara pembentukan unjuran PCA dan LDA

Perbezaan antara PCA dan LDA

5. Model Penampilan Aktif (AAM) dan Model Bentuk Aktif (ASM) ()

Model Penampilan Aktif (AAM)
Model Penampilan Aktif (AAM) ialah model statistik imej yang boleh dilaraskan kepada imej sebenar melalui pelbagai jenis ubah bentuk. Model jenis dalam versi dua dimensi ini dicadangkan oleh Tim Coots dan Chris Taylor pada tahun 1998. Model penampilan aktif pada mulanya digunakan untuk menganggar parameter imej muka.
Model penampilan aktif mengandungi dua jenis parameter: parameter yang dikaitkan dengan bentuk (parameter bentuk) dan parameter yang dikaitkan dengan model statistik piksel atau tekstur imej (parameter penampilan). Sebelum digunakan, model mesti dilatih pada set imej pra-label. Penandaan imej dilakukan secara manual. Setiap tanda mempunyai nombornya sendiri dan mentakrifkan titik ciri yang perlu dicari oleh model semasa menyesuaikan diri dengan imej baharu.

Contoh menanda imej muka daripada 68 titik membentuk bentuk AAM.

Prosedur latihan AAM bermula dengan menormalkan bentuk dalam imej berlabel untuk mengimbangi perbezaan dalam skala, kecondongan dan mengimbangi. Untuk tujuan ini, apa yang dipanggil analisis Procrustes umum digunakan.

Koordinat titik bentuk muka sebelum dan selepas normalisasi

Daripada keseluruhan set titik ternormal, komponen utama kemudiannya diekstrak menggunakan kaedah PCA.

Model bentuk AAM terdiri daripada kekisi triangulasi s0 dan gabungan linear anjakan si relatif kepada s0

Seterusnya, matriks terbentuk daripada piksel di dalam segitiga yang dibentuk oleh titik bentuk, supaya setiap lajurnya mengandungi nilai piksel tekstur yang sepadan. Perlu diingat bahawa tekstur yang digunakan untuk latihan boleh sama ada saluran tunggal (skala kelabu) atau berbilang saluran (contohnya, ruang warna RGB atau lain-lain). Dalam kes tekstur berbilang saluran, vektor piksel dibentuk secara berasingan untuk setiap saluran, dan kemudian ia digabungkan. Selepas mencari komponen utama matriks tekstur, model AAM dianggap terlatih.

Model penampilan AAM terdiri daripada penampilan asas A0 yang ditakrifkan oleh piksel dalam kekisi asas s0 dan gabungan linear ofset Ai berbanding A0

Contoh instantiasi AAM. Vektor parameter bentuk
p=(p_1,p_2,〖…,p〗_m)^T=(-54,10,-9.1,…)^T digunakan untuk mensintesis model bentuk s, dan vektor parameter λ=(λ_1,λ_2 ,〖…, λ〗_m)^T=(3559,351,-256,…)^T untuk mensintesis rupa model. Model muka akhir 〖M(W(x;p))〗^ diperoleh sebagai gabungan dua model - bentuk dan rupa.

Memasang model pada imej muka tertentu dilakukan dalam proses menyelesaikan masalah pengoptimuman, yang intipatinya bermuara kepada meminimumkan fungsi

Menggunakan kaedah penurunan kecerunan. Parameter model yang terdapat dalam kes ini akan mencerminkan kedudukan model dalam imej tertentu.

Contoh pemasangan model pada imej tertentu dalam 20 lelaran prosedur penurunan kecerunan.

Menggunakan AAM, anda boleh memodelkan imej objek tertakluk kepada ubah bentuk tegar dan tidak tegar. AAM terdiri daripada satu set parameter, sebahagian daripadanya mewakili bentuk muka, selebihnya menentukan teksturnya. Ubah bentuk biasanya difahami sebagai transformasi geometri dalam bentuk komposisi terjemahan, putaran dan skala. Apabila menyelesaikan masalah penyetempatan muka dalam imej, carian dibuat untuk parameter (lokasi, bentuk, tekstur) AAM yang mewakili imej tersintesis yang paling hampir dengan yang diperhatikan. Berdasarkan tahap kedekatan AAM dengan imej yang dipasang, keputusan dibuat sama ada ada muka atau tidak.

Model Bentuk Aktif (ASM)

Intipati kaedah ASM adalah untuk mengambil kira hubungan statistik antara lokasi titik antropometrik. Berdasarkan sampel yang tersedia bagi imej wajah yang diambil dari hadapan. Dalam imej, pakar menandakan lokasi titik antropometrik. Dalam setiap imej, titik dinomborkan dalam susunan yang sama.

Contoh perwakilan bentuk muka menggunakan 68 mata

Untuk membawa koordinat dalam semua imej kepada satu sistem, yang dipanggil. analisis Procrustes umum, akibatnya semua titik dibawa ke skala yang sama dan berpusat. Seterusnya, purata bentuk dan matriks kovarians dikira untuk keseluruhan set imej. Berdasarkan matriks kovarians, vektor eigen dikira dan kemudian diisih mengikut tertib menurun bagi nilai eigen yang sepadan. Model ASM ditakrifkan oleh matriks Φ dan vektor bentuk min s ̅.
Kemudian sebarang bentuk boleh diterangkan menggunakan model dan parameter:

Penyetempatan model ASM pada imej baru yang tidak termasuk dalam set latihan dijalankan dalam proses menyelesaikan masalah pengoptimuman.

a B C D)
Ilustrasi proses penyetempatan model ASM pada imej tertentu: a) kedudukan awal b) selepas 5 lelaran c) selepas 10 lelaran d) model telah menumpu

Walau bagaimanapun, matlamat utama AAM dan ASM bukanlah pengecaman muka, tetapi penyetempatan tepat muka dan titik antropometri dalam imej untuk pemprosesan selanjutnya.

Dalam hampir semua algoritma, langkah wajib sebelum pengelasan ialah penjajaran, yang bermaksud menjajarkan imej muka ke kedudukan hadapan berbanding kamera atau membawa satu set muka (contohnya, dalam set latihan untuk melatih pengelas) ke sistem koordinat tunggal. Untuk melaksanakan peringkat ini, adalah perlu untuk menyetempatkan ciri mata antropometrik semua muka pada imej - selalunya ini adalah pusat murid atau sudut mata. Penyelidik yang berbeza mengenal pasti kumpulan yang berbeza bagi mata tersebut. Untuk mengurangkan kos pengiraan untuk sistem masa nyata, pembangun memperuntukkan tidak lebih daripada 10 mata tersebut.

Model AAM dan ASM direka dengan tepat untuk menyetempatkan titik antropometrik ini dengan tepat dalam imej muka.

6. Masalah utama yang berkaitan dengan pembangunan sistem pengecaman muka

Masalah ringan

Masalah kedudukan kepala (muka adalah, selepas semua, objek 3D).

Untuk menilai keberkesanan algoritma pengecaman muka yang dicadangkan, DARPA dan Makmal Penyelidikan Tentera AS membangunkan program FERET (teknologi pengecaman muka).

Algoritma berdasarkan perbandingan fleksibel pada graf dan pelbagai pengubahsuaian kaedah komponen utama (PCA) mengambil bahagian dalam ujian berskala besar program FERET. Kecekapan semua algoritma adalah lebih kurang sama. Dalam hal ini, adalah sukar atau bahkan mustahil untuk membuat perbezaan yang jelas antara mereka (terutamanya jika tarikh ujian adalah konsisten). Untuk imej hadapan yang diambil pada hari yang sama, ketepatan pengecaman yang boleh diterima biasanya 95%. Untuk imej yang diambil dengan peranti berbeza dan di bawah pencahayaan yang berbeza, ketepatan biasanya menurun kepada 80%. Untuk imej yang diambil selang setahun, ketepatan pengecaman adalah kira-kira 50%. Perlu diingat bahawa walaupun 50 peratus adalah lebih daripada ketepatan yang boleh diterima untuk sistem seperti ini.

Setiap tahun, FERET menerbitkan laporan ujian perbandingan mengenai sistem pengecaman muka terkini berdasarkan lebih daripada satu juta muka. Malangnya, laporan terkini tidak mendedahkan prinsip membina sistem pengecaman, tetapi hanya menerbitkan hasil operasi sistem komersial. Hari ini, sistem terkemuka ialah sistem NeoFace yang dibangunkan oleh NEC.

Senarai rujukan (Google pada pautan pertama)

1. Pengecaman Wajah berasaskan imej - Isu dan Kaedah
2. Tinjauan Pengesanan Muka.pdf
3. Pengecaman Wajah Satu Tinjauan Literatur
4. Tinjauan teknik pengecaman muka
5. Tinjauan pengesanan muka, pengekstrakan dan pengecaman
6. Semakan kaedah untuk mengenal pasti orang berdasarkan imej muka
7. Kaedah untuk mengenali seseorang daripada imej muka
8. Analisis perbandingan algoritma pengecaman muka
9.Teknik Mengecam Muka
10. Mengenai satu pendekatan kepada penyetempatan titik antropometrik.
11. Pengecaman muka dalam foto kumpulan menggunakan algoritma segmentasi
12. Laporan kerja penyelidikan peringkat ke-2 mengenai pengecaman muka
13. Pengecaman Muka dengan Padanan Graf Tandan Anjal
14. Algoritma untuk mengenal pasti seseorang daripada gambar berdasarkan transformasi geometri. Tesis.
15. Herotan Pengecaman Objek Invarian dalam Seni Bina Pautan Dinamik
16. Pengecaman Muka Menggunakan Model Bentuk Aktif, Tampalan Tempatan dan Mesin Vektor Sokongan
17. Pengecaman Wajah Menggunakan Model Penampilan Aktif
18. Model Penampilan Aktif untuk Pengecaman Wajah
19. Penjajaran Muka Menggunakan Model Bentuk Aktif Dan Mesin Vektor Sokongan
20. Model Bentuk Aktif - Latihan dan Aplikasinya
21. Wajah Vektor Fisher di Alam Liar
22. Eigenfaces lwn. Pengecaman Fisherfaces Menggunakan Unjuran Linear Khusus Kelas
23. Eigenfaces dan fisherfaces
24. Pengurangan Dimensi
25. Tutorial ICCV 2011 mengenai Pendaftaran Boleh Cacat Berasaskan Bahagian
26. Model Tempatan Terkekang untuk Penjajaran Muka, Tutorial
27. Siapa anda – Mempelajari pengelas khusus orang daripada video
28. Pengecaman manusia daripada imej muka menggunakan kaedah rangkaian saraf
29. Pengecaman Muka Pendekatan Rangkaian Neural Konvolusi
30. Pengecaman Wajah menggunakan Rangkaian Neural Konvolusi dan Pengelas Logistik Mudah
31. Analisis Imej Wajah Dengan Rangkaian Neural Konvolusi
32. Kaedah pengecaman muka berdasarkan proses Markov tersembunyi. Pengarang-ferat
33. Aplikasi model Markov tersembunyi untuk pengecaman muka
34. Pengesanan Wajah dan Pengecaman Menggunakan Model Markov Tersembunyi
35. Pengecaman Wajah dengan GNU Octave-MATLAB
36. Pengecaman Wajah dengan Python
37. Pengecaman Wajah 3D Antropometrik
38. Pengecaman Muka 3D
39. Pengecaman Muka Berdasarkan Pemasangan Model 3D Morphable
40. Pengecaman Muka
41. Pengecaman Wajah Teguh melalui Perwakilan Jarang
42. Metodologi Penilaian FERET Untuk Algoritma Pengecaman Muka
43. Cari wajah dalam koleksi elektronik gambar sejarah
44. Reka Bentuk, Pelaksanaan dan Penilaian Sistem Visi Perkakasan khusus untuk Pengecaman Muka Masa Nyata
45. Pengenalan kepada Masalah Cabaran Pengecaman Wajah Yang Baik, Yang Buruk & Jelek
46. Penyelidikan dan pembangunan kaedah untuk mengesan wajah manusia dalam imej digital. Diploma
47. DeepFace Menutup Jurang kepada Prestasi Peringkat Manusia dalam Pengesahan Muka
48. Menghilangkan penamaan automatik watak dalam video TV
49. Ke arah Sistem Pengecaman Wajah Praktikal Penjajaran dan Pencahayaan Teguh oleh Perwakilan Jarang
50. Algoritma pengesanan muka manusia untuk menyelesaikan masalah gunaan analisis dan pemprosesan imej
51. Pengesanan dan penyetempatan wajah dalam imej
52. Mod Viola-Jones yang diubah suai
53. Pembangunan dan analisis algoritma untuk mengesan dan mengelaskan objek berdasarkan kaedah pembelajaran mesin
54. Gambaran Keseluruhan Cabaran Besar Pengecaman Wajah
55. Ujian Vendor Pengecaman Wajah (FRVT)
56. Mengenai keberkesanan penggunaan algoritma SURF dalam tugas mengenal pasti muka

Melihat bermakna memahami apa yang dilihat. Kita buta jika kawasan visual neokorteks, sejenis biokomputer yang bertanggungjawab untuk pengecaman imej, tidak berfungsi di dalam otak kita. Kini penganalisis serupa, yang mampu mengenali wajah dan memahami ekspresi mereka, muncul dalam sistem buatan.

Jadi perkara mendapat penglihatan, dan penglihatan mempunyai fikirannya sendiri. Pada mulanya saya rasa dia membosankan: sistem pengecaman muka LUNA yang baru dihidupkan tidak tergesa-gesa untuk memasuki mod biasa dan mengingati saya. Tetapi akhirnya dia melaporkan bahawa dia ingat dan meminta untuk memasukkan nama itu. LUNA boleh menentukan jantina dan umur itu sendiri. Jantina adalah mudah: Saya mempunyai janggut, tetapi sistem meningkatkan umur saya sebanyak lima tahun - nampaknya kerana janggut yang sama.

Kini kamera mengenali saya walaupun saya menanggalkan cermin mata saya atau memalingkan kepala saya. Kita perlu mencuba sesuatu yang lebih serius - kita menuju ke almari dengan rambut palsu dan misai palsu. Saya memilih keriting tebal yang juga menyembunyikan separuh muka saya - LUNA masih mengenali saya.

Setelah cukup bermain dengan rambut palsu, kami membuka ICQ dan mula berseronok dengan topeng untuk panggilan video: topeng digunakan pada wajah digital saya dalam masa nyata - Saya boleh bersembang video tanpa dikenali.

Nombor seterusnya program kami ialah Face.DJ. Apl ini membina model 3D wajah daripada swafoto, dan kemudian meletakkan wajah itu pada kepala maya supaya anda boleh mencuba gaya rambut dan aksesori. Satu lagi tujuan aplikasi adalah untuk menghidupkan pengguna, untuk membuat salinan kartun dia untuk permainan dan aktiviti dalam talian yang lain.

Kami sedang menyediakan permohonan yang sama untuk perkhidmatan temu janji: orang sering tidak mahu membuka mulut pada kenalan pertama,” kata Yulia, pakar PR di VisionLabs, syarikat yang membangunkan LUNA. - Sesetengah orang memakai topeng untuk menambah unsur permainan pada interaksi romantis mereka.

Sistem LUNA merentas platform juga mempunyai banyak topeng. Terdapat aplikasi dalam messenger Telegram yang mengenali jantina dan umur dengan muka, terdapat LUNA di awan dan LUNA untuk penyemak imbas. Tetapi perkara utama ialah program ini boleh dilaksanakan dalam pelbagai produk teknologi untuk digunakan untuk pengecaman wajah.

Sebagai contoh, salah seorang pelanggan kami perlu memilih foto - yang dipanggil tangkapan terbaik daripada strim video. Jadi, program kami mengatasi ini sendiri. Pelanggan lain memerlukan sistem untuk mengenali wajah bukan sahaja apabila memasuki bank dalam talian, tetapi sepanjang keseluruhan sesi, kerana anda boleh pergi dan penyerang akan menggunakan akses anda. Kami juga menghadapi tugas ini.

Pelanggan utama VisionLabs ialah bank. Sebagai contoh, di Bank Pochta, 50 ribu tempat kerja dilengkapi dengan sistem LUNA - ini adalah pelaksanaan biometrik terbesar di dunia. Ia juga penting untuk mengenali wajah pelanggan untuk membandingkan foto pasport dengan foto dalam pangkalan data. Lagipun, penipuan yang paling biasa di kawasan ini ialah menampal foto anda ke dalam pasport orang lain untuk mendapatkan pinjaman.

Bagaimana kereta melihat

Alexander Khanin, pengarah VisionLabs, mendekati kami.

Beritahu kami tentang penglihatan komputer?

Alexander Khanin: Penglihatan komputer adalah bidang matematik gunaan yang setara dalam kerumitan dengan tugas mencipta kecerdasan buatan secara umum. Saluran visual adalah saluran utama untuk menerima maklumat tentang dunia sekeliling. Dan kami lebih mempercayai apa yang kami lihat dengan mata kepala sendiri berbanding sumber lain.

Tugas kami adalah untuk mengajar program fotografi atau video untuk membuat kesimpulan dan memahami gambar seperti orang. Atau lebih baik lagi. Apabila mesin sepadan dengan manusia dalam kemahiran ini, kita boleh menganggap masalah itu diselesaikan. Setakat ini, ia telah diselesaikan hanya untuk beberapa kawasan aplikasi yang sempit. Contohnya, untuk mengenali kecacatan peralatan atau pengecaman muka.

Adakah masalah pengecaman muka telah selesai?

Alexander Khanin: Ya, ia telah pun ditunjukkan dengan pasti bahawa mesin membezakan wajah lebih baik daripada kita. Dan lebih tepat dan lebih pantas. Seseorang itu tidak begitu mahir dalam menentukan umur dan kewarganegaraan. Mereka yang tinggal di Eropah kurang dapat membezakan wajah orang yang berpenampilan Asia, begitu juga sebaliknya. Kita pun pelupa. Untuk mengatasi semuanya, mesin melakukannya berpuluh-puluh juta kali lebih pantas.

Tetapi seseorang menganalisis bukan parameter individu, tetapi seseorang dan juga keadaan secara keseluruhan. Kami memahami konteks di mana wajah lawan bicara mengambil ekspresi tertentu. Bagaimanakah kereta itu menghadapi semua ini?

Alexander Khanin: Menggabungkan teknik terbaik dalam penglihatan komputer dan pembelajaran mesin. Ambil, sebagai contoh, kaedah pembelajaran mendalam - keanehannya ialah seseorang tidak menentukan parameter muka untuk pengiktirafan.

Adakah program rangkaian saraf itu sendiri?

Alexander Khanin: Rangkaian saraf muncul kembali pada tahun 1970-an, dan revolusi di kawasan ini bermula sekitar 2013-2014. Kerana hanya pada masa ini adalah mungkin untuk mengumpul jumlah data yang cukup besar untuk melatih rangkaian saraf, dan kuasa pengkomputeran menjadi agak murah. Meneruskan membangunkan kaedah pengecaman deterministik - menyatakan bahagian muka yang mana untuk dibandingkan dengan cara - telah menjadi sia-sia.

Kejayaan itu datang apabila parameter pratetap, seperti perkara utama pada muka, telah ditinggalkan. Sebaliknya, mesin itu diberi tugas: "Lihat, ini sepuluh ribu pasang gambar, setiap pasangan adalah satu orang. Analisis mereka untuk dapat menentukan dalam foto yang anda belum lihat yang mana orang yang sama dan yang berbeza.” Mesin itu sendiri mencari parameter yang penting untuk menyelesaikan masalah ini.

Adakah ini cara anda melatih sistem anda?

Alexander Khanin: Ya, ini adalah tugas pengenalan biasa - bandingkan gambar yang diambil sekarang dengan foto dalam pasport dan sahkan bahawa ini adalah orang yang sama. Kami memberikan data besar kepada mesin sebagai input - berjuta-juta pasang gambar, dan pada output kami menuntut jawapan yang betul untuk mana-mana potret fotografi. Dan sistem belajar - ia melaraskan parameter itu sendiri untuk meminimumkan ralat. Iaitu, untuk pembelajaran mendalam, anda perlu mencari sampel latihan terlebih dahulu - banyak contoh penyelesaian yang betul. Kemudian program ini berfungsi dengan sendirinya.

Di manakah anda mendapat berjuta-juta pasang gambar ini?

Alexander Khanin: Terdapat sampel latihan yang tersedia untuk penyelidik - kami mula-mula menggunakannya, dan kemudian bekerja dengan rakan kongsi dan pelanggan yang membenarkan kami meneruskan latihan mengenai data mereka.

Bagaimana untuk berjaya dalam pasaran

Masalah mengenali orang melalui muka telah selesai. Bagaimana pula dengan definisi emosi?

Alexander Khanin: Sama seperti, sebagai contoh, di negara-negara Afrika orang memintas peringkat telegraf dan segera beralih ke rangkaian mudah alih, jadi kami, tanpa menyelesaikan masalah mengenali emosi, segera bergerak ke tahap yang lebih tinggi - untuk membuat kesimpulan tentang ciri-ciri manusia yang penting untuk kami. pelanggan. Pertunjukan perniagaan: tiada faedah daripada fakta bahawa mesin mengenali sama ada seseorang itu tersenyum atau berkerut dahi. Kemahiran yang lebih serius diperlukan.

Kenali pembohongan, contohnya?

Alexander Khanin: ya. Atau tentukan sama ada calon memenuhi keperluan anda atau tidak. Sama ada pelanggan berpuas hati dengan perkhidmatan itu atau tidak, senyuman bukan sahaja dapat menunjukkan kegembiraan, tetapi juga ejekan dan rasa tidak puas hati yang tersembunyi. Oleh itu, pengiktirafan emosi itu sendiri adalah subtugas. Kami mengkaji wajah dalam dinamik, urutan tindak balas kepada soalan, perkhidmatan dan persekitaran.

Adakah terdapat produk inovatif di luar sana yang anda sasarkan?

Alexander Khanin: Kami sendiri berada di sayap hadapan. Ia adalah fakta perubatan bahawa produk kami ialah sistem pengecaman muka komprehensif pertama di dunia untuk bank dan runcit, yang berfungsi dalam telefon mudah alih, di tapak web, di cawangan, di ATM dan di terminal layan diri - di mana-mana sahaja. Kami bukan sahaja yang pertama, tetapi setakat ini, setahu saya, satu-satunya.

Adakah sesetengah terminal layan diri sudah mempunyai sistem pengecaman muka yang dipasang?

Alexander Khanin: Ya, sebagai contoh, di Otkritie Bank - dalam terminal baris gilir elektronik. Dan ini bukan projek perintis, tetapi projek yang berfungsi dan memuaskan hati pelanggan dalam keadaan sebenar.

Adakah anda merasakan pesaing anda bernafas di leher anda?

Alexander Khanin: Terdapat banyak projek perintis di kawasan berhampiran dengan kami. Terdapat berpuluh-puluh syarikat yang berurusan dengan pengecaman muka di Rusia sahaja, kira-kira seratus di China, dan lebih daripada seribu di dunia. Itulah sebabnya saya katakan bahawa masalah pengecaman wajah itu sendiri telah diselesaikan, sekurang-kurangnya untuk kebanyakan segmen dan tugas praktikal.

Teknologi bukanlah apa yang penting untuk kejayaan dalam pasaran. Kebanyakan pelanggan tidak peduli apa teknologi yang kami ada dan cara kami menyelesaikan masalah, katakan, mempercepatkan perkhidmatan di bank atau kedai - menggunakan pengecaman muka, ramalan cuaca atau ilmu hitam. Adalah penting bagi mereka bahawa ada hasilnya.

Kenali semua orang!

Apakah tugas yang belum diselesaikan, tetapi akan dilaksanakan pada masa hadapan? Apakah yang sedang diusahakan oleh pakar?

Alexander Khanin: Salah satu masalah yang tidak dapat diselesaikan yang paling penting ialah pengecaman muka dalam persekitaran yang tidak terkawal sepenuhnya, seperti orang ramai. Ramai orang mengatakan bahawa mereka tahu bagaimana untuk melakukan ini, tetapi sebenarnya mereka belum melaksanakan perkara seperti ini lagi. Nampaknya, mereka bercakap sia-sia.

Bukankah haram untuk mengenali orang secara rawak dengan wajah mereka? Ini adalah penggunaan data peribadi.

Alexander Khanin: Perniagaan adalah dilarang, sudah tentu. Ini adalah pelanggaran hak asasi manusia dan pencerobohan privasi. Secara umum, teknologi kini membolehkan kita melakukan lebih daripada yang dibenarkan oleh undang-undang. Tetapi kami hanya bekerja di zon putih - dengan mematuhi undang-undang sepenuhnya. Adalah penting untuk kita tidak mencabul hak orang. Kami tidak mempunyai hak untuk menggunakan datanya dari rangkaian sosial tanpa persetujuan seseorang dan oleh itu kami tidak akan mencipta, sebagai contoh, sistem untuk kedai yang mencari maklumat tentang pelanggan berdasarkan fotonya. Tetapi kami boleh membangunkan program yang akan menganggarkan jantina dan umur pembeli berdasarkan foto.

Syarikat kami hanya bekerja dengan perniagaan, tetapi perkhidmatan keselamatan negara mempunyai sistem yang mencari orang berdasarkan gambar.

Iaitu, FSB dibenarkan, tetapi orang biasa tidak?

Alexander Khanin: ya. Jika agensi perisikan ingin mencari pengganas dalam khalayak ramai, ia perlu mengimbas dan mengenal pasti semua orang. Dan jika seseorang pergi ke kedai dan program foto menemui akaun rangkaian sosialnya, mengenali nombor telefonnya dan mula menghantar spam, ini adalah pelanggaran yang sangat serius. Di Barat terdapat liabiliti jenayah untuk ini.

Adakah lapangan terbang sudah mempunyai sistem pengecaman muka?

Alexander Khanin: Ya, terutamanya dalam kawalan pasport - mereka menyemak sama ada pasport anda, sama ada ia palsu dan sama ada anda berada dalam senarai disekat atau dalam senarai dikehendaki persekutuan. Di luar negara, tahap automasi jauh lebih tinggi. Di lapangan terbang Singapura, London, dan Paris, kawalan pasport boleh diselesaikan secara automatik, tanpa penyertaan pekerja. Anda mengimbas pasport anda, anda diambil gambar, perdamaian berlaku - dan itu sahaja, anda boleh meneruskan.

Cuba teka apa yang ada dalam gambar

Bagaimanakah visi komputer akan berkembang?

Alexander Khanin: Terdapat sekumpulan besar tugas yang dipanggil menjawab soalan visual: anda menunjukkan komputer gambar, dan ia mesti memahami apa yang ditunjukkan di sana. Ini sangat sukar: jika anda hanya mengajar untuk mengenali objek secara berasingan, tiada apa yang akan berfungsi - anda perlu memahami konteks dan kesalinghubungan objek.

Satu lagi tugas yang serupa ialah mengiktiraf tindakan manusia; mereka juga ditentukan sebahagian besarnya oleh konteks. Sebagai contoh, jika seseorang mengangkat tangannya, apakah maksudnya? Adakah dia memimpin atau dia akan memukul seseorang? Di sini kita duduk dan berfikir.

Jadi anda ingin mengajar mesin untuk mengenali imej yang maknanya bergantung pada konteks?

Alexander Khanin: Belajar untuk mentafsir konteks dan dengan itu mengenali gambar, tindakan, adegan.

Apabila robot akan melihat cahaya

Alexander Khanin: Saya ingin melihat pembangunan visi komputer selesai. Kemudian robot akan mempunyai mata sebenar, yang bermaksud mereka akan dapat memahami apa yang berlaku dan bertindak balas dengan sewajarnya. Jika tidak, mereka tidak akan menjadi sebahagian daripada masyarakat, tetapi akan kekal sebagai mainan dengan alat kawalan jauh.

Bagaimanakah sistem pengecaman muka akan mengubah kehidupan kita pada tahun-tahun akan datang?

Alexander Khanin: Anda pasti akan melihat operasi sistem sedemikian semasa kebenaran - contohnya, apabila anda membuka kunci telefon anda. Ramai yang sudah terbiasa dengan Touch ID, tetapi tidak lama lagi kaedah yang paling biasa akan log masuk menggunakan muka anda. Apabila anda pulang ke rumah, anda tidak perlu mencari kunci anda dan anda tidak memerlukan pas di tempat kerja. Perkhidmatan dan layan diri di bank, kedai, dan di seluruh sektor perkhidmatan akan dipercepatkan: pembayaran akan dilakukan tanpa kad.

Jalan-jalan akan menjadi lebih selamat kerana akan ada pengawasan video dengan fungsi pengesanan. Bandar dan negara akan menerima perlindungan tambahan, dan pembalasan untuk jenayah akan menjadi tidak dapat dielakkan. Sistem akan merekodkan segala-galanya: siapa yang melakukannya dan ke mana, ke mana dia pergi kemudian. Konsep "bandar selamat" akan digantikan dengan "bandar pintar": infrastruktur yang sama akan menyediakan keselamatan dan, sebagai contoh, mengawal aliran orang dan kereta, serta banyak lagi.

Sistem kamera dan penglihatan komputer yang sama dipasang di mana-mana?

Alexander Khanin: Ya, algoritma tidak peduli siapa yang harus dikenali: pelanggan VIP atau pencuri. Wajah setiap orang berstruktur sama: mata, mulut dan hidung. Tetapi ia bukan hanya tentang wajah. Sistem yang sama boleh menangani, katakan, kawalan pencahayaan. Jika tiada orang di dalam bilik, mengapa perlu membakar elektrik? Mesin akan memanggil perkhidmatan utiliti jika ia mengesan masalah, dan sebagainya.

Hidup di dunia di mana segala-galanya boleh dilihat adalah menakutkan. Secara teknikal, semakin mudah untuk membina distopia di mana semua orang berada di bawah pengawasan penuh...

Alexander Khanin: Saya fikir dunia akan menjadi tempat yang lebih baik dan tempat yang lebih selamat. Tetapi ia akan menjadi lebih sukar untuk berbohong. Sebagai contoh, saya dan rakan kongsi baru-baru ini telah membangunkan produk yang bukan sahaja memberikan akses kepada ruang kerja, tetapi juga mengambil kira masa yang dihabiskan di sana: tiba pada masa ini, ditinggalkan pada masa ini. Anda melangkau berjalan-jalan, lewat, tidak pulang dari makan tengah hari - semuanya akan direkodkan.

Dan tidak akan ada cara untuk bersembunyi dari ini? Mungkin akan ada topeng dengan muka orang lain pada mereka.

Alexander Khanin: Sudah tentu, terdapat banyak cara untuk menipu sistem, dan di kawasan ini "perlumbaan senjata" baru bermula. Terdapat video di mana mereka mengajar cara membuat solek yang menghalang pengecaman. Tetapi itu tiga tahun lalu - algoritma semasa tidak boleh ditipu dengan begitu mudah.

Bagaimana jika anda menunjukkan gambar dan bukannya muka?

Alexander Khanin: Untuk mengenal pasti penipu, "pengesan hayat" khas diprogramkan ke dalam sistem pengecaman muka, yang menentukan sama ada orang di hadapannya atau gambar. Terdapat beberapa petunjuk keceriaan. Yang paling mudah, yang dianggap standard dunia, berkelip. Sistem ini juga boleh meminta orang itu tersenyum, memalingkan kepalanya atau mendekatkan diri ke kamera untuk memastikan bahawa mereka adalah nyata. Tetapi jika kamera dilengkapi dengan sensor kedalaman, ini tidak diperlukan: mesin segera memahami bahawa terdapat objek tiga dimensi dalam bingkai, dan bukan foto.

Siapa lagi yang mendahului?

Pengecaman muka bukan sahaja sains dan teknologi, tetapi juga perniagaan besar, yang berkembang dengan pesat di negara maju. Syarikat penyelidikan Allied Market Research meramalkan bahawa menjelang 2022 perolehannya akan hampir sepuluh bilion dolar. Antara pemain terkemuka terdapat pemain Rusia. Daripada berpuluh-puluh syarikat permulaan dan projek penyelidikan, kami telah mengenal pasti tiga yang paling berjaya.

NTechLab. Graduan Universiti Negeri Moscow Artem Kukharenko bermula dengan aplikasi yang menentukan baka anjing dari gambar. Tetapi pada tahun 2015, algoritma FaceN yang diciptanya bersama rakan kongsinya dalam projek NTechLab memenangi dua daripada empat kategori dalam pertandingan pengecaman muka utama dunia, MegaFace, menewaskan pasukan Google. Walau bagaimanapun, kemasyhuran sebenar datang kepada syarikat selepas pembangunan aplikasi FindFace yang paling popular, yang direka untuk mencari orang di rangkaian sosial VKontakte dengan foto. Hari ini, bilangan aplikasi untuk penyepaduan teknologi FindFace menghampiri seribu.

Vocord. Syarikat Vocord dengan selamat boleh dianggap sebagai juara dunia dalam pengecaman muka: di laman web pertandingan MegaFace ia mendapat tempat pertama, mendahului dengan margin yang ketara. Pasukan Vocord adalah veteran dalam pasaran sistem penglihatan komputer: mereka mengeluarkan program pengecaman muka biometrik jauh Vocord FaceControl pada tahun 2008, hari ini produk mereka digunakan oleh lebih daripada dua ribu organisasi komersial dan kerajaan. Syarikat itu pakar dalam pengenalan wajah, iaitu, mencari seseorang dalam khalayak ramai.

VisionLabs. Produk mereka adalah antara tiga sistem pengecaman muka komersial terbaik dunia. Baca lebih lanjut mengenai syarikat ini dalam teks utama.

Jenis utama biometrik

Klasifikasi antarabangsa kaedah untuk mengenal pasti seseorang

Muka. Program yang menggunakan imej foto atau video wajah menganalisis saiz dan bentuk mata, hidung, tulang pipi, kedudukan relatif mereka dan, berdasarkan data ini, mencipta gabungan unik, yang kemudiannya membandingkan dengan yang sedia ada untuk perlawanan.

Cap jari. Kaedah cap jari adalah berdasarkan keunikan corak papillary kulit dan digunakan secara meluas dalam forensik.

ucapan. Kaedah pengecaman berdasarkan menukar pertuturan pertuturan kepada maklumat digital.

Mata. Pengecaman berlaku hasil daripada membandingkan imej digital iris dengan yang tersedia dalam pangkalan data.

Vienna. Kaedah pengenalan berdasarkan corak vena tangan atau jari.

Lebih daripada tiga ribu kamera video rangkaian pengawasan video bandar telah disambungkan ke sistem pengecaman muka. Imej video dianalisis secara automatik dalam masa nyata: sistem boleh menentukan identiti orang dalam video, jantina dan umurnya.

Sistem pengawasan video Moscow telah dilatih untuk mengenali wajah. Terima kasih kepada algoritma berdasarkan penggunaan rangkaian saraf, rakaman video daripada kamera bandar dianalisis dalam masa nyata. Wajah pada rakaman diimbas supaya, jika perlu, ia boleh dibandingkan dengan maklumat dalam pelbagai pangkalan data - contohnya, dalam pangkalan data foto agensi penguatkuasaan undang-undang apabila ia datang untuk mencari pesalah. Di samping itu, sistem analisis sedemikian boleh membantu agensi penguatkuasaan undang-undang, apabila menangkap penjenayah, membina laluan untuk pergerakannya di sekitar bandar. Sistem itu sendiri akan memilih video yang diperlukan daripada kamera pengawasan yang berbeza, mengenal pasti suspek dalam video tersebut. Rangkaian metropolitan terdiri daripada 160 ribu kamera video dan meliputi 95 peratus pintu masuk bangunan kediaman. Menjelang akhir tahun, rakyat akan dapat memasang kamera secara bebas di rumah mereka dan menyambungkannya ke sistem pengawasan video bersatu.

“Pengenalan analisis video merupakan pemacu yang berkuasa untuk meningkatkan kecekapan kedua-dua sistem pengawasan video persendirian dan bandar. Penduduk bandar kini mempunyai tahap perlindungan tambahan,” kata Artem Ermolaev, ketua Jabatan Teknologi Maklumat Moscow. — Sudah tentu, semua peluang ini mesti dilaksanakan dengan penuh tanggungjawab. Keutamaan kami adalah untuk mengimbangi privasi dan keselamatan, dan kami mengekalkan kawalan dalaman yang ketat untuk memastikan hak rakyat dihormati."

Pada masa ini, kira-kira 16 ribu pengguna disambungkan ke sistem pengawasan bandar - ini adalah pekerja agensi penguatkuasaan undang-undang, organisasi negeri dan perbandaran. Setiap satu mempunyai tahap akses sendiri, yang membolehkan anda mengekalkan kerahsiaan maklumat. Pegawai penguatkuasa undang-undang boleh mendapatkan data yang diperlukan atas permintaan dalam rangka kerja perundangan semasa, dan kakitangan agensi kerajaan menerima akses kepada kamera video hanya dari wilayah dan laluan yang mereka bertanggungjawab. Setiap panggilan ke sistem penjejakan direkodkan.

Fungsi pengecaman muka berfungsi dalam talian, proses pengenalan mengambil masa beberapa saat. Jika algoritma mengesan seseorang yang mukanya dimuat naik ke pangkalan data, ia akan menghantar amaran kepada agensi penguatkuasaan undang-undang.

Jabatan juga menyatakan bahawa pengenalan fungsi pengecaman muka telah meningkatkan kecekapan menyiasat kesalahan dan mencari penjenayah. Semasa ujian rintis, ia digunakan untuk mengesan dan menahan lebih daripada 50 peratus pelanggar undang-undang yang dicari menggunakan algoritma analisis. Sebelum ini, sebahagian daripada mereka tidak dapat ditemui selama bertahun-tahun.

Muscovite akan dapat menyambungkan kamera pengawasan mereka ke rangkaian bandar umum. Pilihan ini akan dilaksanakan sebelum akhir tahun. Video daripada kamera sedemikian akan dihantar ke pusat penyimpanan dan pemprosesan data bersatu (DSDC), dan rakaman daripadanya boleh digunakan sebagai bukti penting di sisi undang-undang di mahkamah.

Tahun ini, lebih daripada 3.5 ribu kamera tambahan telah disambungkan ke pusat penyimpanan dan pemprosesan data tunggal. Akses kamera video, kamera yang dipasang di wilayah dan di bangunan sekolah dan tadika, di stesen MCC, stadium, perhentian pengangkutan awam dan stesen bas, serta di taman disambungkan kepada sistem bersatu. Selain itu, menjelang Jun 2018, kamera CCTV akan muncul di 25 lintasan pejalan kaki bawah tanah di ibu negara. Peranti rakaman akan dipasang di laluan bawah tanah yang tidak disambungkan ke stesen metro dan berada di bawah bidang kuasa Institusi Belanjawan Negeri Gormost.

Sistem keselamatan bersepadu moden mampu menyelesaikan masalah apa-apa kerumitan di semua jenis kemudahan perindustrian, sosial dan domestik. Sistem pengawasan video ialah alat yang sangat penting dalam sistem keselamatan, dan keperluan untuk kefungsian segmen itu semakin berkembang.

Sistem keselamatan yang komprehensif

Platform bersatu termasuk modul untuk peralatan keselamatan dan kebakaran, kawalan akses dan pengurusan, pengawasan video atau televisyen litar tertutup (CCT). Sehingga baru-baru ini, fungsi yang terakhir adalah terhad kepada pemantauan video dan rakaman keadaan di kemudahan dan kawasan sekitar, mengarkib dan menyimpan data. Sistem video klasik mempunyai beberapa kelemahan yang ketara:

Faktor manusia. Prestasi pengendali yang tidak berkesan apabila menyiarkan sejumlah besar maklumat.
Kemustahilan campur tangan pembedahan, analisis yang tidak tepat pada masanya.
Kos masa yang ketara untuk mencari dan mengenal pasti sesuatu peristiwa.

Perkembangan teknologi digital telah membawa kepada penciptaan sistem automatik "pintar".

Kekuatan ada pada akal

Prinsip asas analisis intelektual ialah analisis video - teknologi berdasarkan kaedah dan algoritma untuk pengecaman imej dan pengumpulan data automatik hasil daripada analisis aliran video. Peralatan sedemikian, tanpa campur tangan manusia, mampu mengesan dan menjejaki sasaran yang ditentukan dalam masa nyata (kereta, sekumpulan orang), situasi yang berpotensi berbahaya (asap, kebakaran, campur tangan tanpa kebenaran dalam pengendalian kamera video), acara yang diprogramkan dan segera. mengeluarkan isyarat penggera. Dengan menapis data video yang tidak diminati, beban pada saluran komunikasi dan pangkalan data arkib dikurangkan dengan ketara.

Alat analisis video yang paling popular ialah sistem pengecaman muka. Bergantung pada fungsi yang dilakukan dan tugas yang diberikan, keperluan tertentu dikenakan ke atas peralatan.

Perisian dan perkakasan

Untuk memastikan operasi sistem yang cekap, beberapa jenis kamera video IP dengan ciri prestasi berbeza digunakan. Pengesanan objek dalam wilayah terkawal dirakam oleh kamera panoramik dengan resolusi 1 megapiksel dan panjang fokus 1 mm dan peranti pengimbasan dihalakan ke arahnya. Ini adalah kamera yang lebih maju (dari 2 MP, dari 2 mm), yang melakukan pengecaman menggunakan kaedah mudah (3-4 parameter). Untuk mengenal pasti objek, kamera dengan kualiti imej yang baik digunakan, mencukupi untuk penggunaan algoritma yang kompleks (dari 5 MP, 8-12 mm).

Produk perisian pengecaman wajah yang paling popular "Face Intellect" (dibangunkan oleh syarikat House Control), pengarah Face (syarikat Sinesis) dan VOCORD FaceControl (VOCORD) menunjukkan:

Kebarangkalian tinggi pengenalan objek (sehingga 99%).
Sokongan untuk pelbagai sudut putaran kamera.
Kemungkinan untuk mengenal pasti muka walaupun dalam keramaian pejalan kaki yang padat.
Kebolehubahan dalam penyediaan laporan analisis.

Asas Pengecaman Corak

Mana-mana sistem pengecaman biometrik adalah berdasarkan mengenal pasti korespondensi ciri fisiologi yang dibaca seseorang kepada templat tertentu yang ditentukan.

Pengimbasan berlaku dalam masa nyata. Kamera IP menyiarkan aliran video ke terminal, dan sistem pengecaman muka menentukan sama ada imej itu sepadan dengan gambar yang disimpan dalam pangkalan data. Terdapat dua kaedah utama. Yang pertama adalah berdasarkan prinsip statik: berdasarkan hasil pemprosesan parameter biometrik, sampel elektronik dibuat dalam bentuk nombor unik yang sepadan dengan orang tertentu. Kaedah kedua memodelkan pendekatan "manusia" dan dicirikan oleh pembelajaran kendiri dan keteguhan. Pengenalpastian seseorang daripada imej video mengambil kira perubahan berkaitan usia dan faktor lain (kehadiran hiasan kepala, janggut atau misai, cermin mata). Teknologi ini membolehkan anda bekerja walaupun dengan gambar lama dan, jika perlu, dengan x-ray.

Algoritma carian muka

Teknik yang paling biasa untuk mengesan wajah adalah menggunakan lata Haar (set topeng).

Topeng adalah tingkap segi empat tepat dengan pelbagai kombinasi segmen putih dan hitam.

Mekanisme program adalah seperti berikut: bingkai video ditutup dengan satu set topeng, dan berdasarkan hasil lilitan (mengira piksel yang jatuh ke dalam sektor putih dan hitam), perbezaannya dikira dan dibandingkan dengan nilai ambang tertentu .

Untuk meningkatkan prestasi pengelas, sampel latihan positif (bingkai dengan muka manusia) dan negatif (tanpa mereka). Dalam kes pertama, hasil lilitan berada di atas nilai ambang, dalam kes kedua - di bawah. Pengesan muka, dengan ralat yang boleh diterima, menentukan jumlah lilitan semua lata dan, jika ambang melebihi, menandakan kehadiran muka dalam bingkai.

Teknologi pengiktirafan

Selepas pengesanan dan penyetempatan, peringkat awal melibatkan kecerahan dan penjajaran geometri imej. Tindakan selanjutnya - pengiraan ciri dan pengenalpastian - boleh dijalankan menggunakan pelbagai kaedah.

Apabila mengimbas muka penuh di dalam bilik dengan pencahayaan yang sangat baik, hasil yang baik ditunjukkan oleh algoritma yang berfungsi dengan imej dua dimensi. Dengan menganalisis titik unik dan jarak antara mereka, sistem pengecaman muka menentukan fakta pengecaman berdasarkan pekali perbezaan antara imej "langsung" dan templat yang didaftarkan.

Teknologi tiga dimensi tahan terhadap perubahan fluks cahaya, sisihan yang dibenarkan dari sudut hadapan adalah sehingga 45 darjah. Di sini, bukan sahaja titik dan garisan dianalisis, tetapi juga sifat permukaan (kelengkungan, profil), dan metrik jarak antara mereka. Untuk algoritma sedemikian berfungsi, kualiti rakaman video maksimum dengan kekerapan sehingga 200 bingkai/s diperlukan. Sistem ini berdasarkan kamera video stereo dengan matriks 5 megapiksel, resolusi optik tinggi dan ralat penyegerakan dikurangkan kepada minimum. Selain itu, ia disambungkan dengan kabel pemasaan khas untuk menghantar denyutan jam.

Keadaan pasaran sistem moden

Yang pertama, kerana kosnya yang tinggi, dibangunkan hanya untuk kemudahan tentera kerajaan dan hanya pada pertengahan 90-an telah tersedia untuk organisasi komersial. Perkembangan pesat teknologi telah memungkinkan untuk meningkatkan ketepatan sistem dan mengembangkan skop aplikasinya. Kedudukan utama dalam pasaran negara kita adalah milik pengeluar sistem keselamatan Amerika dan Eropah Barat. Yang paling laris ialah peralatan daripada syarikat ZN Vision Technologies dan Visionics. Yang paling menjanjikan di kalangan pemaju domestik ialah penyelidikan dan produk Vocord, NTechLab, Soling, VisionLabs LLC dan kumpulan TsRT, yang, antara lain, turut terlibat dalam menyesuaikan kompleks asing dengan keadaan Rusia.

Kawalan muka komputer

Bidang aplikasi pengenalan tanpa sentuh yang paling luas ialah memerangi keganasan dan jenayah. Imej muka penjenayah itu disimpan dalam pangkalan data. Di tempat yang mempunyai ramai orang (lapangan terbang, stesen kereta api, pusat membeli-belah, institusi sukan), aliran orang sedang direkodkan dalam masa nyata untuk mengenal pasti orang yang dikehendaki.

Kawasan seterusnya ialah sistem kawalan akses: contoh gambar pada pas elektronik dibandingkan dengan model yang diperoleh hasil pemprosesan data daripada kamera video. Prosedur ini berlaku serta-merta, tanpa memerlukan sebarang tindakan tambahan daripada mereka yang menjalaninya (tidak seperti imbasan retina atau cap jari).

Satu lagi industri yang berkembang pesat ialah pemasaran. Papan iklan interaktif mengimbas wajah seseorang, menentukan jantina dan umurnya, dan memvisualisasikan hanya iklan yang berpotensi menarik minat pelanggan.

Trend dan prospek pembangunan

Sistem pengecaman muka sangat diperlukan dalam sektor perbankan.

Pada akhir tahun lepas, pengurusan Bank Pochta, selepas memasang 50,000 kamera video pintar di pejabatnya, berjaya menjimatkan berjuta-juta rubel dengan menghalang penipuan dalam segmen pinjaman dan pembayaran. Pakar mengatakan bahawa menjelang 2021 rangkaian infrastruktur yang diperlukan akan diwujudkan dan sebarang operasi di ATM akan menjadi mungkin hanya selepas pengenalan biometrik wajah pelanggan.

Dalam dekad yang akan datang, teknologi tinggi akan memungkinkan untuk membuka rangkaian kedai layan diri penuh: pembeli berjalan di hadapan tingkap paparan, memilih produk yang dia suka dan meninggalkannya. Sistem pengecaman muka dan imej akan menentukan identiti pembeli, membeli dan mendebit jumlah yang diperlukan daripada akaunnya.

Kerja sedang dijalankan untuk mencipta sistem untuk mengenali keadaan psiko-emosi. Analisis emosi manusia akan menjadi permintaan dalam bidang multimedia: animasi, pawagam, dan industri permainan komputer.

Membuka era baru. Teknologi pengecaman muka adalah ciri utamanya. Dan tiada siapa yang meragui bahawa kaedah membuka kunci ini akan dilaksanakan dalam banyak telefon pintar lain.

Pada tahun 1960-an, eksperimen khas telah dijalankan di mana komputer perlu belajar mengenali wajah seseorang. Kemudian ini tidak membawa apa-apa, kerana sebarang emosi membawa kepada kegagalan. Juga, sistem yang dicipta takut mengubah keadaan pencahayaan.

Hanya pada penghujung abad ke-20 sistem muncul yang belajar mengenal pasti wajah orang daripada gambar, mengingati mereka. Pada masa yang sama, mereka tidak lagi gagal apabila misai, janggut, cermin mata dan "gangguan" lain muncul. Paling aktif, sistem sedemikian mula dilaksanakan dalam kamera digital. Mereka juga mendapat tempat untuk diri mereka sendiri dalam sektor keselamatan.

Sistem pengecaman muka telah lama mempunyai satu kelemahan yang ketara. Mereka sangat bergantung pada pencahayaan dan sudut. Walau bagaimanapun, masalah ini tidak ketara dalam pengimbas keselamatan. Wajah itu ditekan hampir rapat kepada mereka, kemudian diterangi oleh lampu. Pengenalan fotografi stereo membantu menyingkirkan kelemahan yang disebutkan di atas. Dua kamera memahami kedalaman adegan, dan oleh itu ketepatan bacaan meningkat beberapa kali.

Bagaimanakah teknologi pengecaman muka berfungsi?

Secara beransur-ansur, ciri baru mula muncul dalam telefon pintar. Di sini, pengenalan pengguna biometrik dilaksanakan supaya orang yang tidak dibenarkan tidak dapat membuka kunci peranti. Sebaik-baiknya, hanya kembar boleh mengakses maklumat peribadi. Tidak perlu risau tentang perkara ini. Tidak mungkin sesiapa akan serius menyembunyikan sesuatu daripada abang atau kakak mereka. Dan tiada siapa yang mengganggu anda untuk menetapkan kata laluan tambahan untuk membaca beberapa data khususnya rahsia.

Operasi sistem pengecaman muka dalam telefon pintar boleh dibahagikan kepada empat peringkat:

Pengimbasan muka. Ini dilakukan menggunakan kamera hadapan atau, seperti dalam kes iPhone X, sensor khas. Imbasan adalah 3D, jadi helah foto tidak akan berfungsi.
Ekstrak data unik. Sistem memfokuskan pada satu set ciri wajah yang sedang diimbas. Selalunya ini adalah kontur soket mata, bentuk tulang pipi dan lebar hidung. Dalam sistem lanjutan, parut mungkin juga kelihatan.
Mendapatkan semula templat dengan data yang diterima sebelum ini daripada ingatan.
Cari padanan. Peringkat akhir di mana sistem memutuskan sama ada untuk membuka kunci paparan. Kuasa pemproses moden membolehkan anda menghabiskan hanya sepersekian saat untuk "berfikir".

Fungsi pengecaman muka boleh dilaksanakan walaupun menggunakan kamera hadapan - asalkan ia mempunyai dua kanta. Walau bagaimanapun, dalam kes ini, operasi fungsi ini akan menjadi tidak stabil. Hakikatnya hanya penderia khas akan memastikan pengimbasan muka walaupun dalam gelap, manakala kamera hadapan memerlukan pencahayaan yang terang. Selain itu, penderia khas hampir memaparkan bilangan mata yang lebih besar pada muka, jadi ia dicetuskan walaupun apabila janggut, cermin mata dan halangan lain muncul. Secara ringkasnya, dalam sesetengah DOOGEE Mix 2 sistem pasti akan berfungsi dengan ketara lebih teruk berbanding iPhone X. Perkara lain ialah kos produk ulang tahun Apple lebih tinggi daripada semua telefon pintar lain dengan fungsi pengecaman muka.

Adakah teknologi masa depan?

Penderia yang diperlukan untuk pengimbasan muka memerlukan pemasangan yang sempurna. Peralihan seperseratus milimeter akan membawa kepada fakta bahawa operasi fungsi tidak lagi ideal - oleh itu, semasa pengeluaran telefon pintar, peningkatan hasil kecacatan mungkin diperhatikan, dan ini membawa kepada peningkatan dalam kosnya. Dan penderia itu sendiri sangat mahal; bukan untuk apa-apa yang hanya Apple menggunakannya, walaupun ia tidak mempunyai sebarang paten untuknya.

Pendek kata, buat masa ini, pengeluar Android akan melaksanakan fungsi pengecaman muka menggunakan kamera hadapan. Anda sudah boleh menemuinya dalam Samsung Galaxy S8 dan Note 8. Tetapi pemilik peranti ini akan memberitahu anda bahawa peranti ini tidak berfungsi dengan baik - lebih mudah menggunakan pengimbas cap jari. Oleh itu, tiada apa yang boleh dikatakan tentang masa depan fungsi itu lagi. Kita perlu menunggu untuk melihat sama ada Apple akan melaksanakan penderia yang sepadan dalam telefon pintar yang lebih mampu milik, dan sama ada ia akan muncul dalam peranti Android.

Kesimpulan

Tidak perlu risau tentang menyimpan data pengenalan anda. Templat yang dibuat semasa mengimbas muka terletak di bahagian memori yang berasingan - sektor ini tidak boleh dibaca oleh komputer atau program pihak ketiga. Walau bagaimanapun, ini juga terpakai pada cap jari. Jenis pengenalan yang lebih mudah digunakan terpulang kepada anda untuk membuat keputusan.

Pernahkah anda memegang telefon pintar yang boleh mengecam wajah anda? Dan adakah anda menjangkakan penggunaan besar-besaran ciri ini? Kongsi pendapat anda dalam komen, kami akan gembira mengenainya!