Gezichtsherkenningssysteem met behulp van videobewakingssystemen. Gezichtszoekalgoritme. Organisatie van toegangscontrole met behulp van gezichtsherkenning. Samsung Galaxy S8 biometrische beveiligingstruc

Het is de bedoeling dat het biometrische gezichtsherkenningssysteem wordt opgenomen in de ‘slimme stad’-standaard voor Russische steden, die het ministerie van Bouw is begonnen te ontwikkelen. Plaatsvervangend afdelingshoofd Andrei Chibis vertelde Izvestia hierover. Hij merkte op dat dergelijke technologie gemakkelijk te gebruiken zou zijn openbaar vervoer: een passagier stapt in de bus, het programma herkent hem en schrijft het geld voor de reis af van zijn bankrekening. Het ministerie is van plan zich vertrouwd te maken met de ervaringen van Chinese steden en soortgelijke technologieën in Rusland te verspreiden.

Het ministerie is van plan Chinese bedrijven, waaronder Huawei, aan te trekken om samen met Rostelecom biometrische technologie en gebeurtenisanalyse te implementeren Russische steden. Vice-minister van Bouw en Volkshuisvesting en Gemeenschappelijke Diensten Andrei Chibis vertelde Izvestia hierover. Volgens hem zal dit systeem, indien succesvol, de basis vormen van de ‘smart city’-standaard – een minimumpakket aan oplossingen om het comfort van steden te verbeteren. De afdeling is al begonnen met het ontwikkelen van de standaard.

Vertegenwoordigers van het ministerie zijn van plan China te bezoeken om te beoordelen hoe moderne technologieën, inclusief biometrie, werken daar.

Voor zover ik weet is er nu discussie over de introductie van dergelijke technologie in Moskou. Het is duidelijk dat vanwege de noodzaak om kaarten te gebruiken, de instaptijd voor passagiers wordt vertraagd. En het gezichtsherkenningsalgoritme werkt als volgt: een passagier stapt de metro of bus in, het programma herkent hem en schrijft geld van zijn bankrekening af voor de reis, Andrei Chibis gaf een voorbeeld.

In veel steden is al een aanzienlijk aantal camera's geïnstalleerd, dat wil zeggen dat de infrastructuur als geheel is gecreëerd, benadrukte de ambtenaar. De vraag gaat over regelgeving en de implementatie van proefprojecten – of deze succesvol zijn verder proces zal snel zijn: “net zoals we snel wegkwamen van tokens in de metro, zo kunnen we ook wegkomen van tourniquets.”

De persdienst van Rostelecom merkte op dat het identificeren van passagiers in het openbaar vervoer, inclusief het betalen van reiskosten, een van de meest voor de hand liggende mogelijkheden is om het systeem te gebruiken.

De wereld heeft echte voorbeelden, en in Rusland wordt de creatie van dergelijke oplossingen in de nabije toekomst verwacht, bevestigde het bedrijf aan Izvestia.

Het Smart City-project, in het kader waarvan de ontwikkeling gepland is nieuwe technologie, ontworpen voor zes jaar. Volgens Andrei Chibis zegt niemand dat er in deze periode overal een gezichtsherkenningssysteem zal verschijnen, maar we moeten in deze richting gaan. “Dit is niet alleen een kwestie van veiligheid, maar ook van comfort. We zullen deze technologie bestuderen en in de nabije toekomst zullen we beslissen over de mogelijkheid van implementatie – uiteraard in de eerste plaats in termen van de kosten”, gaf hij aan.

Alexander Khanin, CEO van VisionLabs, een bedrijf gespecialiseerd in computervisie, merkt op dat het installatieproces van camera's en servers technisch eenvoudig is, zodat dergelijke systemen in de nabije toekomst overal kunnen worden geïmplementeerd. Ze kunnen ook gebruikt worden bij het zoeken naar vermiste personen, meent hij. De kosten voor aansluiting op elke camera zijn afhankelijk van het gebruiksscenario en het type camera: van 200 roebel tot enkele duizenden.

Hoofd van de afdeling Telecommunicatiesystemen, Moskou Instituut elektronische technologie Alexander Bakhtin merkte op dat stadsnetwerken klaar zijn om dergelijke gegevens te verzenden. Echter, op beginfase Bij de introductie van nieuwe technologieën bestaat altijd het risico op privacyschendingen. Er zijn veel punten waarop informatie kan worden onderschept. Maar daarna proefproeven het systeem is gebouwd en werkt effectief.

Een tomograaf in een kliniek levert veel op meer informatie dan een videostream van een bus. De vraag is wie het analyseert en voor welke doeleinden. Ik zou graag willen dat de wetgeving ons beschermt tegen werknemers die ongeoorloofd persoonlijke gegevens gebruiken”, zei Alexander Bakhtin tegen Izvestia.

Rostelecom geeft toe dat de circulatie van dergelijke gegevens een zeer gevoelig onderwerp is en daarom bestaat er, net als in andere landen, in Rusland één enkele biometrisch systeem gecreëerd onder staatscontrole. In de eerste fase wordt het, in samenwerking met de Centrale Bank, ten uitvoer gelegd in het belang van de EU banksector. Er zijn al experimenten uitgevoerd met gezichtsherkenning voor contactloze toegang tot musea en in verder systeem zich zal ontwikkelen, hebben wij vertrouwen in het bedrijf.

In september 2017 kondigden de autoriteiten in Moskou de introductie aan van een videobewakingssysteem met gezichtsherkenningsfunctie. Er werd gemeld dat het netwerk van de hoofdstad 160.000 videocamera's omvat en 95% van de ingangen van woongebouwen bestrijkt. De gezichten op de opnames worden gescand zodat de gegevens indien nodig kunnen worden vergeleken met informatie in diverse databanken- Bijvoorbeeld, wetshandhavingsinstanties, als het gaat om het zoeken naar een dader, staat aangegeven op het portaal van de burgemeester van Moskou. Het systeem kan de persoon in de video, zijn geslacht en leeftijd identificeren.

De Rostec State Corporation gebruikte gezichtsherkenningstechnologie tijdens het WK 2018. Met zijn hulp was het bijvoorbeeld mogelijk een fan te identificeren die, bij rechterlijke uitspraak, geen sportevenementen mocht bijwonen. Met het algoritme kunt u gezichten herkennen met een nauwkeurigheid tot 99%. Het staatsbedrijf merkte op dat de zoektocht specifieke persoon onder een miljard gezichten duurt het minder dan een halve seconde.

Eén van de sleutels tot de kwaliteit van leven in Nederland moderne samenleving is de juiste aanpak om de persoonlijke veiligheid en de beveiliging van eigendommen te waarborgen. De eisen aan video-opnamesystemen worden voortdurend hoger. Goed systeem observatie moet tegenwoordig niet alleen kunnen vastleggen wat er gebeurt verwisselbare media, maar ook om mensen in het frame te herkennen en identificeren.

Toepassingsplaatsen

De functie “gezichtsherkenning” heeft in veel opzichten zijn toepassing gevonden menselijk leven. Het gebruik van videobewakingssystemen van dit type Kan:

organiseer een controlepunt bij een onderneming of andere objecten die gesloten zijn voor buitenstaanders. Er kan videobewaking worden gekoppeld aan tourniquets en er kan een automatisch controlepunt worden georganiseerd volgens het “vriend of vijand”-principe;
organiseer een antidiefstalsysteem in verkooppunten en andere particuliere eigendommen. Alle winkels, vooral de grote, worden geconfronteerd met het probleem dat sommige bezoekers verslaafd raken aan diefstal. Vaak hebben dezelfde mensen de neiging om bij dezelfde winkels te stelen. Door camera's met gezichtsherkenning te installeren, kun je de handelingen van iemand die al op diefstal is betrapt, nader bekijken. De scanner waarschuwt de beveiligingsconsole zodra hij de winkel binnenkomt;
een systeem organiseren om binnendringing op het grondgebied van huishoudens en andere gesloten objecten te voorkomen. Soms is het voor een persoon moeilijk om een verborgen indringer te onderscheiden van een struik of ander object op de monitor, vooral als de camera's in een slecht verlichte ruimte zijn geïnstalleerd. Maar wat voor mensen ontoegankelijk is, kan eenvoudig door een computermodule worden gedaan;
gezichtscontrole in nachtclubs - 100% bescherming tegen ongenode gasten.

Werkingsprincipe

Een videobewakingssysteem met een functie voor “gezichtsherkenning” werkt volgens het principe waarbij het ontvangen beeld wordt vergeleken met dat in de database. Het gemiddelde complex kan een menselijk gezicht identificeren op een afstand van maximaal tien meter van de camera. In dit geval wordt de bezoeker herkend, zelfs rekening houdend met de aanwezigheid van veranderingen in de fysieke parameters van het gezicht: verandering van kapsel, baard, aanwezigheid van een bril, enz. De analyse is gebaseerd op een vergelijking van biometrische parameters van het hoofd structuur, individueel voor elke persoon. In dit geval gebeurt het scannen onderweg; de bezoeker hoeft alleen maar zijn gezicht naar de scanner te draaien terwijl hij beweegt. Het videobewakingssysteem kan worden aangesloten op tourniquets en andere apparaten geautoriseerd log in en werk automatisch. Niet-geïdentificeerde bezoekers hebben geen toegang tot het beschermde gebied en hun foto wordt in de database opgeslagen voor verwerking door de veiligheidsdienst.

Dergelijke systemen worden doorgaans geïnstalleerd in grote bedrijven waar het toekomstige succes van het bedrijf afhangt van de veiligheid, bijvoorbeeld een bedrijf dat nieuwe soorten wapens of microschakelingen ontwikkelt, of een biologisch laboratorium. Het systeem herkent automatisch alle medewerkers en vergelijkt ze met de database. Bij niet-naleving of afwezigheid van een persoon in het systeem worden beveiligingsprotocollen geactiveerd, gaat er een alarmlampje branden in de beveiligingsruimte en gaat er een rood lampje branden. lichte indicatie. De locatie waar de indringer werd gevonden staat nauwkeurig aangegeven op elektronische kaart object en beveiliging vindt de indringer binnen enkele seconden.

Werkwijzen

Camera's van gezichtsherkenningssystemen werken in twee modi: tweedimensionaal en driedimensionaal. Bij 2D-systemen vindt herkenning plaats op basis van een plat beeld. 2D-camera's zijn erg gevoelig voor het niveau van de kamerverlichting; de kwaliteit van het uiteindelijke beeld hangt grotendeels af van deze parameter. Bij slecht licht het beeld zal moeilijk te zien zijn. 3D-weergavecamera's creëren een driedimensionaal beeld op basis van het ontvangen beeld. Slecht licht is voor hen geen bijzondere belemmering; meestal kan het de textuur van het gezicht slechts lichtjes vervormen.

Soort

Afhankelijk van de doelen en doelstellingen die zijn toegewezen aan het videobewakingssysteem met gezichtsherkenningsfunctie, zijn ze onderverdeeld in:

detectie (camera vanaf 1 MP, brandpuntsafstand vanaf 1 mm). De acties van dit beveiligingssysteem zijn gericht op het registreren van indringers in gecontroleerde objecten. De scanner kan een persoon onderscheiden van een kat of eekhoorn, maar zal hem niet kunnen identificeren;
herkenning (camera vanaf 2 MP, brandpuntsafstand vanaf 6 mm). IN in dit geval De belangrijkste functie van de scanner is het herkennen van de gezichten van bezoekers volgens het ‘vriend of vijand’-principe. Als u de videoreeks bekijkt, zal het beeld behoorlijk wazig zijn, u zult er bekende gezichten in herkennen, maar als een dief de faciliteit is binnengekomen, zal het erg moeilijk zijn om hem aan de hand van deze frames te vinden;
identificatie (camera groter dan 2 MP, brandpuntsafstand vanaf 8 mm) Deze systemen kunnen alle functies van de voorgaande typen uitvoeren, terwijl de kwaliteit van het resulterende beeld ruim voldoende zal zijn om een indringer te identificeren. Zo'n foto kan eenvoudig worden overgedragen aan gerechtelijke autoriteiten en wetshandhavingsinstanties.

Tussen haakjes hebben wij de omschrijving per type videobewakingssysteem aangegeven minimale eisen tot cameraresolutie en brandpuntsafstand van de lens. Bij het bestellen van apparatuur moet er rekening mee worden gehouden dat deze kenmerken voldoende zijn onder ideale opnameomstandigheden. Uiteraard gebeurt dit in de praktijk zelden, dus bij het kiezen van scanners is het beter om apparaten met een reserve aan te schaffen, bijvoorbeeld voor herkenningssystemen - een resolutie van 2 MP en een brandpuntsafstand van 8 mm, voor weergavesystemen - een resolutie van 5 MP en een brandpuntsafstand van 12 mm.

Uiteraard hangt het eindresultaat niet alleen van deze kenmerken af. Brandpuntsafstand en resolutie zijn erg belangrijk, maar bij het monteren van een camera moet je rekening houden met verlichting, kijkhoeken en vele andere parameters. Daarom is het beter om de selectie en installatie aan professionals toe te vertrouwen.

Er is tegenwoordig misschien geen andere technologie die omgeven is door zoveel mythen, leugens en incompetentie. Journalisten die over technologie praten liegen, politici die praten over succesvolle implementatie liegen, de meeste technologieverkopers liegen. Elke maand zie ik de gevolgen van mensen die gezichtsherkenning proberen te implementeren in systemen die daar niet mee overweg kunnen.

Het onderwerp van dit artikel is al heel lang pijnlijk, maar ik was nog steeds te lui om het te schrijven. Een hoop tekst die ik al twintig keer heb herhaald verschillende mensen. Maar nadat ik weer een pak afval had gelezen, besloot ik dat het tijd was. Ik zal een link naar dit artikel geven.

Dus. In dit artikel beantwoord ik een paar eenvoudige vragen:

Waar denk je dat de makers van de algoritmen deze bases vandaan hebben?

Een kleine hint. Het eerste NTech-product dat ze nu hebben is Find Face, een zoektocht naar mensen op VKontakte. Ik denk dat er geen uitleg nodig is. Natuurlijk vecht VKontakte tegen bots die alles eruit pompen profielen openen. Maar voor zover ik heb gehoord, downloaden mensen nog steeds. En klasgenoten. En Instagram.

Het lijkt erop dat bij Facebook alles ingewikkelder is. Maar ik weet bijna zeker dat ze ook iets hebben bedacht.
Dus ja, als je profiel openbaar is, dan mag je trots zijn, het werd gebruikt om algoritmen te trainen;)

Over oplossingen en over bedrijven

Dit is iets om trots op te zijn. Van de vijf toonaangevende bedrijven ter wereld zijn er nu twee Russisch. Dit zijn N-Tech en VisionLabs. Een half jaar geleden waren de leiders NTech en Vocord, de eerste werkte veel beter op gedraaide gezichten, de laatste op frontale gezichten.

Nu is de rest van de leiders 1-2 Chinese bedrijven en 1 Amerikaan, Vocord verloor iets in de kijkcijfers.

Andere Russische in de beoordeling zijn itmo, 3divi en intellivision. Synesis- Wit-Russisch bedrijf, hoewel sommigen van hen ooit in Moskou waren, hadden ze ongeveer 3 jaar geleden een blog op Habré. Ik weet van verschillende andere oplossingen dat ze eigendom zijn van buitenlandse bedrijven, maar de ontwikkelingskantoren bevinden zich ook in Rusland. Er zijn er nog een paar Russische bedrijven die niet concurreren, maar die goede oplossingen lijken te hebben. De MDG’s hebben dat bijvoorbeeld gedaan. Uiteraard hebben Odnoklassniki en Vkontakte ook hun eigen goede, maar die zijn voor intern gebruik.

Kortom, ja, het zijn vooral wij en de Chinezen die dezelfde gezichtsuitdrukkingen hebben.

NTech was de eerste ter wereld die dit liet zien goede parameters nieuw niveau. Ergens eind 2015. VisionLabs heeft NTech nog maar net ingehaald. In 2015 waren zij marktleider. Maar hun beslissing was van de laatste generatie en ze begonnen pas eind 2016 te proberen NTech in te halen.

Eerlijk gezegd houd ik niet van beide bedrijven. Zeer agressieve marketing. Ik heb mensen gezien aan wie een duidelijk ongepaste oplossing werd verkocht die hun problemen niet oploste.

Van deze kant vond ik Vocord veel leuker. Ik heb ooit een paar jongens geraadpleegd tegen wie Vocord heel eerlijk zei: “Je project gaat niet werken met zulke camera’s en installatiepunten.” NTech en VisionLabs probeerden graag te verkopen. Maar er is iets met Vocord de laatste tijd verdwenen.

Conclusies

Ter afsluiting zou ik het volgende willen zeggen. Gezichtsherkenning is een zeer goed en krachtig hulpmiddel. Hiermee kun je vandaag de dag echt criminelen vinden. Maar de implementatie ervan vereist een zeer nauwkeurige analyse van alle parameters. Er zijn tal van OpenSource-oplossingen beschikbaar. Er zijn toepassingen (herkenning in drukte bij stadions) waarbij je alleen VisionLabs|Ntech hoeft te installeren, en daarnaast een onderhouds-, analyse- en besluitvormingsteam hoeft aan te houden. En OpenSource zal je hier niet helpen.

Tegenwoordig kun je niet alle sprookjes geloven dat je alle criminelen kunt vangen of iedereen in de stad kunt observeren. Maar het is belangrijk om te onthouden dat dergelijke dingen kunnen helpen criminelen te vangen. Om bijvoorbeeld niet iedereen in de metro tegen te houden, maar alleen degenen die volgens het systeem vergelijkbaar zijn. Plaats camera’s zo dat gezichten beter herkend worden en creëer hiervoor de juiste infrastructuur. Hoewel ik hier bijvoorbeeld tegen ben. Omdat de kosten van een fout als u als iemand anders wordt herkend, te hoog kunnen zijn.

Tags toevoegen

Sluit een lening af, vraag een visum aan en start gewoon een smartphone nieuwste model– het is vandaag de dag onmogelijk om dit allemaal te doen zonder de deelname van gezichtsherkenningsalgoritmen. Ze helpen politieagenten bij onderzoeken, muzikanten op het podium, maar beetje bij beetje veranderen ze in een alziend oog dat al onze acties online en offline in de gaten houdt.

Algoritmen (technologieën)

Het identificeren van een persoon vanaf een foto vanuit het perspectief van een computer betekent twee dingen heel erg verschillende taken: ten eerste, zoek het gezicht op de foto (als het er is), ten tweede, isoleer uit de afbeelding die kenmerken die deze persoon onderscheiden van andere mensen in de database.

1. Vind

Pogingen om een computer te leren gezichten op foto's te vinden, zijn al sinds het begin van de jaren zeventig aan de gang. Er werden veel benaderingen uitgeprobeerd, maar de belangrijkste doorbraak kwam veel later: met de creatie in 2001 van Paul Viola en Michael Jones van de cascade-boosting-methode, dat wil zeggen een keten van zwakke classificatoren. Hoewel er nu meer geavanceerde algoritmen zijn, kun je er zeker van zijn dat dat ook in de jouwe het geval is mobiele telefoon, en het is de goede oude Viola-Jones die in de camera werkt. Het draait allemaal om opmerkelijke snelheid en betrouwbaarheid: zelfs in 2001 gemiddelde computer Met deze methode kon hij 15 foto's per seconde verwerken. Tegenwoordig voldoet de efficiëntie van het algoritme aan alle redelijke eisen. Het belangrijkste dat u over deze methode moet weten, is dat het verrassend eenvoudig is. Je zult niet eens geloven hoeveel.

Stap1. We verwijderen de kleur en veranderen de afbeelding in een helderheidsmatrix.
Stap 2. Plaats een van de vierkante maskers erop - deze worden Haarkenmerken genoemd. We doorlopen ermee de hele afbeelding, waarbij we de positie en grootte veranderen.
Stap 3. Vouw digitale waarden helderheid van die matrixcellen die onder het witte deel van het masker vielen, en trek daar de waarden van af die onder het zwarte deel vielen. Als in ten minste één van de gevallen het verschil tussen de witte en zwarte gebieden boven een bepaalde drempel ligt, nemen we dit gedeelte van de afbeelding voor verder onderzoek. Zo niet, vergeet haar dan, er is hier geen gezicht.
Stap 4. Herhaal vanaf stap 2 al met nieuw masker- maar alleen in het gebied van de afbeelding dat de eerste test heeft doorstaan.

Waarom werkt dit? Kijk naar het bord. Op bijna alle foto's is het ooggebied altijd iets donkerder dan het gebied er direct onder. Kijk naar het bord: het lichte gebied in het midden komt overeen met de neusbrug, gelegen tussen de donkere ogen. Op het eerste gezicht lijken zwart-witte maskers helemaal niet op gezichten, maar ondanks al hun primitiviteit hebben ze een hoog generaliserend vermogen.

Waarom zo snel? In het beschreven algoritme is er geen gemarkeerd belangrijk punt. Om de helderheid van het ene deel van de afbeelding van het andere af te trekken, moet je de helderheid van elke pixel optellen, en dat kunnen er veel zijn. Daarom wordt de matrix in feite vóór het aanbrengen van het masker omgezet in een integrale weergave: de waarden in de helderheidsmatrix worden vooraf op zo'n manier opgeteld dat de integrale helderheid van de rechthoek kan worden verkregen door alleen maar toe te voegen vier cijfers.

Hoe een cascade monteren? Hoewel elke maskeringsfase een zeer grote fout oplevert (de werkelijke nauwkeurigheid bedraagt niet veel meer dan 50%), ligt de kracht van het algoritme in de cascade-organisatie van het proces. Hierdoor kunt u snel gebieden uitsluiten van de analyse waar er absoluut geen gezicht is, en alleen moeite besteden aan die gebieden die resultaten kunnen opleveren. Dit principe van het samenstellen van zwakke classificatoren in een reeks wordt boosting genoemd (je kunt er meer over lezen in het oktobernummer van PM of). Algemeen principe zo: zelfs grote fouten, met elkaar vermenigvuldigd, zullen klein worden.

2. Vereenvoudig

Het vinden van gelaatstrekken waarmee je de eigenaar kunt identificeren, betekent het reduceren van de realiteit tot een formule. Het gaat over over vereenvoudiging, en wel een hele radicale. Bijvoorbeeld, diverse combinaties Zelfs een miniatuurfoto van 64 x 64 pixels kan een enorm aantal pixels hebben - (2 8) 64 x 64 = 2 32768 stukjes. Bovendien zouden slechts 33 bits voldoende zijn om elk van de 7,6 miljard mensen op aarde te tellen. Als je van het ene nummer naar het andere gaat, moet je alles weggooien vreemd geluid, maar behoud het belangrijkste individuele kenmerken. Statistici die bekend zijn met dergelijke problemen hebben veel hulpmiddelen voor gegevensvereenvoudiging ontwikkeld. Bijvoorbeeld de hoofdcomponentenmethode, die de basis legde voor het identificeren van gezichten. Recentelijk hebben convolutionele neurale netwerken de oude methoden echter ver achter zich gelaten. Hun structuur is nogal eigenaardig, maar in wezen is dit ook een vereenvoudigingsmethode: het is de taak om een specifiek beeld terug te brengen tot een reeks kenmerken.

Breng een masker aan op de afbeelding vaste maat(correct de convolutiekernel genoemd), vermenigvuldigen we de helderheid van elke pixel in de afbeelding met de helderheidswaarden in het masker. We vinden de gemiddelde waarde voor alle pixels in het “venster” en schrijven deze in een cel van het volgende niveau.

We verschuiven het masker met een vaste stap, vermenigvuldigen het opnieuw en schrijven het gemiddelde opnieuw in de kenmerkenkaart.

Nadat we het hele beeld met één masker hebben doorlopen, herhalen we met het andere - we krijgen nieuwe kaart tekenen.

We verkleinen de grootte van onze kaarten: we nemen verschillende aangrenzende pixels (bijvoorbeeld een vierkant van 2x2 of 3x3) en verplaatsen deze naar volgende niveau slechts één maximale waarde. Hetzelfde doen we voor kaarten ontvangen met alle andere maskers.

Omwille van de wiskundige hygiëne vervangen we alle negatieve waarden door nullen. We herhalen vanaf stap 2 zo vaak als we lagen in het neurale netwerk willen krijgen.

Van laatste kaart We stellen geen convolutioneel, maar een volledig verbonden neuraal netwerk samen: we veranderen alle cellen van het laatste niveau in neuronen die, met een bepaald gewicht, de neuronen van de volgende laag beïnvloeden. Laatste stap. In netwerken die zijn getraind om objecten te classificeren (om katten van honden te onderscheiden op foto's, enz.), is hier de uitvoerlaag, dat wil zeggen een lijst met kansen om een bepaald antwoord te detecteren. In het geval van gezichten krijgen we in plaats van een specifiek antwoord een korte reeks van de meeste belangrijke kenmerken gezichten. In Google FaceNet zijn dit bijvoorbeeld 128 abstracte numerieke parameters.

3. Identificeer

Meest laatste fase identificatie zelf is de eenvoudigste en zelfs triviale stap. Het komt neer op het beoordelen van de gelijkenis van de resulterende lijst met kenmerken met de kenmerken die al in de database staan. In wiskundig jargon betekent dit het vinden in de kenmerkruimte van de afstand van een gegeven vector tot het dichtstbijzijnde gebied met bekende vlakken. Op dezelfde manier kun je een ander probleem oplossen: mensen vinden die op elkaar lijken.

Waarom werkt dit? Het convolutionele neurale netwerk wordt “aangescherpt” om de meest karakteristieke kenmerken uit het beeld te halen, en dit automatisch en op verschillende niveaus abstracties. Als de eerste niveaus meestal reageren op eenvoudige patronen zoals schaduwen, gradiënten, duidelijke grenzen, enz., Dan neemt bij elk nieuw niveau de complexiteit van de kenmerken toe. Maskers die het neurale netwerk probeert hoge niveaus, lijken vaak echt op menselijke gezichten of fragmenten daarvan. Bovendien combineren neurale netwerken, in tegenstelling tot hoofdcomponentenanalyse, kenmerken op een niet-lineaire (en onverwachte) manier.

Waar komen maskers vandaan? In tegenstelling tot de maskers die in het Viola-Jones-algoritme worden gebruikt, doen neurale netwerken het zonder menselijke hulp en vinden ze maskers tijdens het leerproces. Om dit te doen, heb je een grote trainingsset nodig, die afbeeldingen bevat van een grote verscheidenheid aan gezichten in het echte leven. verschillende achtergronden. Wat betreft de resulterende reeks kenmerken die het neurale netwerk produceert, deze wordt gevormd met behulp van de drielingmethode. Triples zijn sets afbeeldingen waarbij de eerste twee een foto zijn van dezelfde persoon en de derde een foto van een ander. Het neurale netwerk leert kenmerken te vinden die de eerste beelden zo dicht mogelijk bij elkaar brengen en tegelijkertijd de derde uitsluiten.

Wiens neurale netwerk is beter? Gezichtsidentificatie heeft de academie al lang verlaten grote zaken. En hier streven fabrikanten er, net als in elk ander bedrijf, naar om te bewijzen dat hun algoritmen beter zijn, hoewel ze niet altijd gegevens uit open tests verstrekken. Volgens de MegaFace-competitie momenteel bijvoorbeeld betere nauwkeurigheid toont het Russische deepVo V3-algoritme van Vocord met een resultaat van 92%. Google's FaceNet v8 in dezelfde competitie laat slechts 70% zien, en DeepFace van Facebook, met een aangegeven nauwkeurigheid van 97%, nam helemaal niet deel aan de competitie. Deze cijfers moeten met de nodige voorzichtigheid worden geïnterpreteerd, maar het is al duidelijk dat de beste algoritmen gbijna op menselijk niveau hebben bereikt.

Live make-up (kunst)

In de winter van 2016, tijdens de 58e jaarlijkse Grammy Awards, bracht Lady Gaga een eerbetoon aan de onlangs overleden David Bowie. Tijdens het optreden verspreidde levende lava zich over haar gezicht en liet op haar voorhoofd en wang een voor alle Bowie-fans herkenbare vlek achter: een oranje bliksemschicht. Het effect van bewegende make-up werd gecreëerd door videoprojectie: de computer volgde de bewegingen van de zangeres in realtime en projecteerde beelden op haar gezicht, rekening houdend met de vorm en positie ervan. Op internet is gemakkelijk een filmpje te vinden waarin opvalt dat de projectie nog steeds onvolmaakt is en bij plotselinge bewegingen iets vertraagd wordt.

Nobumichi Asai ontwikkelt de Omote-videokaarttechnologie voor gezichten sinds 2014 en demonstreert deze sinds 2015 actief over de hele wereld, waarbij hij een behoorlijke lijst met prijzen heeft verzameld. Het bedrijf dat hij oprichtte, WOW Inc. werd een partner van Intel en kreeg een goede stimulans voor ontwikkeling, en dankzij de samenwerking met Ishikawa Watanabe van de Universiteit van Tokio konden we de projectie versnellen. Het belangrijkste gebeurt echter op de computer, en soortgelijke oplossingen worden door veel ontwikkelaars van applicaties gebruikt waarmee je maskers op je gezicht kunt zetten, of het nu een Empire-soldaathelm is of 'David Bowie'-make-up.

Alexander Khanin, oprichter en CEO van VisionLabs

« Gelijkaardig systeem niet nodig krachtige computer, er kunnen zelfs maskers op worden aangebracht mobiele apparaten. Het systeem kan rechtstreeks op een smartphone werken, zonder data naar de cloud of server te sturen.”

“Deze taak wordt gezichtspunttracking genoemd. Er zijn veel vergelijkbare oplossingen in het publieke domein, maar professionele projecten onderscheiden zich door snelheid en fotorealisme”, vertelt Alexander Khanin, hoofd van VisionLabs. — Het moeilijkste in dit geval is om de positie van de punten te bepalen, rekening houdend met gezichtsuitdrukkingen en de individuele vorm van het gezicht of extreme omstandigheden: met sterke draaiingen van het hoofd, onvoldoende verlichting en hoge verlichting.” Om het systeem te leren punten te vinden, neuraal netwerk Ze geven les - eerst handmatig, waarbij ze foto na foto minutieus markeren. “De invoer is een afbeelding en de uitvoer is een gemarkeerde reeks punten”, legt Alexander uit. — Vervolgens wordt de detector gelanceerd, wordt het gezicht bepaald, het is 3D-model, waarop het masker wordt aangebracht. Er worden in realtime markeringen op elk frame van de stream toegepast.”

Dit is ongeveer hoe de uitvinding van Nobumichi Asai werkt. Voorheen scande de Japanse ingenieur de hoofden van zijn modellen, waardoor nauwkeurige driedimensionale prototypes werden verkregen en een videosequentie werd voorbereid, waarbij rekening werd gehouden met de vorm van het gezicht. De taak wordt ook gemakkelijker gemaakt door kleine reflecterende markeringen die op de artiest worden geplakt voordat hij het podium op gaat. Vijf infrarood camera's volgen hun bewegingen en verzenden trackinggegevens naar een computer. Dan gebeurt alles zoals VisionLabs ons vertelde: het gezicht wordt gedetecteerd, een driedimensionaal model wordt gebouwd en de projector van Ishikawa Watanabe komt in actie.

In 2015 introduceerde hij het DynaFlash-apparaat: het is een hogesnelheidsprojector die de bewegingen van het vlak waarop het beeld wordt weergegeven, kan volgen en compenseren. Het scherm kan worden gekanteld, maar het beeld wordt niet vervormd en wordt uitgezonden met een frequentie van maximaal duizend 8-bits frames per seconde: de vertraging bedraagt niet meer dan drie milliseconden, onmerkbaar voor het oog. Voor Asai bleek zo'n projector een uitkomst; live-make-up begon echt in realtime te werken. In de video die in 2017 werd opgenomen voor het populaire Japanse duo Inori is de vertraging helemaal niet meer zichtbaar. De gezichten van de dansers veranderen in levende schedels of huilmaskers. Het ziet er fris uit en trekt de aandacht, maar de technologie raakt snel in de mode. Binnenkort zal een vlinder die op de wang van een weersvoorspeller landt, of artiesten die elke keer op het podium van uiterlijk veranderen, waarschijnlijk de meest voorkomende zaak worden.

Face-hacking (activisme)

De mechanica leert dat elke actie een reactie uitlokt, en de snelle ontwikkeling van surveillance- en persoonlijke identificatiesystemen vormt hierop geen uitzondering. Tegenwoordig maken neurale netwerken het mogelijk om een willekeurige wazige foto van de straat te vergelijken met foto's die naar accounts zijn geüpload sociale netwerken en ontdek binnen enkele seconden de identiteit van een voorbijganger. Tegelijkertijd creëren kunstenaars, activisten en computer vision-specialisten hulpmiddelen die mensen de privacy kunnen teruggeven, de persoonlijke ruimte die in zo’n duizelingwekkend tempo kleiner wordt.

Identificatie kan in verschillende stadia van de algoritmen worden gedwarsboomd. In de regel worden de eerste stappen van het herkenningsproces aangevallen: het detecteren van figuren en gezichten in het beeld. Net zoals militaire camouflage onze visie misleidt door een object te verbergen en de geometrische proporties en het silhouet ervan te schenden machinevisie ze proberen hem te verwarren met gekleurde contrasterende vlekken die voor hem belangrijke parameters vervormen: het ovaal van het gezicht, de locatie van de ogen, de mond, enz. Gelukkig computervisie nog niet zo perfect als de onze, wat een grotere vrijheid laat in de keuze van kleuren en vormen van dergelijke “camouflage”.

Roze en paarse, gele en blauwe tinten domineren de kledinglijn HyperFace, waarvan de eerste exemplaren in januari 2017 werden geïntroduceerd door ontwerper Adam Harvey en startup Hyphen Labs. Pixelpatronen voorzien machinevisie van een ideaalbeeld – vanuit zijn gezichtspunt – van een menselijk gezicht, dat de computer als lokaas opvangt. Een paar maanden later ontwikkelden de Moskouse programmeur Grigory Bakunov en zijn collega's zelfs speciale toepassing, wat make-upvariaties genereert die identificatiesystemen verstoren. En hoewel de auteurs na nadenken besloten het programma niet te publiceren open toegang, dezelfde Adam Harvey biedt verschillende kant-en-klare opties.

Een persoon die een masker draagt of vreemde make-up op zijn gezicht heeft, valt misschien voor niemand op. computersystemen, maar andere mensen zullen er waarschijnlijk aandacht aan besteden. Er zijn echter manieren om het tegenovergestelde te doen. Vanuit het oogpunt van het neurale netwerk bevat het beeld inderdaad geen beelden in de voor ons gebruikelijke zin; voor haar is een afbeelding een reeks getallen en coëfficiënten. Daarom volledig diverse artikelen lijkt misschien wel erg op haar. Als je deze nuances van het werk van de AI kent, kun je een subtielere aanval uitvoeren en het beeld slechts een klein beetje corrigeren - zodat de veranderingen voor een persoon bijna onmerkbaar zullen zijn, maar machinevisie volledig zal worden misleid. In november 2017 lieten onderzoekers zien hoe kleine veranderingen in de kleur van een schildpad of een honkbal veroorzaakten Google-systeem InceptionV3 heeft er vertrouwen in dat hij in plaats daarvan een pistool of een kopje espresso ziet. En Mahmoud Sharif en zijn collega’s van de Carnegie Mellon Universiteit ontwierpen een stippenpatroon voor het montuur van een bril: het heeft vrijwel geen effect op de perceptie van het gezicht door anderen, maar computeridentificatie met behulp van Face++ verwart het vol vertrouwen met het gezicht van de persoon “want wie” het patroon op het frame is ontworpen.

Tot voor kort leken beveiligingssystemen met gezichtsherkenningsopties iets fantastisch, en je zag ze alleen in films. Maar er is de afgelopen jaren veel veranderd. Er zijn nieuwe ontwikkelingen verschenen die het idee van hebben veranderd beveiligingssystemen Oh.

De kwaliteit en het comfort van de samenleving zijn afhankelijk van de juiste aanpak aan de organisatie van persoonlijke veiligheid en eigendomsbescherming. Het is geen verrassing dat de beveiligingseisen voortdurend toenemen. Eén van de innovaties was het verschijnen van een gezichtsherkenningsfunctie. Wat zijn de kenmerken ervan? Waar wordt het gebruikt? Op welk principe werkt het? We zullen deze en andere vragen in het artikel in detail bespreken.

Toepassingsgebieden

De voordelen van gezichtsherkenning zijn moeilijk te overschatten. Beveiligingssystemen met deze functie worden op verschillende gebieden gebruikt - bij het organiseren van een pasjessysteem in grote organisaties, om indringers op te sporen, privé-objecten te beschermen, enzovoort.

Over het algemeen is het met behulp van een dergelijk beveiligingssysteem mogelijk om de volgende problemen op te lossen:

Organiseer een betrouwbare en effectief systeem passeert bij het controlepunt in het bedrijf of bij anderen gesloten faciliteiten. Voor grotere efficiëntie videobewaking wordt gecombineerd met tourniquets. Hierdoor herkent u snel uw medewerkers en vreemden.
Creëer een diefstalbeveiligingssysteem op verkooppunten en privéfaciliteiten. Het is geen geheim dat verschillende winkels, winkelcentra, supermarkten en andere etablissementen worden geconfronteerd met problematische klanten die vatbaar zijn voor diefstal. In de meeste gevallen wordt diefstal door dezelfde personen gepleegd. Als er een geschikte database aanwezig is, kunt u met de gezichtsherkenningsfunctie een persoon tijdig identificeren en de bewaker informeren. Hierdoor is het mogelijk om aanvullende maatregelen te nemen ter bescherming van eigendommen.
Organiseer een beveiligingssysteem dat bescherming biedt tegen ongeoorloofde toegang tot structuren gesloten soort en particuliere huishoudens. Zelfs met zorgvuldige observatie is een beveiliger niet altijd in staat een indringer van een ander object te onderscheiden. Dit geldt vooral als de camera is geïnstalleerd in een gebied met laag niveau verlichting. Installatie speciale systemen met gezichtsherkenningsfunctie helpt om een persoon snel te identificeren, zelfs in het donker. Wat buiten de controle van een beveiligingsmedewerker valt, kan eenvoudig worden opgelost door een computermodule.
Zorgdragen voor gezichtscontrole in nachtinrichtingen. De aanwezigheid van de betreffende systemen in clubs garandeert 100% bescherming tegen “probleem” bezoekers.

Hoe werkt dit?

Van het grootste belang is het werkingsprincipe van het systeem, dat niet alleen een beeld naar een monitor kan verzenden, maar ook de gezichten van mensen kan herkennen. De taak van een speciale module is het lezen van informatie, evenals de daaropvolgende vergelijking ervan met de gegevens die beschikbaar zijn in de database. Dergelijke complexen zijn in staat het gezicht van een persoon te identificeren op een afstand van maximaal 10 meter van de camera.

Een van de kenmerken van het systeem is de hoge ‘gevoeligheid’, waardoor u een persoon kunt herkennen, zelfs als uw uiterlijk verandert. De module kan niet worden omvergeworpen door een bril, het veranderen van kapsel, baard of iets anders aanvullende elementen gezichtscamouflage. Dit komt door het feit dat het niet de gezichtskenmerken zijn die worden geanalyseerd, zoals velen denken, maar de structuur van de schedel en de biometrische parameters ervan. Dergelijke kenmerken zijn individueel, zoals vingerafdrukken, waardoor de mogelijkheid van fouten wordt geëlimineerd.

Informatie wordt in realtime gescand en verwerkt. Het volstaat dat de bezoeker zijn gezicht naar de scanner draait, waarna het systeem de persoon bepaalt en opdrachten geeft aan andere organen. Als de gezichtsherkenningsmodule is aangesloten op tourniquets of andere blokkeerinrichtingen, worden deze automatisch geactiveerd. Daarnaast wordt een foto van een verdachte persoon in het geheugen opgeslagen voor verdere verwerking en analyse door de beveiliging.

Systemen met een identificatiefunctie zijn het meest wijdverbreid in grote bedrijven waar veel concurrentie is. Het is geen geheim dat het succes van een onderneming afhangt van het beveiligingsniveau. Dit geldt vooral voor organisaties die in de defensiesector werken, zich bezighouden met de ontwikkeling van nieuwe projecten of biologisch onderzoek.

De taak van het systeem is om werknemers te vergelijken en individuen te vergelijken met de bestaande database. Als een persoon niet op de lijst staat, gaat er een signaal naar de beveiligers, waarna deze maatregelen nemen om te voorkomen dat onbevoegden de voorziening betreden. In dit geval wordt de detectielocatie nauwkeurig vastgelegd op de elektronische kaart en identificeren medewerkers van de beveiligingsafdeling de dader binnen enkele minuten.

Installatiefuncties

Bij het installeren van een systeem met gezichtsherkenningsopties is het de moeite waard om te overwegen dat videocamera's in een van de twee modi kunnen werken: 2D of 3D. In het eerste geval wordt de analyse uitgevoerd op basis van een vlak beeld en zijn tweedimensionale camera's zeer gevoelig voor licht. Hieruit volgt dat bij het installeren van 2D-camera's bijzondere aandacht moet worden besteed aan de verlichting van het beschermde object en de dekking van de beschermde gebieden.

Wat betreft 3D-camera's, ze werken ermee driedimensionaal voorwerp gebaseerd op verzonden door het apparaat afbeeldingen. In dit geval kunt u geen aandacht besteden aan het verlichtingsniveau, omdat het systeem zelfs in het donker goed overweg kan met de functies die eraan zijn toegewezen. Het enige gevaar is dat de textuur van het gezicht enigszins vervormd zal zijn.

Welke soorten van dergelijke systemen bestaan er?

Bij het kiezen van systemen met gezichtsherkenningsfunctie is het belangrijk om je op verschillende factoren te concentreren: doelen, doelstellingen en installatielocatie. Bovendien is het de moeite waard om rekening te houden met de soorten dergelijke apparaten:

Detectiesystemen. De videocamera heeft een resolutie van 1 megapixel en een brandpuntsafstand van 1 mm. De werking van het apparaat is gericht op het registreren van het binnendringen van ongeautoriseerde entiteiten in beschermde objecten. De bijzonderheid van de scanner is het vermogen om een persoon van een dier te onderscheiden, maar het zal niet mogelijk zijn om de persoon te identificeren.
Herkenningssysteem. Dit complex is complexer en omvat een 2 megapixelcamera met een brandpuntsafstand van zes millimeter. De taak is om gezichten te herkennen en te identificeren volgens het ‘vriend of vijand’-principe. Als u een video bekijkt, is het beeld niet duidelijk. Het systeem detecteert vreemden, maar in geval van diefstal zal het moeilijk zijn om de dief te vinden met behulp van de opgeslagen afbeelding
Identificatie apparaten. Bij het organiseren van een dergelijk systeem worden camera's met een resolutie van 2 MP of meer en een brandpuntsafstand van meer dan acht millimeter gebruikt. Dergelijke complexen zijn in staat de hierboven besproken functies uit te voeren. Het voordeel is dat het resulterende beeld voldoende is om een dief vanaf een foto te identificeren. Het beschikbare beeldmateriaal kan worden gebruikt tijdens het onderzoek en zelfs worden voorgelegd aan de rechter.

In de bovenstaande beschrijving worden de minimale vereisten voor beveiligingssystemen besproken op het gebied van brandpuntsafstand en beeldresolutie. Dit betekent dat u zich bij de aanschaf van apparatuur moet concentreren op producten met beste eigenschappen, voor opnamen van betere kwaliteit. Voor herkenningssystemen zijn bijvoorbeeld 2 MP camera's met een brandpuntsafstand van 8 mm geschikter. Wat identificatiecomplexen betreft, zijn de aanbevelingen hier zelfs nog ernstiger. Het is raadzaam om videocamera's te gebruiken met een resolutie van 5 MP en een brandpuntsafstand van 12 mm.

Laten we het kort samenvatten:

Met een videocamera met een resolutie van 1 MP kun je een mens van een dier onderscheiden. In dit geval is het niet mogelijk om het onderwerp te identificeren.
Om gezichten vast te leggen en te vergelijken met de bestaande database, moet het fixatieapparaat een resolutie hebben van 2 MP of meer.
Om een persoon te identificeren, is het raadzaam een 5 megapixel camera te gebruiken.