Varför CAPTCHA har blivit så svårt

En del av

Vid något tillfälle förra året började Googles ständiga förfrågningar att bevisa att jag är mänsklig känna alltmer aggressiv. Den enkla, lite för söta knappen som säger ”Jag är inte en robot” följdes mer och mer av krav på att bevisa det – genom att välja alla trafikljus, övergångsställen och skyltfönster i ett bildgaller. Snart kom trafikljusen begravd i avlägset lövverk, tvärgatorna skevade och halvt runt ett hörn, skyltfönster skyltar suddiga och på koreanska. Det är något unikt obehagligt att bli ombedd att identifiera en brandpost och kämpa mot den.

Dessa tester kallas, en förkortning för Completely Automated Public Turing-test för att berätta för datorer och människor, och de har nått den här typen av insynbarhetsplatå tidigare. I början av 2000-talet räckte enkla bilder av text för att stubba de flesta spambots Men efter ett decennium senare, efter att Google hade köpt programmet från Carnegie Mellon-forskare och använde det för att digitalisera Google Böcker, måste texter snedvrängas och döljas alltmer för att hålla sig före förbättrade program för optisk karaktärsigenkänning – program som i ett i rondellen hjälpte alla de människor som löste oss att förbättra.

Eftersom det är ett så elegant verktyg för att utbilda AI, kan ett visst test bara någonsin vara tillfälligt, något som dess uppfinnare erkände i början. Med alla dessa forskare, bedragare och vanliga människor som löser miljarder pussel precis vid tröskeln till vad AI kan göra, någon gång skulle maskinerna passera oss. År 2014 satte Google en av sina maskininlärningsalgoritmer mot människor för att lösa de mest förvrängda texterna: datorn fick testet rätt 99,8 procent av tiden, medan människorna fick bara 33 procent.

Google flyttade sedan till No Re, som observerar användardata och beteende för att låta vissa människor gå igenom med ett klick på ”Jag är inte en robot” -knappen, och presenterar andra den bildmärkning som vi ser idag. Men maskinerna är återigen att komma ikapp. Alla de markiser som kan vara eller inte kan vara skyltfönster? De är slutspelet i mänsklighetens vapenlopp med maskinerna.

Jason Polakis, professor i datavetenskap vid University of Illinois i Chicago, tar personlig kredit för den senaste tidens ökade svårigheter. 2016 publicerade han en uppsats där han använde hushållsredigeringsverktyg, inklusive Googles egen omvänd bildsökning, för att lösa Googles bilder med 70 procent noggrannhet. Andra forskare har brutit Googles ljudutmaningar med Goog le egna program för ljudigenkänning.

Maskininlärning är nu ungefär lika bra som människor vid grundläggande text-, bild- och röstigenkänningsuppgifter, säger Polakis. Faktum är att algoritmer förmodligen är bättre på det: ”Vi är vid en punkt där det blir svårare för programvara att det blir för svårt för många människor. Vi behöver något alternativ, men det finns ingen konkret plan ännu.”

Litteraturen på är fylld med falska startar och konstiga försök att hitta något annat än text- eller bildigenkänning som människor är allmänt bra på och maskiner kämpar med. Forskare har försökt be användare att klassificera bilder av människor efter ansiktsuttryck, kön , och etnicitet. (Du kan föreställa dig hur bra det gick.) Det har funnits förslag på trivia och s baserade på plantskolor som är vanliga i det område där en användare påstås växa upp. Sådana kulturella är inte bara riktade mot bots, utan på människor som arbetar på utomeuropeiska gårdar och löser pussel för bråkdelar av en cent. Människor har försökt stympa bildigenkänning genom att be användarna att identifiera, säg, grisar, men göra grisarna tecknade och ge dem solglasögon. Forskare har tittat på att be användarna att identifiera fy-objekt i Magic Eye-liknande fläckar. I en spännande variation föreslog forskare under 2010 att använda s för att indexera forntida helleristningar, där datorer inte var särskilt bra på att dechiffrera gestiska skisser av renar skrapade på grottväggar.

Nyligen har det funnits ansträngningar för att utveckla spelliknande s, tester som kräver att användare roterar objekt i vissa vinklar eller flyttar pusselbitar på plats, med instruktioner som inte ges i text utan i symboler eller antyds av spelbrädans sammanhang. Förhoppningen är att människor skulle förstå pusselns logik men datorer, som saknar tydliga instruktioner, skulle stumpas. Andra forskare har försökt utnyttja det faktum att människor har kroppar, använder enhetskameror eller förstärkt verklighet för interaktivt bevis på mänskligheten.

Problemet med många av dessa tester är inte nödvändigtvis att bots är för smarta – det är att människor suger på dem. Och det är inte så att människor är dumma; det är att människor är väldigt olika i språk, kultur och erfarenhet. När du har blivit av med alla de sakerna för att göra ett test som alla människor kan klara, utan tidigare utbildning eller mycket eftertanke, sitter du kvar med brute-uppgifter som bildbehandling, precis det som en skräddarsydd AI kommer att bli bra på .

”Testerna är begränsade av mänskliga förmågor”, säger Polakis. ”Det är inte bara våra fysiska förmågor, du behöver något som korsar kulturell, tvärspråkig. Du behöver någon typ av utmaning som fungerar med någon från Grekland, någon från Chicago, någon från Sydafrika, Iran och Australien samtidigt. Och det måste vara oberoende av kulturella invecklingar och skillnader. Du behöver något som är enkelt för en genomsnittlig människa, det borde inte vara bundet till en specifik undergrupp av människor, och det borde vara svårt för datorer samtidigt. Det är mycket begränsande vad du faktiskt kan göra. Och det måste vara något som en människa kan göra snabbt och inte är så irriterande. ”

Att ta reda på hur man fixar de suddiga bildfrågorna tar dig snabbt till ett filosofiskt territorium : vad är den universella mänskliga kvaliteten som kan demonstreras för en maskin, men som ingen maskin kan efterlikna? Vad är det att vara mänsklig?

Men kanske vår mänsklighet mäts inte av hur vi utför med en uppgift, utan hur vi rör oss genom världen – eller i det här fallet via internet. Spel, videor, vilken typ av test du tänker kommer så småningom att brytas, säger Shuman Ghosemajumder, som tidigare arbetat på Google för att bekämpa klickbedrägerier innan han blev teknikchef för botdetekteringsföretaget Shape Security. Snarare än test, gynnar han något som kallas ”kontinuerlig autentisering”, i huvudsak iakttagande av användarens beteende och letar efter tecken på automatisering. ”En riktig människa har inte särskilt bra kontroll över sina egna motorfunktioner, och så kan de ’ t flytta musen på samma sätt mer än en gång över flera interaktioner, även om de försöker riktigt hårt, säger Ghosemajumder. Medan en bot kommer att interagera med en sida utan att flytta en mus, eller genom att flytta en mus mycket exakt, har mänskliga handlingar ”entropi” som är svårt att förfalska, säger Ghosemajumder.

Googles eget team tänker på liknande sätt Den senaste versionen, re v3, som tillkännagavs i slutet av förra året, använder ”adaptiv riskanalys” för att få trafik efter hur misstänksam den verkar; webbplatsägare kan sedan välja att presentera skissartade användare med en utmaning, som en lösenordsbegäran eller tvåfaktorautentisering. Google skulle inte säga vilka faktorer som ingår i den poängen, förutom att Google observerar hur en massa ”bra trafik” på en webbplats ser ut, enligt Cy Khormaee, en produktchef i teamet, och använder det för att upptäcka ”dåligt trafik.” Säkerhetsforskare säger att det troligen är en blandning av kakor, webbläsarattribut, trafikmönster och andra faktorer. En nackdel med den nya modellen för botdetektering är att det kan göra navigeringen på nätet samtidigt som övervakningen minimeras till en irriterande upplevelse, eftersom saker som VPN och anti-tracking-tillägg kan få dig att bli misstänkt och utmanad.

Aaron Malenfant, ingenjörsledningen på Googles team, säger att flytten från Turing-testerna är avsedd att kringgå den konkurrens som människor fortsätter att förlora. ”När människor satsar mer och mer på maskininlärning måste sådana slags utmaningar bli svårare och svårare för människor, och det är särskilt därför vi lanserade V3 för att komma före den kurvan.” Malenfant säger att om fem till tio år framöver kommer utmaningar sannolikt inte att vara genomförbara alls. I stället kommer mycket av nätet att ha ett konstant, hemligt Turing-test som körs i bakgrunden.

I sin bok The Mest mänskliga mänskliga, Brian Christian deltar i en Turing Test-tävling som den mänskliga folien och finner att det faktiskt är ganska svårt att bevisa din mänsklighet i konversation. Å andra sidan har bot-tillverkare haft det lätt att passera, inte genom att vara den mest vältaliga eller intelligent konversation, men genom att undvika frågor med skämt utan sekvenser, göra stavfel, eller i fallet med botten som vann en Turing-tävling 2014 och hävdade att han var en 13-årig ukrainsk pojke med dåligt grepp om engelska. Det är möjligt att en liknande framtid är i väntan på, det mest använda Turing-testet i världen – ett nytt vapenlopp att inte skapa bots som överträffar människor i märkning av bilder och analysering av text, utan sådana som gör misstag, missa knappar, bli distraherad och byt flik. ”Jag thi nk folk inser att det finns en applikation för att simulera den genomsnittliga mänskliga användaren … eller dumma människor, säger Ghosemajumder.

Tester kan också kvarstå i denna värld. Amazon fick patent 2017 för ett system med optiska illusioner och logiska pussel människor har stora svårigheter att dechiffrera. Kallas Turing Test via misslyckande, det enda sättet att klara är att få svaret fel.

Policy

PSA: Lägg inte upp ditt coronavirus vaccinekort-selfie på sociala medier

Policy

Konsumentskyddsbyrå som undersöker Venmos insamlingsmetoder

Tech

Myanmar beordrar internetleverantörer att blockera Twitter och Instagram i landet

Visa alla berättelser i Tech

Mont Blanc

Varför CAPTCHA har blivit så svårt

PSA: Lägg inte upp ditt coronavirus vaccinekort-selfie på sociala medier

Konsumentskyddsbyrå som undersöker Venmos insamlingsmetoder

Myanmar beordrar internetleverantörer att blockera Twitter och Instagram i landet

Lämna ett svar Avbryt svar