På et eller andet tidspunkt sidste år begyndte Googles konstante anmodninger om at bevise, at jeg er menneske, at føle stadig mere aggressiv. Mere og mere blev den enkle, lidt alt for søde knap, der sagde “Jeg er ikke en robot”, efterfulgt af krav om at bevise det – ved at vælge alle trafiklys, tværgange og butiksfacader i et billedgitter. Snart blev trafiklysene begravet i fjernt løv, krydsede fortovene og halvt rundt om et hjørne, skiltet på butiksfacaden var sløret og på koreansk. Der er noget unikt, der er ubehageligt ved at blive bedt om at identificere en brandhane og kæmpe for den.
Disse tests kaldes, et akronym for Completely Automated Public Turing-test for at fortælle computere og mennesker adskilt, og de har nået denne form for usynliggørelsesplateau før. I begyndelsen af 2000’erne var enkle billeder af tekst nok til at stumpe de fleste spambots Men et årti senere, efter at Google havde købt programmet fra Carnegie Mellon-forskere og brugte det til at digitalisere Google Bøger, måtte tekster i stigende grad vrides og skjules for at holde sig foran forbedring af optiske tegngenkendelsesprogrammer – programmer, som i en I rundkørslen hjalp alle de mennesker, der løste s, med at forbedre sig.
Fordi det er et så elegant værktøj til træning af AI, kunne enhver given test kun nogensinde være midlertidig, noget opfinderne erkendte fra starten. Med alle disse forskere, svindlere og almindelige mennesker, der løser milliarder af gåder lige ved tærsklen til, hvad AI kan gøre, kom maskinerne på et tidspunkt forbi os. I 2014 satte Google en af sine maskinindlæringsalgoritmer mod mennesker i løsningen af de mest forvrængede tekster: computeren fik testen rigtig 99,8 procent af tiden, mens mennesker kun fik 33 procent.
Google flyttede derefter til No Re, som observerer brugerdata og adfærd for at lade nogle mennesker passere med et klik på “Jeg er ikke en robot” -knappen og præsenterer andre for den billedmærkning, vi ser i dag. Men maskinerne er igen indhente. Alle de markiser, der måske eller måske ikke er butiksfacader? De er slutspillet i menneskehedens våbenkapløb med maskinerne.
Jason Polakis, en datalogiprofessor ved University of Illinois i Chicago tager personlig kredit for den nylige stigning i vanskeligheder. I 2016 udgav han et papir, hvor han brugte billedgenkendelsesværktøjer fra hylden, herunder Googles egen omvendte billedsøgning, til at løse Googles billeder med 70 procent nøjagtighed. Andre forskere har brudt Googles lydudfordringer ved hjælp af Goog le’s egne lydgenkendelsesprogrammer.
Maskinindlæring er nu omtrent lige så god som mennesker til grundlæggende tekst-, billed- og stemmegenkendelsesopgaver, siger Polakis. Faktisk er algoritmer sandsynligvis bedre til det: “Vi er på et tidspunkt, hvor det bliver sværere for software, hvilket gør det for svært for mange mennesker. Vi har brug for et alternativ, men der er ikke en konkret plan endnu.”
Litteraturen om er fyldt med falske starter og mærkelige forsøg på at finde noget andet end tekst- eller billedgenkendelse, som mennesker er universelt gode til og maskiner kæmper med. Forskere har forsøgt at bede brugerne om at klassificere billeder af mennesker efter ansigtsudtryk, køn (og du kan forestille dig, hvor godt det gik.) Der har været forslag til triviaer og s baseret på børnerim, der er almindelige i det område, hvor en bruger angiveligt voksede op. Sådanne kulturelle er ikke kun rettet mod bots, men på mennesker, der arbejder på oversøiske gårde og løser gåder i en brøkdel af en cent. Folk har forsøgt at forhindre billedgenkendelse ved at bede brugerne om at identificere, siger, svin, men at lave svinene tegneserier og give dem solbriller. Forskere har undersøgt brugerne om at identificere fy objekter i Magic Eye-lignende pletter. I en spændende variation foreslog forskere i 2010 at bruge s til at indeksere gamle helleristninger, idet computere ikke var særlig gode til at dechifrere gestusskitser af rensdyr, der var skrabet på hulmure.
For nylig har der været bestræbelser på at udvikle spillignende s, test, der kræver, at brugerne roterer objekter til bestemte vinkler eller flytter puslespil på plads, med instruktioner ikke givet i tekst, men i symboler eller underforstået af sammenhængen med spillebrættet. Håbet er, at mennesker ville forstå puslespilets logik, men computere, der mangler klare instruktioner, ville blive stumpet. Andre forskere har forsøgt at udnytte det faktum, at mennesker har kroppe, ved hjælp af enhedskameraer eller augmented reality til interaktivt bevis for menneskeheden.
Problemet med mange af disse tests er ikke nødvendigvis, at bots er for kloge – det er at mennesker suger på dem. Og det er ikke, at mennesker er dumme; det er, at mennesker er vildt forskellige i sprog, kultur og oplevelse. Når du er væk med alle de ting for at lave en test, som ethvert menneske kan bestå uden forudgående træning eller meget eftertanke, er du tilbage med brutale opgaver som billedbehandling, nøjagtigt den ting, en skræddersyet AI vil være god til .
“Testene er begrænset af menneskelige evner,” siger Polakis. “Det er ikke kun vores fysiske evner, du har brug for noget, der krydser kulturelt, på tværs af sprog. Du har brug for en slags udfordring, der fungerer sammen med nogen fra Grækenland, nogen fra Chicago, nogen fra Sydafrika, Iran og Australien på samme tid. Og det skal være uafhængigt af kulturelle indviklinger og forskelle. Du har brug for noget, der er let for et gennemsnitligt menneske, det bør ikke være bundet til en bestemt undergruppe af mennesker, og det skal være svært for computere på samme tid. Det er meget begrænsende, hvad du rent faktisk kan gøre. Og det skal være noget, som et menneske kan gøre hurtigt, og som ikke er for irriterende. “
At finde ud af, hvordan man løser disse slørede billedquizzer, fører dig hurtigt ind i et filosofisk område : hvad er den universelle menneskelige kvalitet, der kan demonstreres for en maskine, men som ingen maskine kan efterligne? Hvad er det at være menneske?
Men måske måles vores menneskehed ikke ved, hvordan vi udfører med en opgave, men i hvordan vi bevæger os gennem verden – eller i dette tilfælde via internettet. Spil, videoer, uanset hvilken type test du udarbejder, vil i sidste ende blive brudt, siger Shuman Ghosemajumder, der tidligere arbejdede hos Google for at bekæmpe kliksvindel, inden han blev teknologichef for bot-detekteringsfirmaet Shape Security. I stedet for test foretrækker han noget, der kaldes “kontinuerlig godkendelse”, idet han i det væsentlige observerer en brugers adfærd og leder efter tegn på automatisering. “Et ægte menneske har ikke særlig god kontrol over deres egne motoriske funktioner, og så kan de ‘ t bevæge musen på samme måde mere end en gang over flere interaktioner, selvom de prøver virkelig hårdt, ”siger Ghosemajumder. Mens en bot interagerer med en side uden at bevæge en mus eller ved at flytte en mus meget præcist, har menneskelige handlinger “entropi”, som er svær at spoofe, siger Ghosemajumder.
Googles eget team tænker sammen lignende Den seneste version, re v3, der blev annonceret i slutningen af sidste år, bruger “adaptiv risikoanalyse” til at score trafik efter hvor mistænkelig den ser ud; webstedsejere kan derefter vælge at præsentere sketchy brugere med en udfordring, f.eks. en anmodning om adgangskode eller tofaktorautentificering. Google vil ikke sige, hvilke faktorer der indgår i denne score, bortset fra at Google observerer, hvordan en flok “god trafik” på et websted ser ud, ifølge Cy Khormaee, en produktchef i teamet, og bruger det til at opdage “dårligt Trafik.” Sikkerhedsforskere siger, at det sandsynligvis er en blanding af cookies, browserattributter, trafikmønstre og andre faktorer. En ulempe ved den nye model for botregistrering er, at det kan gøre det at navigere på nettet og samtidig minimere overvågning til en irriterende oplevelse, da ting som VPN’er og anti-tracking-udvidelser kan få dig til at blive markeret som mistænksom og udfordret.
Aaron Malenfant, ingeniørledelsen på Googles team, siger, at flytningen væk fra Turing-testene er beregnet til at undgå den konkurrence, som mennesker fortsætter med at tabe. “Når folk investerer mere og mere i maskinlæring, bliver disse slags udfordringer nødt til at blive sværere og sværere for mennesker, og det er især derfor, vi lancerede V3 for at komme foran den kurve.” Malenfant siger, at udfordringer sandsynligvis slet ikke vil være levedygtige over fem til ti år. I stedet vil meget af nettet have en konstant, hemmelig Turing-test, der kører i baggrunden.
I sin bog The Mest menneskelige menneske, Brian Christian deltager i en Turing Test-konkurrence som den menneskelige folie og finder ud af, at det faktisk er ret vanskeligt at bevise din menneskehed i samtale. På den anden side har botproducenter fundet det let at passere, ikke ved at være den mest veltalende eller intelligent samtalepartner, men ved at undvige spørgsmål med ikke-sequitur-vittigheder, lave stavefejl eller i tilfælde af en bot, der vandt en Turing-konkurrence i 2014 og hævdede at være en 13-årig ukrainsk dreng med en dårlig forståelse af engelsk. , at fejle er menneskelig. Det er muligt, at en lignende fremtid venter på, den mest anvendte Turing-test i verden – et nyt våbenkapløb om ikke at skabe bots, der overgår mennesker ved mærkning af billeder og parsing af tekst, men dem, der laver fejl, gå glip af knapper, blive distraheret, og skift fane. “Jeg thi nk folk er klar over, at der er en applikation til at simulere den gennemsnitlige menneskelige bruger … eller stumme mennesker, ”siger Ghosemajumder.
Test kan også bestå i denne verden. Amazon modtog et patent i 2017 for en ordning, der involverer optiske illusioner og logiske gåder, mennesker har store problemer med at dechifrere. Kaldet Turing Test via fiasko, den eneste måde at bestå er at få svaret forkert.
PSA: Send ikke dit coronavirus vaccinationskort selfie på sociale medier
Forbrugerbeskyttelsesagentur, der undersøger Venmos indsamlingspraksis
Myanmar beordrer internetudbydere at blokere Twitter og Instagram i landet
Se alle historier i Tech