Miksi CAPTCHA: t ovat tulleet niin vaikeiksi

Osa

Jossakin viime vuoden vaiheessa Googlen jatkuvat pyynnöt todistaa olevani ihminen alkoivat tuntea yhä aggressiivisempi. Yhä useammin yksinkertaisen, hieman liian söpön painikkeen ”En ole robotti” jälkeen seurasi vaatimuksia sen todistamiseksi – valitsemalla kaikki liikennevalot, risteykset ja myymälät kuvaruudukossa. Pian liikennevalot haudattu kaukaisiin lehtiin, risteykset vääntyivät ja puolet kulman takana, kaupan kyltit epäselvät ja koreaksi. Jotakin ainutlaatuista häiritsevää on, kun häntä pyydetään tunnistamaan paloposti ja kamppailemaan sen kanssa.

Näitä testejä kutsutaan lyhenteeksi Täysin automatisoitu julkinen Turing -testi, joka kertoo tietokoneille ja ihmisille, ja ne ovat jo saavuttaneet tällaisen salaamattomuuden tasangon. 2000-luvun alkupuolella yksinkertaiset tekstikuvat olivat riittäviä useimpien spamboteiden kannattamiseksi. Mutta vuosikymmen myöhemmin, sen jälkeen kun Google oli ostanut ohjelman Carnegie Mellonin tutkijoilta ja käyttänyt sitä Google-kirjojen digitalisointiin, tekstejä oli yhä vääntynyt ja peitettävä pysyäkseen optisten merkkien tunnistusohjelmien – ohjelmien, jotka yhdessä kiertotien varrella kaikki ne ihmiset, jotka ratkaisevat ratkaisuja, auttoivat parantamaan.

Koska tekoäly on niin tyylikäs työkalu tekoälyn harjoittamiseen, mikä tahansa testi voi olla vain väliaikainen, minkä sen keksijät tunnustivat alussa. Kun kaikki nämä tutkijat, huijarit ja tavalliset ihmiset ratkaisivat miljardeja pulmia juuri kynnyksellä, mitä tekoäly voi tehdä, jossain vaiheessa koneet ohittivat meidät. Vuonna 2014 Google asetti yhden koneoppimisalgoritmeistaan ihmistä vastaan vääristyneimpien tekstien ratkaisemisessa: tietokone sai testin oikein 99,8 prosenttia ajasta, kun taas ihmiset vain 33 prosenttia.

Google muutti sitten No Re -palveluun, joka tarkkailee käyttäjätietoja ja käyttäytymistä päästääkseen jotkut ihmiset läpi napsauttamalla ”En ole robotti” -painiketta, ja esittelee muille tänään näkyvät kuvamerkinnät. Mutta koneet ovat jälleen kerran Kaikki ne markiisit, jotka saattavat olla myymälätiloja tai eivät, ovatkö ne loppu ihmiskunnan kilpailussa koneiden kanssa.

Jason Polakis, tietojenkäsittelytieteen professori Illinoisin yliopisto Chicagossa ottaa henkilökohtaisen tunnustuksen viimeaikaisesta vaikeuksien lisääntymisestä. Vuonna 2016 hän julkaisi paperin, jossa hän käytti valmiiden kuvien tunnistustyökaluja, mukaan lukien Googlen oma käänteinen kuvahaku, ratkaisemaan Googlen kuvan 70: llä. prosentin tarkkuus. Muut tutkijat ovat rikkoneet Googlen äänihaasteet Googlen avulla omat äänentunnistusohjelmat.

Koneoppiminen on nyt suunnilleen yhtä hyvää kuin ihmiset tekstin, kuvan ja äänentunnistuksen perustehtävissä, Polakis sanoo. Itse asiassa algoritmit ovat luultavasti parempia siinä: ”Olemme pisteessä, jossa ohjelmistojen vaikeuttaminen lopulta tekee siitä liian vaikeaa monille ihmisille. Tarvitsemme vaihtoehtoa, mutta konkreettista suunnitelmaa ei vielä ole.”

Kirjallisuus on täynnä vääriä alkuja ja outoja yrityksiä löytää jotain muuta kuin tekstin tai kuvan tunnistamista, jossa ihmiset ovat yleisesti hyviä ja koneet kamppailevat. Tutkijat ovat yrittäneet pyytää käyttäjiä luokittelemaan ihmisten kuvat kasvojen ilmeen, sukupuolen mukaan , ja etnisyys. (Voitte kuvitella, kuinka hyvin meni.) On tehty ehdotuksia triviaa varten, ja ne perustuvat lastentarhoihin, jotka ovat yleisiä alueella, jolla käyttäjä oletettavasti varttui. Tällaiset kulttuurit eivät ole tarkoitettu vain roboteille, vaan Ihmiset, jotka työskentelevät ulkomailla sijaitsevilla maatiloilla, ratkaisevat arvoituksia sentin murto-osaan. Ihmiset ovat yrittäneet torjua kuvan tunnistamista pyytämällä käyttäjiä tunnistamaan esimerkiksi siat, mutta tekemällä sioista sarjakuvia ja antamalla heille aurinkolasit. Tutkijat ovat tutkineet käyttäjien tunnistamista fy esineitä Magic Eye -tyyppisissä täplissä. Kiehtovassa muunnelmassa tutkijat ehdottivat vuonna 2010 ikivanhojen petroglyfien indeksointiin merkintää s, sillä tietokoneet eivät ole kovin hyviä tulkitsemaan luolaseiniin rypytettyjen porojen ele-luonnoksia.

Viime aikoina on ollut pyrkimykset kehittää pelimaisia kaltaisia testejä, testejä, jotka vaativat käyttäjiä kiertämään esineitä tiettyihin kulmiin tai siirtämään palapelin palaset paikalleen ohjeiden avulla, jotka eivät ole tekstiä, vaan symboleja tai joita pelilaudan konteksti antaa ymmärtää. Toivo on, että ihmiset ymmärtäisivät palapelin logiikan, mutta tietokoneet, jotka puuttuivat selkeistä ohjeista, olisivat tyhmät. Muut tutkijat ovat yrittäneet hyödyntää sitä, että ihmisillä on ruumiita, käyttämällä laitekameroita tai täydennettyä todellisuutta ihmiskunnan interaktiiviseksi todistamiseksi.

Monien näiden testien ongelma ei välttämättä ole se, että botit ovat liian älykkäitä – se on että ihmiset imevät heitä. Eikä ihminen ole tyhmä; ihmisten kieli, kulttuuri ja kokemus ovat villin erilaisia. Kun olet päässyt eroon kaikesta, jotta voit tehdä testin, jonka kuka tahansa ihminen voi läpäistä ilman edeltävää koulutusta tai paljon miettimistä, sinulle jää raakoja tehtäviä, kuten kuvankäsittely, juuri se asia, johon räätälöity tekoäly tulee olemaan hyvä .

”Ihmisen kyvyt rajoittavat testejä”, Polakis sanoo. ”Se ei ole vain fyysisiä kykyjämme, vaan tarvitset jotain, joka ylittää kulttuurin ja kielen. Tarvitset jonkinlaisen haasteen, joka toimii yhtä aikaa Kreikan, Chicagon, Etelä-Afrikan, Iranin ja Australian kanssa. Ja sen on oltava riippumaton kulttuurisista mutkista ja eroista. Tarvitset jotain, joka on keskimääräiselle ihmiselle helppoa, sitä ei pitäisi sitoa tiettyyn ihmisryhmään, ja sen pitäisi olla vaikeaa myös tietokoneille. Se on hyvin rajoittavaa siinä, mitä voit todella tehdä. Ja sen on oltava jotain, mitä ihminen voi tehdä nopeasti, eikä se ole liian ärsyttävää. ”

Näiden epäselvien kuvakyselyjen korjaaminen vie sinut nopeasti filosofiselle alueelle. : mikä on ihmisen universaali laatu, joka voidaan osoittaa koneelle, mutta jota mikään kone ei voi jäljitellä? Mitä on olla ihminen?

Mutta ihmiskuntaamme ei ehkä mitata sillä, miten suoritamme tehtävän, vaan siitä, miten liikkumme ympäri maailmaa – tai tässä tapauksessa Internetin kautta. Pelien, videoiden, kaikenlaisen testin rikki lopulta rikkoutuu, kertoo Shuman Ghosemajumder, joka on aiemmin työskennellyt Googlessa napsautuspetosten torjunnassa ennen kuin hänestä tuli bottien havaitsemisyrityksen Shape Securityn pääjohtaja. Testien sijaan hän suosii jotain, jota kutsutaan ”jatkuvaksi todennukseksi”, olennaisesti tarkkailemalla käyttäjän käyttäytymistä ja etsimällä merkkejä automaatiosta. ”Todellisella ihmisellä ei ole kovin hyvää hallintaa omissa moottoritoiminnoissaan, joten he voivat” älä liikuta hiirtä samalla tavalla useammin kuin kerran useiden vuorovaikutusten aikana, vaikka he todella yrittäisivätkin ”, Ghosemajumder sanoo. Vaikka botti on vuorovaikutuksessa sivun kanssa siirtämättä hiirtä tai liikuttamalla hiirtä hyvin tarkasti, ihmisen toiminnoilla on ”entropia”, jota on vaikea huijata, Ghosemajumder sanoo.

Googlen oma tiimi ajattelee vastaavia Viimeisimmässä versiossa re v3, joka julkistettiin viime vuoden lopulla, käytetään ”mukautuvaa riskianalyysiä” pisteyttämään liikennettä sen mukaan, kuinka epäilyttävältä se näyttää; verkkosivustojen omistajat voivat sitten valita, esittävätkö piirustukset käyttäjille haasteen, kuten salasanapyynnön tai kaksivaiheisen todennuksen. Google ei sanoisi, mitkä tekijät menevät tähän pisteeseen, lukuun ottamatta sitä, että Google havaitsee, kuinka joukko ”hyvää liikennettä” sivustolla näyttää joukkueen tuotepäällikön Cy Khormaeen mukaan, ja käyttää sitä ”huonojen” havaitsemiseen. liikennettä. ” Turvallisuustutkijoiden mukaan se on todennäköisesti sekoitus evästeitä, selaimen ominaisuuksia, liikennemalleja ja muita tekijöitä. Yksi haittapuoli bottien havaitsemisen uudesta mallista on, että se voi tehdä verkossa liikkumisesta minimoimalla valvonnan häiritseväksi kokemukseksi, koska esimerkiksi VPN: t ja seurannanvastaiset laajennukset voivat merkitä sinut epäilyttäväksi ja haastavaksi.

Googlen tiimin suunnittelupäällikkö Aaron Malenfant sanoo, että siirtymisen Turingin testeistä on tarkoitus ohittaa kilpailu, jonka ihmiset häviävät jatkuvasti. ”Kun ihmiset panostavat yhä enemmän koneoppimiseen, tällaisten haasteiden on oltava yhä vaikeampia ihmisille, ja erityisesti siksi käynnistimme V3: n, jotta pääsisimme eteenpäin tästä käyrästä.” Malenfant sanoo, että viiden tai kymmenen vuoden kuluttua haasteet eivät todennäköisesti ole lainkaan kannattavia. Sen sijaan suurella osalla verkkoa taustalla on jatkuva, salainen Turing-testi.

Kirjassa The Suurin osa ihmisestä, Brian Christian osallistuu Turingin testikilpailuun ihmiskerroksena ja huomaa, että ihmiskunnan todistaminen keskustelussa on todella vaikeaa. Toisaalta bottien valmistajien on ollut helppo läpäistä, ei olemalla kaikkein kaunopuheisimpia tai Älykäs keskustelija, mutta välttämällä kysymyksiä sekvenssivapailla vikoilla, tekemällä kirjoitusvirheitä tai kun kyseessä on botti, joka voitti Turingin kilpailun vuonna 2014, väittäen olevansa 13-vuotias ukrainalainen poika, jolla on huono englannin kielen taito. On mahdollista, että samanlainen tulevaisuus on varattuna maailman eniten käytettyyn Turingin testiin – uusi asevarustelukilpailu, jolla ei luoda botteja, jotka ylittäisivät ihmisiä kuvien merkitsemisessä ja tekstin jäsentämisessä, mutta jotka tekevät virheitä, kaipaa painikkeita, häiritse ja vaihda välilehtiä. ”Minä nk-ihmiset ymmärtävät, että on olemassa sovellus keskimääräisen ihmisen käyttäjän … tai tyhmien ihmisten simuloimiseksi ”, Ghosemajumder sanoo.

Testit voivat jatkua myös tässä maailmassa. Amazon sai patentin vuonna 2017 järjestelmästä, johon liittyy optisia harhoja ja logiikkapulmia. Ihmisillä on suuria vaikeuksia tulkita. Turing-testiksi kutsutaan epäonnistumisen kautta, ainoa tapa siirtää vastaus on saada väärä vastaus.

Policy

PSA: Älä lähetä koronavirusta rokotuskortti selfie sosiaalisessa mediassa

Policy

Venmon keräyskäytäntöjä tutkiva kuluttajansuojavirasto

Tech

Myanmar käskee Internet-palveluntarjoajia estämään Twitter ja Instagram maassa

Näytä kaikki Techin tarinat

Leave a Reply

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *