Vaikutus ei katoa edes silloin, kun kuvitteellisen tekoälyn kerrotaan heikentävän suoritusta.
Uusi tutkimus osoittaa, että ihmiset suoriutuvat tehtävistä paremmin, jos he uskovat tekoälyn auttavan heitä. Tämä niin kutsuttu plasebo-vaikutus ei yllättäen katoa edes silloin, kun tekoälyjärjestelmän kerrotaan olevan epäluotettava ja jopa suoritukselle haitallinen.
Tutkijat laittoivat kaksi osallistujaryhmää tekemään yksinkertaisen tehtävän, jossa näyttöruudulle ilmestyi vaihtelevalla nopeudella kirjaimia ja nämä tuli yhdistellä pareiksi.
Toiselle ryhmälle kerrottiin, että heitä avustaa tehtävässä hyväksi todettu tekoäly. Toiselle puolestaan kerrottiin taustalla pyörivästä epäluotettavasta tekoälyohjelmasta, joka heikentäisi heidän suoritustaan. Molemmat ryhmät tekivät tehtävän myös ilman tekoälyn apua.
– Kumpaakaan tekoälyjärjestelmää ei todellisuudessa ollut olemassa, vaan osallistujille vain uskoteltiin, että tekoäly auttoi heitä, kertoo väitöskirjatutkija Agnes Kloft Aalto-yliopistosta.
Tutkijoiden hämmästykseksi molemmat ryhmät suorittivat harjoituksen paremmin – eli nopeammin ja tarkkaavaisemmin – kun he uskoivat tekoälyn myötävaikuttavan suoritukseen.
– Huomasimme, että ihmisillä on erittäin korkeat odotukset näitä järjestelmiä kohtaan. Emme pysty muuttamaan heidän odotuksiaan vain kertomalla heille, että ohjelma ei toimi, sanoo apulaisprofessori Robin Welsch.
Alkuperäisten kokeiden jälkeen tutkijat vielä toistivat kokeen verkossa ja pyysivät samalla osallistujia kuvaamaan odotuksiaan ja asenteitaan tekoälyä kohtaan. Useimmat suhtautuivat tekoälyyn myönteisesti, ja yllättäen jopa muulla tavoin skeptisillä ihmisillä oli myönteisiä odotuksia tekoälyn suorituskyvystä.
Valtava haaste uusien ohjelmien todellisten hyötyjen arvioimiselle
Tulokset osoittavat, miten vaikeaa on oikeasti arvioida uusia tekoälyjärjestelmiä.
– Tämä on tutkimuksestamme kumpuava suuri oivallus: plasebo-vaikutuksen vuoksi on valtavan haastavaa arvioida, auttavatko tekoälyohjelmat meitä oikeasti, Welsch sanoo.
Vaikka suurten kielimallien kaltaiset tehokkaat teknologiat epäilemättä kykenevät parantamaan tiettyjä suorituksia, ainakin ohjelmien eri versioiden väliset vähäiset erot saattavat näyttää kokoaan suuremmilta lumevaikutuksen vuoksi. Tätä myös hyödynnetään tehokkaasti markkinoinnissa.
Tulokset valaisevat myös merkittävää haastetta ihmisen ja tietokoneen välisen vuorovaikutuksen tutkimukselle. Johtopäätösten tekeminen ilman lumevaikutuksen kontrollointia voi johtaa pahasti harhaan.
– Tutkimuksemme viittaa siihen, että monet alan tutkimukset ovat saattaneet olla vinoutuneita tekoälyjärjestelmien hyväksi, Welsch toteaa tiedotteessa.