Iris-tekoäly vauhdittaa tieteellisen tiedon löytämistä

Net 2017,  15.6.2017

Maria Ritola haluaa vauhdittaa tiedettä. Maailmassa julkaistaan joka päivä yli 3 000 tieteellistä tutkimusta, joista valtaosa on kaikkien tieteilijöiden ulottuvilla. Määrä on kuitenkin niin suuri, että suuri osa heistä ei voi mitenkään seurata itselleen relevanttien tutkimuspaperin tulvaa.

Maria Ritolan yritys Iris AI ratkaisee löytämisen haastetta tekoälyn avulla. Yhtiön tekoäly Iris opettelee kieltä käymällä läpi tutkimusmateriaaleja 5 000 vapaaehtoisen ihmiskouluttajan avulla. Ihmiset ja Iris käyvät läpi samat tekstit. Iris näyttää, mitkä ovat tekstin keskeiset käsitteet. Ihmiset kertovat Irikselle onko se löytänyt oikeat käsitteet eli onnistunut ymmärtämään tekstin sisällön.

Tämän lisäksi Iris käy läpi tieteellistä tekstimassaa parantaakseen algoritmejaan eli ymmärtääkseen kieltä ja sanojen merkityksiä eri yhteyksissä. Tällä hetkellä se on lukenut 60 miljoonan tieteellisen artikkelin tiivistelmät. Iris yhdistää eri artikkeleita toisiinsa niiden käsitteiden avulla.

Kieli on harvoin täsmällistä

M Ritola

”Tekoälyn mahdollisuuksia on sovellettu jo erilaisiin kohteisiin, joissa on suhteellisen helposti määriteltävät säännöt. Esimerkiksi Alpha Go -tekoäly pelasi vaativaa Go-peliä miljoonia kertoja itseään vastaan ja se on voittanut maailman parhaan pelaajan. Tekoälyn avulla on jo löydetty syöpä röntgenkuvasta, josta ihmissilmällä sitä ei voinut havaita”, Ritola kertoi Fujitsun World Tour -tilaisuudessa.

Kieli taas on harvoin täsmällistä, ja kielen oppimiseen ei riitä vain sanojen ymmärtäminen, vaan pitää ymmärtää, mitä sanat tarkoittavat tietyssä kontekstissa. Tämän vuoksi tekoälyn opettaminen lukemaan tieteellistä tekstiä on hidasta. Tekoäly oppii kuitenkin asioita logaritmisesti, joten hidasta alkua seuraavat rajut harppaukset tulevaisuudessa.

Ritolan mukaan Iriksen tavoite on tuoda tieto vaivattomasti ihmisille, jotta nämä voivat käyttää aikansa tiedon hakemista tärkeämpään työhön.

”Nykyiset tutkimustyökalut perustuvat hakusanoihin. Hakusanojen määrittäminen on hidasta, eikä hakija voi tietää, oivalsiko hän kaikki olennaiset hakusanat löytääkseen itselleen relevantin tiedon. Iriksen tavoitteena on yhdistää toisiinsa liittyvät tutkimukset, vaikka näissä ei edes puhuttaisi asioista samoin termein”, Ritola sanoo.

Tekoäly on sähkön kaltainen harppaus

Iristä on kokeiltu käytössä Chalmersin yliopistossa Ruotsissa. Sen auttoi säästämään 300 tuntia työtä yksittäisessä tutkimushankkeessa.

Ritola kertoo, että seuraavassa vaiheessa Irikseltä tavoitellaan kykyä luoda uutta tietoa ja uusia tutkimushypoteeseja tieteelle. Samaan aikaan Iristä suunnitellaan tueksi yritysten tutkimus- ja tuotekehitystyöhön.

”Yritysten kannalta tekoälyn kehitys on sähkön kaltainen harppaus. Dataa pitäisi ajatella palapelin palasina, joita ihmisaivot eivät pysty millään yhdistämään. Tekoälyn potentiaali on siinä, että se löytää tapoja kytkeä erilaista dataa toisiinsa tavoilla, joita me emme pysty vielä edes ajattelemaan.”

Muutosta on vaikea hahmottaa, koska kehitys tapahtuu eksponentiaalisesti. Ritola kehottaa yrityksiä pohtimaan jo nyt ensiaskeliaan.

”Jos listaan neljä yritysten kannalta tärkeintä asiaa, niin tärkeintä on tunnistaa olemassa oleva data, tarvittava data ja kerättävissä oleva data. Toiseksi, kokeile mahdollisimman paljon erilaisten toimijoiden kanssa. Kolmanneksi, yritä ymmärtää, mitä algoritmit tekevät, minkä ne tekevät huonosti ja minkä ne tekevät hyvin ja mitä ne eivät tee ollenkaan. Viimeiseksi, ole malttamaton – älä ota takakenoa tässä vaiheessa.”

Juttu perustuu Maria Ritolan esitykseen Fujitsu World Tour -tilaisuudessa 26.4.2017. Katso esitys täältä 

Lisätietoja
info@fi.fujitsu.com

Julkaistu Net-lehden numerossa 2017,  15.6.2017

Facebook  Twitter  Google  LinkedIn