Tämä artikkeli on tiivistelmä DNA:n Mitä pitää tietää koneoppimisesta -podcastista.
Koneoppiminen ei teknologiana ole mikään untuvikko. Sitä alettiin kehittää jo 60 vuotta sitten, mutta vasta viime vuosina tietokoneiden laskentakapasiteetti ja datan määrä ovat kivunneet sille tasolle, että koneoppimista voidaan aidosti hyödyntää.
Hyvä esimerkki on yhdysvaltalainen verkkokauppajätti Amazon, jonka algoritmit tekevät asiakkaille suosituksia heidän ostohistoriansa perusteella.
”Monet yhdistävät tekoälyn ja koneoppimisen nimenomaan markkinointiin ja myyntiin, sillä asiakkaista on kerätty perinteisesti runsaasti dataa, jonka perusteella palveluita ja erilaisia kampanjoita suunnitellaan. Joskus dataa on niin runsaasti, että sen seulomiseen ihmisvoimin menisi suhteettoman suuri määrä aikaa”, kertoo Helsingin Yliopiston tekoälytutkija ja Elements of AI -kurssin vetäjä Teemu Roos.
Miten koneoppiminen oikein toimii?
”Tekoälystä puhuttaessa tarkoitetaan usein nimenomaan koneoppimista. Yksinkertaisimmillaan tämä tarkoittaa dataa rouskuttavaa ja siitä samankaltaisuuksia tunnistavaa algoritmia, joka oppii parantamaan omaa toimintaansa ja tarjoamaan parempia ratkaisuja ”, Roos kertoo.
Jotta oppiminen on mahdollista, on datasta löydyttävä jotakin hyödynnettävää säännönmukaisuutta. Kovin epämääräistä tietoa ei koneoppimisen keinoin voi analysoida.
Algoritmit ovat kuin reseptejä, joiden tarkoitus on ratkaista jokin käsillä oleva ongelma. Esimerkiksi roskapostin suodattaminen perustuu algoritmiin, joka on oppinut suodattamaan juuri tietyntyyppistä sisältöä.
Numerot ja kirjaimet eivät ole ainoaa dataa, jonka käsittelyssä koneoppiminen voi olla avuksi. Kuviin liittyvää tunnistamista hyödynnetään jo esimerkiksi Googlen hakutyökalussa. Tämän lisäksi kielelliseen dataan ja ääneen perustuvaa tunnistamista käytetään ääniohjattavien laitteiden kehityksessä.
Mitä koneoppimisen käyttöön vaaditaan?
Koneoppimista voi soveltaa mihin tahansa ongelmaan, joka edellyttää toistuvaa systemaattista päättelyä. Jo ihan tavallisella nykyaikaisella tietokoneella pääsee hyvin alkuun. On kuitenkin muistettava, ettei kone voi ottaa itsenäistä vastuuta päätöksistä. Data on hyvä renki, joka tulee ihmisen tekemiä päätöksiä.
Lähes jokaisessa ammatissa on tehtäviä, joita voidaan automatisoida ja vapauttaa siten ihmisten aikaa muuhun. Yksinkertaisimmillaan se voi olla rutiinitehtävien automatisointia, kuten sähköpostin lajittelua tai kalenterisuman selvittelyä, mutta parhaimmillaan koneoppiminen tuo merkittävää kilpailuetua.
Koneoppimista hyödyntävän sovelluskehittämisen sykli ideasta tuotteeksi vie noin kolme vuotta, jolloin tuloksiakin pääsee tarkastelemaan varsin pian. On vain uskallettava tarttua härkää sarvista ja aloittaa ideointi.
Teemu Roosin kolme asiaa, jotka jokaisen tulisi tietää koneoppimisesta nyt:
- Koneoppiminen ei ole mikään mystinen uusi asia, vaan jatkumoa aiemmalle analytiikalle.
- Viime vuosina on otettu valtava harppaus kuvan ja äänen tunnistamisen sekä koenäön parissa.
- Tekoäly ja koneoppiminen eivät ole erityisen teknisiä teemoja, vaan tärkeintä on taito käyttää osaamista, tunnistaa relevanttia dataa ja yhdistää nämä kaksi toisiinsa tarkoituksenmukaisella tavalla.
Kuuntele koko jakso podcastista!
Mitä pitää tietää on 7-osainen podcast-sarja, jossa juontaja Sallamaari Muhonen ottaa kuulijoiden puolesta selkoa siitä, mitä pitää tietää lohkoketjuista, 5G:stä, eksoskeletoneista, tietoturvauhkista ja muista teknologiatrendeistä. Sarja on osa DNA:n Uuden työn ääniä -podcastia, jonka löydät Suplasta, Soundcloudista, Apple podcasteista, Spotifystä, YouTubesta tai suosikkisovelluksestasi!