Yleistä

Keskitymme tässä ensimmäisessä luvussa alan tärkeimpiin termeihin, niiden määritelmiin, ja yleiskatsaukseen aiheen historiaan. Ensimmäisen opiskeluviikon jälkeen sinun tulisi osata selittää 5-vuotiaalle muun muassa se, että miten koneoppiminen ja tekoäly liittyvät toisiinsa ja mitä ongelmia koneoppiminen auttaa ratkaisemaan.

Tip

Muistutan vielä, että kurssimateriaali ei ole tehtäväkirja. Kunkin aiheen lopussa on tehtäviä, mutta niistä ei saa pisteitä. Oppimispäiväkirjasi tulee olla itsenäinen teos, joka koostuu viikkotason raporteista. Jos et tiedä yhtään, mitä sinun tulee tehdä, lue Oppimispäiväkirja 101 -ohjeistus.

Mikä on osa mitä?

KOKO-ontologian mukaan koneoppiminen käsite, jonka yläkäsite on tekoäly. Toisin sanoen kaikki koneoppiminen on tekoälyä, mutta kaikki tekoäly ei ole koneoppimista. Myöhemmillä kursseilla opittava syväoppiminen on sen sijaan koneoppimisen alakäsite. ¹ Täysin itsestäänselvää tämä ei kuitenkaan ole, eikä varsinkaan arkikielessä käytettynä.

"Termejä koneoppiminen, hahmontunnistus ja tekoäly käytetään tarkoittamaan asmaa asiaa, ja no epäselvää miten ne eroavat toisistaan. [...] Kävin ensimmäisen kurssini koneoppimisesta 90-luvulla, ja sillloin Suomessa käytettiin termiä hahmontunnistus."

– Joni Kämäräinen ²

Kaikkiin näihin liittyy käsite sekä tieteenala datatieteet (engl. data sciences), ja tyypillinen titteli datetieteilijälle on data scientist. Opettajan näkemys on, että meiltä valmistuu todennäköisemmin esimerkiksi data engineer tai ML engineer tittelille kuin varsinaiseksi datatieteilijäksi – kyseiseen tehtävään olisi hyvä hankkia vankka tilastotieteen tausta. Voit verrata käymäsi koulutusohjelman sisältöä esimerkiksi Roadmap.sh-sivuston tarjoamiin uratiekarttoihin: AI and Data Scientist Roadmap ja ML engineer roadmap ja Data Engineer Roadmap ja MLOps Engineer Roadmap.

"Data Scientist (n.): Person who is better at statistics than any software engineer and better at software engineering than any statistician."

– Josh Wills ³

Saman KOKO-ontologian mukaan datatiede on tieteenalan tietojenkäsittelytieteet alakäsite. Alla on huumorivivahteinen Venn-kuvaaja, jossa esitellään eri aihealueiden päällekkäisyyksien luomat kombinaatiot (ks. Kuva 1). Jos pohdit, mikä sanan danger zone tilalla voisi olla ei-niin-humoristisessa mielessä, niin wikidata: data science-artikkelin kuvaajissa kyseisessä kohdassa lukee data processing.

Data_Science_VD

Kuva 1: Venn-diagrammi datatieteistä. (CC-BY) ⁴

Datatieteet ovat tieteenala, joka laittaa koneoppimisen käytäntöön. Se, millä tittelillä ja miten sinä osallistut tähän prosessiin, riippuu monesta tekijästä.

Tekoäly

Tekoäly on vahvasti elokuvateollisuuden ja muun fiktion värittämä käsite. Osa fiktion tarjoamasta tiedosta on täyttä humpuukia, ja todellisuudessa tekoälyn hupun alta paljastuu pikemminkin tilastotiedettä ja matematiikkaa. Tämä ei kuitenkaan vähennä tekoälyn arvoa liiketoiminnan kannalta tärkeiden ongelmien ratkaisijana.

Historia

Tekoäly ei ole uusi keksintö. Ihmismielen päättelyn ymmärtämistä tai sitä vastaavan mekaanisen laitteen rakentamista on yritetty satoja ellei jopa tuhansia vuosia. Ensimmäinen neuroverkkotietokone, SNARC, rakennettiin vuonna 1950 Minskyn ja Edmondsin toimesta. Se koostui 40:stä keinotekoisesta neuronista, joiden rakennetta inspiroivat ihmisaivojen neuronit. ⁵ Neuroverkkojen historiaan tutustutaan kuitenkin enemmän kurssilla Syväoppiminen I, joten jätetään tämä osa historiaa syvemmin käsittelemättä.

Koneoppimisen historiaa voidaan sen sijaan hieman sivuuttaa. Kirjassaan Koneoppimisen perusteet – joka kannattaa lukea jos käsiinsä saa – Kämäräinen mainitsee myös suomalaisia nimiä ja yhteisöjä, jotka toivat alan Suomeen. Näitä ovat seuran Hatutus (Suomen hahmontunnistustutkimuksen seura) perustajat Teuvo Kohonen, Erkki Oja ja Matti Pietikäinen. ² Löydät tämän 1977 perustetun seuran tietoja helposti netistä, alken vaikkapa Tieteellisten seurain valtuuskunnan tarjoamista seuran tiedoista.

Opettajan kokemus on, että jos yrität tutustua koneoppimisen historiaan, joudut väistelemään neuroverkkoja ja syväoppimista jo 40—50-luvuilta asti. Tämän kurssin koneoppiminen, eli klassiset noin 90-luvun koneoppimismallit, ajavat sinut herkästi aiheisiin kuten statistical signal processing ja statistical pattern recognition. Meidän kurssilla käytäntö lähtee Bayesilaisesta tilastotieteestä, mistä edetään frekventistisen päättelyn keinoihin ja niihin perustuviin koneoppimismalleihin. Myös

Warning

Neuroverkkoihin syvennytään Syväoppiminen I -kurssilla, joten teethän kaikkesi, jotta et käsittele esimerkiksi nykyisiä kielimalleja aihepiirinä oppimispäiväkirjassasi. Tämän aikan tulee vielä.

Määritelmä

Jotta meillä voisi olla ristiriidaton määritelmä tekoälylle, meillä tulisi olla ensin ristiriidaton määritelmä (ihmisen) älykkyydelle. Tällaista ei ole, joten myös AI:n suhteen joudumme tyytymään vaihteleviin määritelmiin. Kirjassa Artificial Intelligence: A Modern Approach ⁶ esitetään, että tekoäly on ala, joka pyrkii ei vain ymmärtämään, vaan myös rakentamaan älykkäitä toimijoita. Tekoälyn määritelmiä voidaan kirjan mukaan järjestää neljään kategoriaan: ihmismäisesti ajattelemiseen, rationaalisesti ajattelemiseen, ihmismäisesti toimimiseen ja rationaalisesti toimimiseen. Näiden neljän kategorian jakautuminen perustuu kahteen akseliin: rationaali-ihmismäinen (engl. rational-humanly) ja ajattelu-toiminta (engl. thinking-acting). Jos tekoäly toimii ihmismäisesti (engl. acting humanly), sen käyttäytyminen on vaikea erottaa ihmisen käyttäytymisestä. Esimerkiksi kuulustelija ei tietäisi, käykö hän keskustelua botin vai ihmisen kanssa. Vastakohta tälle molemmilla akselilla on rationaalisesti ajattelu (engl. thinking rationally). Tämän määritelmän mukaan botti noudattaisi täydellistä päättelyprosessia. Kaikki olisi täysin virheetöntä logiikkaa.

Warning

Voisi olla jossain määrin riskaabelia yrittää ratkaista todellisen maailman ongelmia käyttäen bottia, joka pyrkii täydellisesti aukottomaan, rationaaliseen ajatteluun, eikö?

Rationaalinen toiminta (engl. rational-acting) vaikuttaa olevan parhaiten soveltuva lähestymistapa käytännön tekoälylle. Rationaalinen toimija on olio, joka havaitsee ympäristönsä erilaisten antureiden avulla ja toimii sen mukaisesti, mutta pystyy sopeutumaan muutoksiin ja tavoittelee päämääriä. Tämän kurssin aikana luomme useita erilaisia rationaalisia toimijoita ja niiden komponentteja: yksi niistä on koneoppiminen, joka on tällä hetkellä hallitseva tapa rakentaa tekoälyä.

Tämän materiaalin puitteissa voit luottaa seuraavaan määritelmään: AI eli tekoäly on mitä tahansa, mikä ulkoapäin vaikuttaa joltakin, mikä tyypillisesti vaatii ihmisen älykkyyttä. Esimerkiksi kielioppivirheitä tai syntaksivirheitä voi poistaa tekstistä sääntöpohjaisella logiikalla käyttämättä koneoppimista laisinkaan. Myös esimerkiksi "älyliikennevaloja" voi ohjata hyvinkin sääntöpohjaisesti.

Question

Onko jokin alla listatuista teoksista tuttu? Mitä tekoäly tarkoittaa kyseisessä tarinassa? Mitkä muut elokuvat, tv-sarjat tai kirjat kuuluisivat listalle?

2001: A Space Odyssey (1968)
Hitchhiker's Guide to the Galaxy (1978/...)
Terminator (1984/...)
The Matrix (1999/...)
A.I. Artificial Intelligence (2001)
Moon (2009)
Her (2013)
Ex Machina (2014)
Companion (2025)

Haarat

Tekoäly on kattokäsite ja sen alle lukeutuu eri aloja. Kirjassa "Artificial Intelligence with Python" ⁷ esitellään tekoälyn eri haarat seuraavasti:

Koneoppiminen ja hahmontunnistus (engl. machine learning and pattern recognition): datasta oppiminen ja siitä ennustaminen. Tämän kurssin AI edustaa pääasiassa tätä.
Logiikkapohjainen AI (engl. logic-based AI): sääntöpohjaiset järjestelmät, jotka perustuvat logiikkaan. Käytetään esimerkiksi kielen parsimiseen.
Haku (engl. search): algoritmit, jotka etsivät esimerkiksi optimaalista reittiä. Peleistä ja navigaattoreista tuttuja.
Tiedon esittäminen (enlg. knowledge representation): yhteyksien luominen tiedon välille taksonomian tai muun hierarkisen järjestelmän avulla.
Suunnittelu (engl. planning): algoritmit, jotka suunnittelevat toimintaa tavoitteiden saavuttamiseksi.
Heuristiikka (engl. heuristics): reittien tai ratkaisuiden etsiminen tilanteessa, jossa optimaalista ratkaisua ei ole mahdollista tai käytännöllistä löytää, kenties nojaten nyrkkisääntöön tai akateemiseen arvaukseen, joka on osoitettavissa riittävän hyväksi.
Geneettinen ohjelmointi (engl. genetic programming): algoritmit, jotka käyttävät evoluutioteoriaa ratkaisujen löytämiseen.

Koneoppiminen

Koneoppimisen määritelmään kuuluu, että koneoppimismalli oppii datasta. Malli oppii siis kokemuksesta. Koneoppimismallin luominen ("mallinnus") on prosessi, jossa valittu koneoppimisalgoritmi oppii datasta. Ihminen valitsee sekä algoritmin että datan - ja näiden valinnalla on merkittävä vaikutus valmiin mallin laatuun.

Määritelmiä

"Machine learning (ML) is a collection of algorithms and techniques used to design systems that learn from data. These systems are then able to perform predictions or deduce patterns from the supplied data."

– Wei-Meng Lee ⁸

"The machine learning portion of the picture enabled an AI to perform these tasks:

Adapt to new circumstances that the original developer didn't envision

Detect patterns in all sorts of data sources

Create new behaviors based on the recognized patterns

Make decisions based on the success of failure of these behaviors."

– Luca Massaron, John Paul Mueller ⁹

"Difference between machine learning and AI:

If it is written in Python, it's probably machine learning

If it is written in PowerPoint, it's probably AI"

– Matt Velloso ¹⁰

"[Machine learning is the] field of study concerned with giving computers the ability to learn without being explicitly programmed."

– Arthur Smith ¹¹ ¹²

"A computer program is said to learn from experience, E, with respect to a task, T, and a performance measure, P, if its performance on T, as measured by P, improves with experience E."

– Tom Mitchell ¹¹ ¹²

"A program or system that builds (trains) a predictive model from input data. The system uses the learned model to make useful predictions from new (never-before-seen) data drawn from the same distribution as the one used to train the model. Machine learning also refers to the field of study concerned with these programs or systems."

– Google Developers ¹³

Lähteet

Finto. KOKO-ontologia. https://finto.fi/koko/fi/ ↩
Kämäräinen, J. Koneoppimisen perusteet. Otatieto. 2023. ↩↩
Wills, J (@josh_wills). Twitter post (now X). 2012. https://x.com/josh_wills/status/198093512149958656 ↩
Conway, D. The Data Science Venn Diagram. http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram ↩
Parvez, Z. The Pioneers of AI: Marvin Minsky and the SNARC. Medium. 2023. https://zahid-parvez.medium.com/history-of-ai-the-first-neural-network-computer-marvin-minsky-231c8bd58409 ↩
Russell, S. & Norvig, P. Artificial Intelligence: A Modern Approach. 3rd edition. Pearson. 2010. ↩
Joshi, P. Artificial Intelligence with Python. Packt Publishing. 2017. ↩
Lee, W. Python Machine Learning. Wiley. 2019. ↩
Mueller, P. & Massaron, L. Machine Learning for Dummies. No Starch Press. 2016. ↩
Velloso, M (@matvelloso). Twitter post (now X). 2018. https://x.com/matvelloso/status/1065778379612282885? ↩
Krishna, D. Your historical, theoretical and slightly mathematical introduction to the world of Machine…. Towards Data Science. 2020. https://towardsdatascience.com/your-historical-theoretical-and-slightly-mathematical-introduction-to-the-world-of-machine-862b94fe8353/ ↩↩
Géron, A. Hands-On Machine Learning with Scikit-Learn and PyTorch. O'Reilly. 2025. ↩↩
Google Developers. Machine Learning Glossary. https://developers.google.com/machine-learning/glossary#m ↩