| Tuomas Heikkilä |

Geenit ja meemit ihmistieteilijän apuna

Pyhän Henrikin legendan sukupuu. Kuva: Tuomas Heikkilä


Ihmiseen ja hänen toimintaansa vaikuttavat tekijät muuttuvat hitaasti. Ihmisen omien arvojen ja ihanteitten tai olemisen reunaehtojen muutokset mitataan sukupolvissa. Pitkiä jatkumoita jahdatessaan tutkijan apuna ovat yllättävät tahot: algoritmit ja evoluutiobiologia.

Teologian, historian- ja kulttuurintutkimus on muutoksen tutkimusta. Historioitsija ja teologi ovat kiinnostuneita kulttuurin muutoksesta, oli kyse sitten pienen ihmisen vakaumuksesta, laajoista ajatusrakennelmista tai instituutioista.

Toisinaan muutos näyttää tapahtuvan nopeasti: vallankumoukset keikuttavat valtarakenteita ja reformaatiot mylläävät uskonnollisia käsityksiä. Kyse on kuitenkin vain pintakuohusta. Menneen näkemisen, nykyisen ymmärtämisen ja tulevan arvailemisen kannalta on tärkeämpää ymmärtää kulttuurin pitkiä jatkumoita. Kun haluamme löytää historiasta ulkoisten muotojen sijaan syvällä vaikuttavia voimia, huomio on kiinnitettävä pikemmin evoluutioon kuin revoluutioon.

Aineistojen ongelmat

Kulttuurievoluution tutkimukseen on runsaasti materiaalia. Millään tutkijapolvella ei ole ollut yhtä paljon lähteitä menneisyydestä tehtävien päätelmien tueksi kuin meillä. Aineistojen digitoiminen on tuonut ulottuvillemme ylivertaiset mahdollisuudet tiedon sirpaleitten yhdistelyyn ja suuren kokonaiskuvan luomiseen.

Mahdollisuuksien mukana tulevat haasteet: historiallisen aineiston valtava kirjo ja määrä vaativat uudenlaisia työkaluja. Lähteitä on liian paljon, jotta niistä voisi muodostaa selvää kokonaiskuvaa. Vuosituhansia hyvin toimineet, perinteiset kynän ja paperin menetelmät ja nojautuminen vain ihmisaivojen yhdistelykykyyn eivät enää riitä.

Aineistojen digitoiminen on tuonut ulottuvillemme ylivertaiset mahdollisuudet tiedon sirpaleitten yhdistelyyn ja suuren kokonaiskuvan luomiseen.

Otetaan esimerkki Suomen kirkkohistorian alkuhämäristä. Suomen kirjallisuuden vanhin juuri, latinankielinen Pyhän Henrikin legenda kirjoitettiin 1200-luvun lopun Turussa. Se on muokannut suomalaisten historiallista identiteettiä vuosisadasta toiseen. Teoksen kehitys-, leviämis- ja vaikutushistorian tuntemus edellyttää tekstin kaikkien toisintojen vertailua. Ihannetapauksessa ne voidaan jäsentää kehitystä ja vaikutusta kuvaavaksi sukupuuksi. Tutkimuksen mekaniikka on tunnettu jo antiikin ajoista lähtien: perehtymällä tekstiversioitten yhtäläisyyksiin ja eroihin on teoriassa mahdollista päätellä, mikä toisinto polveutuu mistäkin. Lähestymistapaa kutsutaan tekstikritiikiksi.

Pyhän Henrikin legenda tunnetaan 56 versiona. Määrä ei ehkä äkkiseltään kuulosta suurelta, mutta se on – valtava. Vain 56 toisinnosta voidaan rakentaa 710 998 587 804 863 451 854 045 647 463 724 949 736 497 978 881 168 458 687 447 040 000 000 000 000 erilaista sukupuuta. Luku vastaa suunnilleen arviota maailmankaikkeuden atomien määrästä. Todennäköisyys osua oikeaan ratkaisuun käyttämällä vain perinteisiä metodeja on mikroskooppinen.

Avuksi evoluutiobiologia

Mikä siis avuksi? Tietokoneet ja niiden ihmisaivoja huimasti suurempi laskennallinen kapasiteetti. Humanistiset tieteet, kuten teologian eri alat, ovat käyttäneet tietokoneita tutkimuksen apuna 1900-luvun puolivälistä lähtien.

Yksi merkkipaalu tietokoneavusteisessa tutkimuksessa oli filologi Peter Robinsonin ja evoluutiobiologi Robert O’Haran tutkimus vuonna 1991. Herrat perehtyivät muinaisnorjalaisen Svipdagsmál-runoelman toisintoihin ja sovelsivat filologiseen tutkimukseen evoluutiobiologian menetelmiä, jotka nojasivat jo tuolloin tietokoneisiin ja algoritmeihin. Tulokset olivat mullistavia: kun aineisto oli koodattu O’Haran käyttämän PAUP-ohjelman hyväksymään muotoon, O’Hara sai muutamassa sekunnissa samat tulokset, joiden saavuttamiseen Robinsonilta oli mennyt useita kuukausia.

Robinsonin ja O’Haran kantava ajatus oli, että samalla tavoin kuin eliöt ja lajit muuttuvat geenien mutatoituessa, myös tekstit muuttuvat niiden sisältämien sanojen ja kirjainten muuntuessa. Etenkin keskiaikaisessa kirjallisessa kulttuurissa, jossa tekstit kopioitiin käsin, niiden sisältö vaihteli yhtä hyvin kopioitsijoitten tahattomien virheitten kuin tietoisten muutosten seurauksena.

Robinsonin ja O’Haran kantava ajatus oli, että samalla tavoin kuin eliöt ja lajit muuttuvat geenien mutatoituessa, myös tekstit muuttuvat niiden sisältämien sanojen ja kirjainten muuntuessa. Etenkin keskiaikaisessa kirjallisessa kulttuurissa, jossa tekstit kopioitiin käsin, niiden sisältö vaihteli yhtä hyvin kopioitsijoitten tahattomien virheitten kuin tietoisten muutosten seurauksena. Tutkijoitten soveltama fylogeneettinen menetelmä arvioi geenisekvenssien yhtäläisyyksien ja erojen pohjalta eliöitten perimän suhteellisia etäisyyksiä. Lähestymistapa sopi hämmästyttävän hyvin myös saman tekstin eri versioitten välisten suhteitten tutkimukseen.

Metodin lainaaminen ihmistieteisiin suoraan toiselta tieteenalalta osoittautui toimivaksi, mutta tutkijat ovat vuosien mittaan kehittäneet myös uusia apuvälineitä juuri tekstien tutkimukseen. Yhtä ääripäätä edustaa Philipp Roellin ja Dieter Bachmannin Leitfehler-based method, joka automatisoi perinteisen, jo vuosituhansia käytetyn tekstikriittisen menetelmän. Toisessa metodien kehittelyn ääripäässä on Teemu Roosin ja Tuomas Heikkilän RHM-algoritmi. Se nojautuu samoihin tiedoston pakkausalgoritmeihin, joita käytät päivittäin lähettäessäsi sähköposteja tai tekstiviestejä.

Kun aitojen historiallisten tekstiaineistojen tutkimuksessa erilaisia sukupuuvaihtoehtoja on lähes loputtomasti, miten voi tietää, mikä tietokoneavusteinen työkalu toimii parhaiten? Apuna on käytetty keinotekoisia, etukäteen käsikirjoitettuja aineistoja. Kun niiden oikea vastaus tiedetään, voidaan arvioida, kuinka hyvin eri menetelmät suoriutuvat sen tutkimuksesta. Vertailujen tuloksena on havaittu, että tekstien tutkimuksessa luotettavimmat nykyisin käytössä olevat tutkimuksen työkalut ovat RHM ja – edelleen – PAUP. Edellisen etuna on kuitenkin, että se ei edellytä tutkittavan tekstin vaivalloista ja virhealtista koodaamista.

Kulttuurievoluutio ja fylomemetiikka

Fylogeneettiset menetelmät ovat kuuluneet jo pitkään edistyksellisen tekstintutkijan työkalupakkiin. Hieman yli vuosikymmen sitten oivallettiin, että samaa analogiaa käyttäen fylogenetiikalla – biologisen evoluution tutkimuksella – olisi runsaasti annettavaa myös silloin, kun tutkitaan kulttuurin, esineitttten ja instituutioitten muutosta historiassa. Kulttuurievoluution tutkimuksessa monitieteiselle lähestymistavalle on nyttemmin vakiintunut oma nimi: fylomemetiikka. Kyse ei siis ole enää geenien välisten yhteyksien tutkimuksesta – vaan meemeistä, kulttuurisista piirteistä.

Fylomemetiikan menetelmiä on käytetty erityisellä innolla kielten tutkimuksessa. Mahdollisuuksien loputonta kirjoa kuvaavasti fylomemetiikkaa on sovellettu menestyksellä myös esimerkiksi persialaisten mattojen, soitinten, juomasekoitusten, tanssien ja musiikin kehityksen tutkimuksessa. Suomessa lähestymistapaa on käytetty vaikkapa keskiaikaisten kalenterien sekä eri versioina suullisesti välittyneen keskiaikaisen kansanrunon, Piispa Henrikin surmavirren tutkimukseen.

Kenties eniten huomiota uuden aallon kulttuurievoluutiotutkimuksessa on herättänyt Jamshid Tehranin artikkeli, jossa hän perehtyi kansainvälisen Punahilkka-sadun 58 eri versioon ympäri maailmaa. Vaikka tarinan pahis on Länsi-Euroopassa susi, Intiassa tiikeri ja Afrikassa leopardi tai leijona, Tehranin onnistui eri versioitten yhtäläisyyksien pohjalta osoittaa yllättäviä kulttuuriyhteyksiä eri alueitten välillä.

Jamshid Tehran perehtyi kansainvälisen Punahilkka-sadun 58 eri versioon ympäri maailmaa. Vaikka tarinan pahis on Länsi-Euroopassa susi, Intiassa tiikeri ja Afrikassa leopardi tai leijona, Tehranin onnistui eri versioitten yhtäläisyyksien pohjalta osoittaa yllättäviä kulttuuriyhteyksiä eri alueitten välillä.

Esimerkit osoittavat, että täysin toiselta puolelta tieteenalojen laajaa kenttää lainattu metodologia toimii mainiosti humanistitutkijoitten käytössä. Sillä on runsaasti annettavaa kulttuurievoluution tutkimukselle. Asetelma alleviivaa monitieteisyyttä: vaikka tutkimuksen alla olevat aineistot ovat eri aloilla täysin erilaisia, kysymykset ja niihin vastaamisen keinot voivat olla hyvin samanlaisia.

Uudet menetelmät näkevät lähdemassojen sisällä yhteyksiä, joiden löytämiseen voisi perinteisin metodein kulua vuosia. Ne kuulevat aineiston heikot signaalit. Toisaalta tietokoneet ja algoritmit eivät ole millään tieteenalalla yleisavain, joka avaisi suoraan pääsyn oikeisiin vastauksiin. Ne antavat tutkijalle matemaattisesti perusteltuja hypoteeseja – eivät vastauksia. Ne ohjaavat usein oikeaan suuntaan ja auttavat kohti oikeaa ratkaisua, mutta eivät tee ihmistieteitten tutkimuksen perinteisiä hyveitä turhiksi.

Kirjoittaja

Linkit ja kirjallisuus

Halonen, Marko: “Aspects of Medieval Nordic Calendars. A Qualitative, Quantitative and Phylomemetic study.” Diss. Helsingin yliopisto, 2020.
Heikkilä, Tuomas & Roos, Teemu: “Quantitative Methods for the Analysis of Medieval Calendars.” Digital Scholarship in the Humanities 33.4 (2018): 766–787. https://doi.org/10.1093/llc/fqy007
Heikkilä, Tuomas: Sankt Henrikslegenden. Helsingfors & Stockholm: SLS & Atlantis, 2009.
Howe Christopher & Windram, Heather: “Phylomemetics—Evolutionary Analysis beyond the Gene.” PLoS Biol 9:e1001069 (2011).
Robinson, Peter & O’Hara, Robert: “Report on the textual criticism challenge 1991.” Bryn Mawr Classical Review 3.4 (1992): 331–337.
Roelli, Philipp, ed.: Handbook of Stemmatology: History, Methodology, Digital Approaches. Berlin: De Gruyter, 2020.
Roelli, Philipp & Bachmann, Dieter: “Towards generating a stemma of complicated manuscript traditions: Petrus Alfonsi’s Dialogus.” Revue d’histoire des Textes 5 (2010): 307–331. https://doi.org/10.1484/J.RHT.5.101260
Roos Teemu & Heikkilä Tuomas: “Evaluating methods for computer-assisted stemmatology using artificial benchmark data sets.” Literary and Linguistic Computing 24 (2009): 417–433. https://doi.org/10.1093/llc/fqp002
Tehrani Jamshid: “The Phylogeny of Little Red Riding Hood.” PLoS ONE 8(11): e78871 (2013). doi:10.1371/journal.pone.0078871