Uusi Coralysis-työkalu tehostaa suurten yksisoluaineistojen luokittelua

Turun yliopiston biotiedekeskuksen InFLAMES-tutkijat ovat kehittäneet uuden laskennallisen menetelmän monimutkaisten soluaineistojen tulkitsemiseen. Coralysis-niminen menetelmä auttaa tutkijoita tunnistamaan ja ryhmittelemään näytteiden solutyyppejä. 

Ihmiskehossa on noin 37 biljoonaa solua. Osa muistuttaa toisiaan, mutta solut eivät silti ole koskaan täysin samanlaisia. Tätä solujen monimuotoisuutta voidaan analysoida nykyaikaisilla yksisolumenetelmillä. Niissä yhdestä solusta mitataan kymmeniä tai tuhansia molekyylejä kerrallaan ja saadusta tiedosta voidaan tehdä päätelmiä sekä terveistä että sairaista kudoksista.

Pieni määrä verta sisältää miljardeja punasoluja ja miljoonia immuunisoluja. Jokaisella solutyypillä on oma molekyylinen ‘sormenjälkensä’, jonka tutkijat voivat tunnistaa yhdistämällä yksisolutekniikoita laskennallisiin menetelmiin.

Tutkiessaan monia erilaisia näytteitä tutkijoiden on kuitenkin ensin ryhmiteltävä yhteen eri näytteiden samat solutyypit. Tämä on vaihe, jota kutsutaan datan integroinniksi.

Havainnekuva, joka näyttää eron yksisoludatan analysoinnissa ilman integraatiota tai integraation kanssa.

Nykyisille integrointimenetelmille voi kuitenkin tulla virheitä, kun solutyypit vaihtelevat näytteiden välillä tai esiintyvät hyvin erilaisina määrinä. Tällaisissa niin sanotuissa epätasapainoisissa tilanteissa menetelmät voivat erehtyä ja yhdistää eri solutyyppejä väärin.

Turun yliopiston tutkijat ovat kehittäneet menetelmän, joka integroi tehokkaasti ja luotettavasti aineistot eri näytteistä. Coralysis-nimen saanut menetelmä on kehitetty Turun biotiedekeskuksessa, InFLAMES-ryhmänjohtaja, professori Laura Elon tutkimusryhmässä.

– Yksisolumenetelmillä voimme tutkia solujen uskomatonta monimuotoisuutta, mutta solujen vertailu eri näytteiden välillä on hankalaa. Tämä motivoi meitä kehittämään menetelmän, jolla nämä piilevät ominaisuudet voidaan paljastaa luotettavasti, kertoo dosentti Sini Junttila, yksi tutkimuksen ohjaajista.

Tehokas työkalu vapaaseen käyttöön

– Meitä inspiroivat palapelit. Niiden kokoaminen aloitetaan ryhmittelemällä palat esimerkiksi värin ja tummuusasteen mukaan, ennen kuin katsomme palojen muotoja ja kuvioita. Vastaavasti algoritmimme yhdistää solut asteittain useiden määrittelykierrosten kautta, selittää Coralysiksen pääkehittäjä, väitöskirjatutkija António Sousa.

Coralysis on avoimen lähdekoodin ohjelma ja perustuu koneoppimiseen. Se rakentaa malleja, joita voidaan käyttää näytteen solutyyppien ennustamiseen ja jopa ennusteiden luotettavuuden arviointiin. Tämä auttaa tutkijoita välttämään työlästä ja usein epäluotettavaa vaihetta, jossa solutyypit tunnistetaan manuaalisesti alusta alkaen. Toinen Coralysiksen ainutlaatuinen ominaisuus on, että se havaitsee solujen eri kehitysvaiheet, jotka muuten saattaisivat jäädä huomaamatta.

– Coralysis-projektin tavoitteena on tarjota tiedeyhteisölle tehokas työkalu, jolla voidaan paljastaa solujen piileviä monimuotoisuuksia sekä ymmärtää paremmin monimutkaisia yksisoluaineistoja. Julkaisemalla tulokset ja työkalun avoimesti, toivomme voivamme tukea yhteistyötä ja nopeuttaa löytöjä maailmanlaajuisessa tutkimusyhteisössä, kertoo projektin päätutkija professori Laura Elo.

Elon ryhmän tutkimustulokset on julkaistu Nucleic Acids Research -tiedelehdessä.

Lue tiedeartikkeli Coralysis enables sensitive identification of imbalanced cell types and states in single-cell data via multi-level integration