Az új „Kipoi” tároló javítja a gépi tanulási modellekhez való hozzáférést
Annak érdekében, hogy megtudjuk, mely gének felelősek olyan betegségekért, mint a rák vagy a cukorbetegség, a tudósok manapság gyakran gépi tanulási modelleket használnak.
Bár a gépi tanulási módszerek fontossága a genomkutatásban az elmúlt években folyamatosan nőtt, a kutatóknak gyakran elavult szoftvereket kellett igénybe venniük. A klinikai kutatásban részt vevő tudósok gyakran nem rendelkeztek hozzáféréssel a legújabb modellekhez. Ez viszont most megváltozik az új szabad, nyílt hozzáférésű tárolóval. A Kipoi lehetővé teszi a gépi tanulási modellek egyszerű cseréjét a genomkutatás területén. A tárolót Julien Gagneur, a TUM számítógépes biológia professzora segítette. Ő a Cambridge-i Egyetem, a Stanford Egyetem, az Európai Bioinformatikai Intézet (EMBL-EBI) és az Európai Molekuláris Biológiai Laboratórium (EMBL) kutatóival működött együtt.
A képzett modellek szabadon hozzáférhetők
A Kipoi különleges tulajdonsága, hogy ingyenes hozzáférést biztosít a már megtanult gépi tanulási modellekhez
– mondja Julien Gagneur.
A Kipoi-val nemcsak az adatok és a szoftverek megosztása, hanem a már releváns adatokkal kiképzett modellek és algoritmusok megosztása is lehetséges. Ezek a modellek készen állnak a használatra, mert már az adatokkal kapcsolatos nehézkes munka kész
– mondja Anshul Kundaje, a Stanford-i egyetemi docens.
Jelenleg több mint 2000 képzett modell szabadon hozzáférhető a Kipoi-nál. Egy nemrégiben, a Nature Biotechnology-ban megjelent tanulmányban a kutatók azt mutatják, hogy az új tároló felgyorsítja a genomikai közösség információ cseréjét és ezáltal előmozdítja a genomkutatást.
Gyors algoritmusok és könnyű kezelés
Mivel a Kipoi egyszerűsíti a már képzett modellekhez való hozzáférést, a kutatók transzfer tanulást végezhetnek. Ez azt jelenti, hogy egy adott adatkészletben már kiképzett modell gyorsabban képes egy hasonló feladatot tanulni. A Kipoi egyszerűsíti az adatok tárolásának folyamatát az ott tárolt modellekbe. A szabványosított fájlformátumok és szoftverkeretek három egyszerű parancsra csökkenti a modell telepítését és végrehajtását. Azok, akik korábban nem rendelkeztek tapasztalattal a gépi tanulásban, így könnyen használhatják a tárolót.
Az egyes genomok megértése
Mivel a Kipoi a genotípust és a fenotípust összekapcsoló modellekre irányul, az új platform megkönnyíti a betegségek genetikai okainak azonosítását.
A Kipoi a legújabb mély tanulási modelleket a klinikai kutatók jegyzetei körében hatalmas genomikai adatokkal képezi. Ez nagyon izgalmas lehetőséget kínál az egyes genomok megértésére, például a betegségeket okozó genetikai variánsok pontos meghatározására vagy a tumorokban előforduló mutációk értelmezésére.
– mondja Julien Gagneur.
A platform genomikai kutatáshoz való hozzájárulásának mértéke azonban a genomikai közösségtől is függ.
Reméljük, hogy a jövőben több kutató hozza modelljeit a tárolóba. Ez az egyetlen módja annak, hogy a genomikai elemzést hozzáférhetővé tegyük, és végül szélesebb körű prediktív gépi tanulási eszközöket kapjunk a genomikai közösség számára.
– mondja Oliver Stegle, az EMBL-EBI csapatvezetője.
Forrás: Technical University of Munich (TUM), May 29, 2019