We are searching data for your request:
Upon completion, a link will appear to access the found materials.
Norėčiau išspręsti kai kurias biologines problemas, kurios pagerintų biologijos ar bioinformatikos modernumą. Visų pirma noriu pritaikyti mašininį mokymąsi šviesos mikroskopiniuose vaizduose. Turiu įrangą ir patirtį:
- Šviesaus lauko, tamsaus lauko ir fazinio kontrasto mikroskopija
- Šiuolaikinis nešiojamas kompiuteris
- 56 branduolių superkompiuteris su >100 GB atminties (pagal pageidavimą)
- Sudėtingos žinios apie mašininio mokymosi algoritmus ir signalų apdorojimą
- Doktorantūros lygio mokslinio tyrimo įgūdžiai
- Programavimo įgūdžiai, kurie leistų man dirbti Google
- Ribotos žinios apie biologiją, bioinformatiką ir mikroskopiją (kol kas)
Noriu atlikti kai kuriuos publikuojamus tyrimus be jokių akademinių rūpesčių. Tai darysiu tik savo laiku, neskubėdamas skelbti, bandydamas ką nors padaryti gerai žmonijai. Kas du mėnesius projektui galiu išleisti kelis šimtus dolerių (arba apie 1000 USD per metus).
Didžioji dalis biologinių tyrimų, paskelbtų m Mokslas, Gamta, PNAS, Ląstelėir tt yra tokie specializuoti, kad man sunku aptikti svarbias problemas, kurias galėčiau išspręsti atsižvelgiant į mano įgūdžių rinkinį. Taigi prašau jūsų pagalbos:
- Kokios programinės įrangos visada norėjote atlikti šviesos mikroskopinius tyrimus, bet nežinojote, kaip sukurti?
- Kokias svarbias biologines problemas norėtumėte išspręsti? (Mašinų mokymuisi problemos, susijusios su dvejetainio sprendimo užduotimi, yra ypač tinkamos, pvz., „ar šis asmuo serga maliarija, ar ne“?)
- Kokios yra naujausios aukštos kokybės apžvalgos apie atviras biologijos problemas?
- Kažkas kito?
Nors mano klausimas yra šiek tiek platus, manau, kad tai susiję su „gerų ketinimų“ (ar kaip tai vadinama) SE politika.
Žinau, kad šis klausimas bus baigtas. Bet jei norite ką nors dirbti, galite dirbti:
Krio itin didelės raiškos fluorescencinis vaizdas
Pabrėžia
- CryoFM leidžia vaizduoti stiklintus biologinius mėginius naudojant fluorescencinę mikroskopiją.
- Norint pasiekti didelės raiškos krioFM vaizdą, kyla didelių iššūkių.
- Fluoroforo charakteristikos žemoje temperatūroje suteikia papildomų pranašumų.
- Krio itin didelės skiriamosios gebos fluorescencinis vaizdas žymiai pagerins skiriamąją gebą.
Šaltinis: Fluorescencinė krio-mikroskopija: dabartiniai iššūkiai ir perspektyvos.
RE: Kokios programinės įrangos visada norėjote atlikti šviesos mikroskopinius tyrimus, bet nežinojote, kaip sukurti?
Aš tyrinėju vaisines muses ir šioje srityje (ir daugelyje kitų vabzdžių ekologijos modelių sistemų, tokių kaip vabalai, kandys, drugeliai) naudojame daug vizualiai įvertintų duomenų, pvz. kūno dydis, sparnų dydis, sparnų morfologija, akių spalvos, šerių skaičius, genitalijų morfologija, sekso šukų morfologija... sąrašas didžiulis! Viena iš naudojamų programų yra WingMachine (nors atrodo, kad nuoroda į programinę įrangą nutrūko), kuri gali išmatuoti musės sparno morfologinius aspektus.
Kažkas, ką norėčiau padaryti, tai įdėti maisto buteliuką į apačią ir greitai suskaičiuoti kiaušinių skaičių ant maisto paviršiaus. Seniai uždaviau klausimą apie tai... Tai būtų labai naudinga, daugelis laboratorijų turi skaičiuoti kiaušinius (kad kiekviename buteliuke kiaušinių skaičius būtų pastovus, svyravimai gali turėti rimtų padarinių suaugusiai musei, todėl kontrolė yra svarbi ekologijoje tyrimai) ir tai lėtas, sunkus ir labai netikslus, ypač įvairus tarp žmonių. Būtų puiku, jei būtų koks nors būdas įdėti buteliuką po objektyvu, paspausti mygtuką ir apskaičiuoti apytikslį skaičių!
Kolega šiuo metu skaičiuoja nugaišusius vabalus, tikiu, kad jam patiktų panaši programa, kurioje galėtų atvaizduoti ir automatiškai skaičiuoti programinę įrangą. Manau, kad abi šias problemas būtų nesunku išspręsti naudojant labai panašią programinę įrangą. Svarbiausia yra sukurti programinę įrangą, kurią būtų lengva „išmokyti“ atpažinti asmenis.
Šiek tiek sudėtingesnis mašininio mokymosi būdas gali būti priversti jį suskaičiuoti skirtingus fenotipus viename vaizde. Atliekant musių tinkamumo tyrimus, dažnai naudojama laukinio tipo musė su tamsaus kūno (juodmedžio) konkurentais, laukinio tipo kūnas yra palyginti geltonesnis. Židininio laukinio tipo muselės tinkamumas tada yra laukinio tipo palikuonių skaičius tarp visų (tamsiojo kūno fenotipas yra recesyvinis, todėl židinio laukinio tipo poruojantis su juodmedžiu jis gamina laukinio tipo muses, jei poruojasi du juodmedžiai, gauname tamsaus kūno palikuonis). Čia mašina turėtų sugebėti pasakyti skirtumą ir suskaičiuoti abu.
Vėliau pridėsiu tinkamą nuotrauką iš po taikiklio, nuotrauka mano ankstesniame klausime buvo daryta su skaitmeniniu fotoaparatu, o ne per taikiklį, bet ji leidžia suprasti, kaip ji atrodo.
Galbūt jus domina straipsnis „Mašininis mokymasis ląstelių biologijoje – kompiuterių mokymas atpažinti fenotipus“ (http://jcs.biologists.org/content/126/24/5529.long)
Vienas iš mano kolegų atlieka daug histologinio darbo, dažydamas ir identifikuodamas audinius mikroskopiniu lygiu. Programinė įranga, kuri gali būti naudinga šiai disciplinai, gali būti gebėjimas atskirti skirtingus esamų audinių tipus ir galbūt apskaičiuoti kiekvieno audinio tipo užimamą „plotą“, taip pat tuščią erdvę. Tai nepanašu į GIS tipo problemą, bet nežinau, ar ji gerai dera su Taip/Ne dvejetainių sprendimų sistema. Nežinau, ar jį būtų galima išmokyti atpažinti konkrečius audinių tipus, bet galbūt jis galėtų atpažinti kiekvieną atskirą skerspjūvio sritį, kuri skiriasi nuo kitų tokių sričių. Štai keletas skerspjūvių, kurie parodytų, ką aš turiu omenyje:
Dvitaškis:
Šaltinis
Lygiųjų raumenų:
Šaltinis
Sėklidžių sėklidės kanalėliai:
Šaltinis
Atkreipkite dėmesį į skirtingus audinių tipus kiekviename skerspjūvyje ir baltą erdvę. Kiekvienas audinių tipas turi skirtingus šviesos perdavimo modelius, todėl kompiuteris gali išmokti atskirti skirtingus audinių tipus.
Mašininio mokymosi vadovas pradedantiesiems
Ar turėčiau mokytis dabar... ar vėliau? Mokymasis yra universalus įgūdis/savybė, kurią įgyja bet kuris gyvas organizmas šioje planetoje. Mokymasis apibrėžiamas: žinių ar įgūdžių įgijimas per patirtį, studijas ar mokantis. Nesvarbu, ar tai būtų augalas, mokantis reaguoti į šviesą ir temperatūrą, beždžionė, besimokanti nulupti bananą, ar mes, žmonės, mokantys važiuoti dviračiu. Šis bendrumas daro mus unikalius ir laikui bėgant tobulėja.
Bet kas būtų, jei sakyčiau: „Mašinos taip pat gali mokytis“
Esame amžiuje, kai mašinos nesiskiria. Mašininis mokymasis vis dar yra gana nauja koncepcija. Mes galime išmokyti mašinas mokytis, o kai kurios mašinos gali mokytis net pačios. Tai magiškas reiškinys vadinamas Mašininis mokymasis.
Tikslinė auditorija: pradedantiesiems ir (arba) besimokantiems šviežio kraujo
Tikimės, kad šis straipsnis suteiks naudingų įžvalgų ir atvers mintis, ką kompiuteriai gali padaryti dabar. Aš nesigilinsiu į tai, kas yra mašininis mokymasis, o tik aukšto lygio apžvalga.
Jei yra kas nors tokio tu turėtų MOKYTIS perskaičius šį straipsnį, tai yra:
Mašinos gali numatyti ateitį, jei tik ateitis pernelyg nesiskiria nuo praeities.
Gilus mokymasis išmaniajai mikroskopijai
Šimtus metų mes naudojome mikroskopus naujiems reiškiniams atrasti. Dėl skaitmeninio vaizdo jutiklio ir kompiuterio didžioji šio atradimo darbo dalis dabar tapo automatizuota. Įvairūs „gilaus“ mašininio mokymosi algoritmai dabar automatiškai apdoroja skaitmeninio mikroskopo vaizdus, kad surastų, klasifikuotų ir interpretuotų atitinkamus reiškinius, pvz., ligos požymius, tam tikrų ląstelių buvimą tyrime ar net visiškai automatizuotą diagnozę.
Nepaisant jų automatizavimo, patys mikroskopai vis dar palyginti nedaug pasikeitė – dažniausiai jie vis dar yra optimizuoti, kad žmogus, žiūrintis žmogus, galėtų išsamiai išnagrinėti mėginį, o tai kelia daugybę iššūkių klinikoje. Maliarijos parazito infekcijos diagnozė yra geras pavyzdys. Dėl mažo dydžio (maždaug 1 mikronas ar mažesnis) maliarijos parazitas (P. Falciparum) turi būti stebimas po didelės raiškos objektyvu (paprastai su panardinimu į aliejų). Deja, tokie didelės raiškos lęšiai gali matyti tik labai mažą plotą, kuriame yra vos kelios dešimtys ląstelių. Kadangi maliarijos parazito infekcijos tankis yra palyginti mažas, reikia nuskaityti mažiausiai 100 unikalių matymo laukų, kad būtų galima rasti pakankamai pavyzdžių, kad būtų galima atlikti patikimą diagnozę. Tai tiesa, jei žmogus arba algoritmas peržiūri kiekvieno mėginio vaizdus – vis tiek reikia šimtų vaizdų, o tai lemia kliūtis diagnozės sistemoje.
Kompiuterinės optikos laboratorija šiuo metu sprendžia tokias problemas kaip aukščiau, kurdama naujus mikroskopus, kurie yra suprojektuotas gilaus mokymosi algoritmus, kad užtikrintų, jog jų užfiksuotuose vaizdo duomenyse būtų didžiausias informacijos kiekis konkrečiai algoritmo užduočiai. Tai bendras aparatinės ir programinės įrangos optimizavimo darbas. Tiesą sakant, tikimės paversti mikroskopą „protingu“ agentu, kurio tikslas yra fiziškai ištirti kiekvieną egzempliorių, kad kompiuteris galėtų iš jo išmokti kuo daugiau. Įvairūs optimizuojami aparatinės įrangos komponentai, kuriuos mūsų laboratorija turi arba šiuo metu tiria, apima programuojamą apšvietimą, optinį kelią ir detektorių bei duomenų valdymo vamzdyną. Štai keletas mūsų dabartinių projektų, susijusių su šiomis „išmokto jutimo“ pastangomis:
3. Išmoktas jutimas skirtingų mikroskopo komponentų jungtinei optimizavimui
Susiję dokumentai:
Projekto puslapis su duomenimis ir šaltinio kodu: https://deepimaging.io/projects/me-microscope/
Šiame darbe mes tiriame metodą, kaip kartu optimizuoti kelis mikroskopo nustatymus kartu su klasifikavimo tinklu, kad būtų pagerintos automatinės vaizdo analizės užduotys. Mes tiriame programuojamo apšvietimo optimizavimo ir vyzdžio perdavimo sąveiką, naudodami eksperimentiškai atvaizduotus kraujo tepinėlius automatiniam maliarijos parazitų aptikimui, kad parodytume, jog kelių elementų „išmoktas jutimas“ pranoksta vieno elemento atitikmenį. Tinklo mažos skyros mikroskopo vaizdai (palyginami su 20 kartų), nors ir nebūtinai idealūs žmogaus interpretacijai, suteikia mašininio mokymosi tinklą pakankamai kontrasto, kad atitiktų atitinkamų didelės raiškos vaizdų (100 kartų palyginamų) klasifikavimo našumą, o tai rodo kelią į tikslius. automatizavimas dideliuose matymo laukuose.
2. Išmoktas jutimas optimizuotam mikroskopo apšvietimui
Susiję dokumentai:
Projekto puslapis su duomenimis ir šaltinio kodu: http://deepimaging.io/learned_sensing_dnn/
Siekdami žymiai pagerinti ligos diagnostikos šviesos mikroskopu greitį ir tikslumą, atlikome du pagrindinius standartinio mikroskopo pakeitimus: 1) pridėjome mikro-LED įrenginį, kuris optimizuotas apšviesti kiekvieną mėginį, kad būtų paryškintos svarbios ypatybės (pvz., maliarijos parazitas kraujo tepinėliuose) ir 2) mes panaudojome gilų konvoliucinį neuronų tinklą, kad kartu optimizuotume šį apšvietimo įrenginį, kad automatiškai aptiktų infekciją unikaliai apšviestuose vaizduose.
Dirbdami kartu, mūsų dvi įžvalgos leidžia pasiekti klasifikavimo tikslumą 95 procentilių diapazone, naudojant didelio matymo lauko, mažos skiriamosios gebos mikroskopo objektyvus, kurie gali matyti tūkstančius ląstelių vienu metu (o ne tik dešimtis ląstelių). Tai pašalina mechaninio nuskaitymo poreikį, kad būtų galima nustatyti tikslią diagnozę, todėl dabartinis diagnostikos vamzdynas žymiai pagreitėja (t. y. nuo 10 minučių rankiniu būdu tikrinant iki kelių sekundžių atliekant automatinį patikrinimą).
1. Adaptyviai išmoktas apšvietimas optimaliam mėginių klasifikavimui
Aukščiau aprašytas „Learned Sensing“ metodas naudoja konvoliucinį neuroninį tinklą optimizuotiems aparatinės įrangos parametrams nustatyti. Čia aparatinės įrangos optimizavimą pavertėme dinamišku procesu, kurio metu siekiame išmokyti mikroskopą, kaip bendrauti su pavyzdžiu, nes jis užfiksuoja kelis vaizdus. Norėdami tai padaryti, panaudojome pastiprinimo mokymosi algoritmą, kuris mikroskopą traktuoja kaip agentą, galintį priimti dinamiškus sprendimus (kaip toliau apšviesti mėginį? Kaip pakeisti mėginio padėtį? Kaip filtruoti susidariusią išsklaidytą šviesą). ?) skrydžio metu vaizdo fiksavimo proceso metu.
Biologinių problemų skaičiavimo sprendimai
Xin Gao (kairėje) dažnai bendradarbiauja su struktūros biologu Stefanu Aroldu. Jų naujausias projektas paskatino skaičiavimo vamzdyną, kuris gali padėti farmacijos įmonėms atrasti naujus baltymų tikslus esamiems patvirtintiems vaistams. Kreditas: KAUSTMokslinių tyrimų rezultatų kūrimas, turintis skaičiavimo naujumą ir indėlį, taip pat biologinę svarbą ir poveikį, yra pagrindinis kompiuterių mokslininko Xin Gao motyvatorius. Jo grupė KAUST neseniai patyrė sprogimą savo leidiniuose. Nuo 2018 m. sausio 1 d. jie parengė 27 straipsnius, iš kurių 11 buvo paskelbti trijuose geriausiuose skaičiavimo biologijos žurnaluose ir septyni pristatyti geriausiose dirbtinio intelekto ir bioinformatikos konferencijose.
Gao, kilęs iš Kinijos, prisijungė prie KAUST 2010 m. po darbo Vaterlo universitete Kanadoje ir prestižinės stipendijos Carnegie Mellon universitete JAV. Jo grupė glaudžiai bendradarbiauja su eksperimentuojančiais mokslininkais, kad sukurtų naujus skaičiavimo metodus, skirtus pagrindinėms atviroms biologijos ir medicinos problemoms spręsti. , paaiškina jis. "Mes dirbame kurdami skaičiavimo modelius, kurdami mašininio mokymosi metodus ir kurdami efektyvius bei efektyvius algoritmus. Mūsų dėmesys svyruoja nuo baltymų aminorūgščių sekų analizės iki jų 3-D struktūrų nustatymo iki jų funkcijų anotavimo ir jų elgesio supratimo bei kontrolės sudėtingose biologinėse srityse. tinklų“, – sako jis.
Trečdalį savo laboratorijos tyrimų Gao apibūdina kaip metodologiją, kur grupė kuria teorijas ir kuria algoritmus bei mašininio mokymosi metodus. Kitus du trečdalius lemia problemos ir duomenys. Vienas iš jo metodologija pagrįstų tyrimų pavyzdžių yra darbas1 tobulinant neneigiamą matricos faktorizavimą (NMF), dimensijų mažinimo ir duomenų vaizdavimo įrankį, sudarytą iš algoritmų grupės, kuri išskaido sudėtingą duomenų rinkinį, išreikštą matricos forma.
NMF naudojamas analizuoti mėginius, kuriuose yra daug funkcijų, kurios gali būti ne visos svarbios tyrimo tikslais. Jis suskaido duomenis, kad būtų rodomi modeliai, galintys parodyti svarbą. Gao komanda patobulino NMF, sukurdama maksimalaus atstumo NMF (MMDNMF), kuris apima labai didelį duomenų kiekį, kad būtų galima paryškinti aukšto lygio savybes, kurios efektyviau apibūdina pavyzdį.
Siekdama parodyti savo požiūrį, Gao komanda pritaikė techniką žmonių veidams, naudodama 11 skirtingų išraiškų žmonių atvaizdus. Kiekvienas vaizdas buvo traktuojamas kaip pavyzdys su 1024 funkcijomis. Išmokęs MMDNMF gauti duomenis, atspindinčius kiekvieno veido bruožus, jis galėtų tiksliau priskirti bet kokį nespalvotą veido vaizdą, nei būtų galima padaryti naudojant tradicinį NMF.
Biologijos Pandoros skrynios atidarymas
Gao daug sėkmingai bendradarbiauja su KAUST tyrėjais, tačiau, jo teigimu, vienas sėkmingiausių bendradarbiauja su struktūros biologu Stefanu Aroldu.
Kartu jie dirbo prie kelių projektų, įskaitant vieną, dėl kurio buvo sukurtas skaičiavimo vamzdynas, kuris gali padėti farmacijos įmonėms atrasti naujus esamų patvirtintų vaistų baltymų taikinius.
"Narkotikų perkėlimas yra komerciškai ir moksliškai vertingas", - aiškina Gao. "Tai gali sutrumpinti vaistų kūrimo laiką nuo dvidešimties iki 6 metų, o išlaidas – nuo maždaug 2 milijardų JAV dolerių iki 300 milijonų JAV dolerių. JAV Nacionaliniai sveikatos institutai apskaičiavo, kad 70 procentų rinkoje esančių vaistų gali būti pakeista naudoti kitoms ligoms gydyti.
Gao išsiaiškino, kad vaistų pozicijos keitimo metodai susiduria su keliais iššūkiais: jie remiasi labai ribotu informacijos kiekiu ir dažniausiai sutelkia dėmesį į vieną vaistą ar ligą, todėl gaunami rezultatai, kurie nėra statistiškai reikšmingi.
Tačiau Gao skaičiavimo vamzdynas gali integruoti kelis informacijos apie esamus vaistus ir jų žinomus baltymų taikinius šaltinius, kad padėtų mokslininkams atrasti naujus taikinius.
Modelis buvo išbandytas dėl jo gebėjimo numatyti daugelio vaistų ir mažų molekulių taikinius, įskaitant žinomą metabolitą organizme, vadinamą kofermentu A (CoA), kuris yra svarbus daugelyje biologinių reakcijų, įskaitant riebalų rūgščių sintezę ir oksidaciją. Jis numatė 10 anksčiau nežinomų CoA baltymų taikinių. Gao pasirinko du geriausius: Aroldas ir jo kolegos išbandė, ar jie tikrai bendravo su CoA.
Bendradarbiavimas patvirtino Gao prognozes, o skaičiavimo vamzdynas dabar patentuojamas keliose šalyse. Galiausiai jis galėtų būti licencijuotas farmacijos įmonėms, kad jau patvirtintus vaistus būtų galima naudoti kitoms ligoms gydyti. Šis metodas taip pat gali padėti vaistų įmonėms suprasti vaistų toksiškumo ir šalutinio poveikio molekulinį pagrindą.
„Mūsų bendradarbiavimas yra toks sinergiškas, kad mūsų kompetencijos sritys užtikrina minimalų sutapimą, reikalingą suprasti vieniems kitus, nesukuriant pertekliškumo“, – sako Aroldas. "Jis pateikia skaičiavimo pusę, o aš - eksperimentinę. Mūsų pasauliai liečiasi, bet nesutampa. Mūsų diskusijos viena kitą papildo labai skatinančiu būdu, nesuklupdamos per daug semantinių kliūčių."
Kitas Gao ir Aroldo bendradarbiavimas apima elektroninės mikroskopijos būdu surinktų duomenų analizės tobulinimą. Aroldas paaiškina, kad nepaisant didelės elektroninės mikroskopijos aparatinės ir programinės įrangos pažangos, leidžiančios ją naudoti nustatant baltymų ir kitų biomolekulių 3D struktūras, jos duomenų analizę vis dar reikia tobulinti. Gao ir Aroldas kuria būdus, kaip sumažinti triukšmą ir taip pagerinti sudėtingų biomolekulinių dalelių elektroninių mikroskopinių vaizdų skiriamąją gebą.
Jie taip pat kuria procesus, kurie gali automatizuoti genetinių variantų interpretaciją ir sustiprinti funkcijų priskyrimo genams procesą. „Jei sutalpinsite mus į kambarį ilgiau nei 15 minučių, tikriausiai sugalvosime naują idėją! sako Aroldas.
Dabartinių technologijų tobulinimas
Kiti Gao komandos tyrimai apima skaičiavimo metodą, kuris gali imituoti genetinės sekos nustatymo technologiją, vadinamą Nanopore sekvenavimu. „Gao“ „DeepSimulator3“ gali įvertinti naujai sukurtą paskesnę programinę įrangą nanoporų sekos nustatymui. Tai taip pat gali sutaupyti laiko ir išteklių atliekant eksperimentinį modeliavimą, sumažinant tikrų eksperimentų poreikį.
Jo komanda taip pat neseniai sukūrė Gracob4 – metodą, naudojamą genetinei informacijai perskaityti ir nustatyti, kokius kelius mikroorganizmuose įjungia stresinės sąlygos, pvz., rūgštingumo ar temperatūros pokyčiai arba antibiotikų poveikis. Tai gali nustatyti genus, kurių nereikia normaliomis sąlygomis, bet būtinus, kai mikroorganizmas patiria stresą.
Maitinimo alkani algoritmai
„Broad“ ir kitur biologai vis dažniau naudoja mašininį mokymąsi, nes jis gali atpažinti subtilius duomenų modelius ir ryšius, kurių nepastebėjo įprasti įrankiai. Tyrėjai sukuria mašininio mokymosi modelį, mokydami jį duomenų rinkiniuose, leidžiančius sukurti statistinius duomenų ryšius ir naudoti tuos ryšius, kad prognozuotų, kai nauji duomenų rinkiniai sutrinka.
Šie algoritmai būna įvairių tipų. Prižiūrėtam mašininiam mokymuisi reikia duomenų rinkinių, kurie būtų anotuoti informacija, kuria kompiuteris pradės aptikti dominantį ryšį. Priešingai, neprižiūrimi mašininio mokymosi algoritmai siekia rasti nekontuotų duomenų modelius, neprašant nieko konkrečiai ieškoti.
Klasifikacija ir prognozavimas mikrobiologijoje
Mikrobų rūšių numatymas
Yra du pagrindiniai mikroorganizmų tipai (Maiden ir kt., 1998), vienas iš jų turi neląstelinę morfologiją (Yeom ir Javidi, 2006), pvz., virusai, o kitas su ląstelių morfologija, kurį galima suskirstyti į du tipus. iš jų yra prokariotai (Weinbauer, 2010), tokie kaip archėjos ir eubakterijos, ir kiti, būtent eukariotai (Nowrousian, 2010), tokie kaip grybai ir vienaląsčiai dumbliai. Skirtingi mikroorganizmai turi skirtingas savybes, todėl svarbu tinkamai identifikuoti mikroorganizmus. Yra du pagrindiniai mikroorganizmų nustatymo būdai. Viename iš jų nustatoma nežinomo mikroorganizmo rūšis, siekiant suskirstyti ją pagal domeną, karalystę, prieglobstį, klasę, tvarką, šeimos gentį ir rūšį. Kitu atveju tikslas yra nustatyti, ar nežinomas mikroorganizmas priklauso konkrečiai rūšiai, ar ne. Pavyzdžiui, galime nustatyti, ar nežinomas mikroorganizmas yra virusas, ar ne, o tiksliau – ar tai tam tikras virusas. Šiame skyriuje pristatysime naujausius tyrimus, kuriuose buvo naudojami mašininio mokymosi metodai mikroorganizmams prognozuoti.
Tyrime (Murali ir kt., 2018) autoriai suskirstė konkrečias mikroorganizmų rūšis naudodami IDTAXA, kurioje buvo naudojamos LearnTaxa ir IdTaxa funkcijos. Abi šios funkcijos yra dalis R paketo DECIPHER, kuris buvo išleistas pagal GPLv3 licenciją kaip Bioconductor dalis, kuri suteikia įrankius didelio našumo genominiams duomenims analizuoti ir suprasti. Funkcija LearnTaxa bando perklasifikuoti kiekvieną mokymo seką į pažymėtą taksoną, naudodama metodą, žinomą kaip medžio nusileidimas, kuris yra panašus į sprendimų medį, dažniausiai ML algoritmus. „IdTaxa“ kaip įvesties duomenis naudoja „LearnTaxa“ grąžintus objektus ir užklausų sekas. Ši sistema pateikia kiekvienos sekos klasifikavimo rezultatus taksonomine forma ir suteikia atitinkamą kiekvieno lygio patikimumą. Jei pasitikėjimas nepasiekia reikiamos vertės, tai rodo, kad klasifikacija negali būti tiksliai atlikta tame lygyje. Dėl IdTaxa klasifikacijos mikrobiologinių tyrimų metu gali būti padarytos skirtingos išvados. Nors klaidinga klasifikacija yra nedidelė, daugelis likusių klaidingų klasifikacijų gali atsirasti dėl pamatinės taksonomijos klaidų. Fiannaca ir kt. (2018) pristatė 16S trumpo skaitymo sekų nustatymo metodą, pagrįstą k- gilesnis ir gilus mokymasis. Remiantis jų rezultatais, šis metodas gali labai gerai klasifikuoti tiek 16S šautuvo (SG), tiek amplikono (AMP) duomenis.
Svarbu nustatyti specifines mikrobų sekas mišriuose metagenomikos mėginiuose. Šiuo metu genais pagrįsti panašumo metodai yra plačiai naudojami prokariotiniams ir šeimininkiniams organizmams klasifikuoti iš mišrių mėginių, tačiau šie metodai turi didelių trūkumų. Todėl buvo atlikta daug tyrimų, siekiant nustatyti geresnius specifinių mikroorganizmų identifikavimo metodus. Amgarten ir kt. (2018) pasiūlė įrankį, žinomą kaip MARVEL, skirtą prognozuoti dvigrandines DNR bakteriofagų sekas metagenomikoje. MARVEL naudoja RF metodą su mokymo duomenų rinkiniu, sudarytu iš 1 247 fagų ir 1 029 bakterijų genomų, ir bandymo duomenų rinkinį, kurį sudaro 335 bakterijos ir 177 fagų genomai. Autoriai pasiūlė šešis požymius fagams identifikuoti, tada naudojo atsitiktinius miškus, kad pasirinktų ypatybes, ir nustatė, kad trys požymiai suteikė daugiau informacijos (Grazziotin ir kt., 2017). Ren ir kt. (2017) sukūrė VirFinder, kuris yra ML metodas, pagrįstas k-mer virusų persidengiančių grupių identifikavimui, kad būtų išvengta genų panašumo paieškų. VirFinder treniruoja ML modelį per žinomas virusines ir nevirusines (prokariotinių šeimininkų) sekas, kad nustatytų viruso specifiškumą. k-daugiau dažnių. Modelis buvo apmokytas naudojant šeimininko ir viruso genomus iki 2014 m. sausio 1 d., o bandymų rinkinį sudarė sekos, gautos po 2014 m. sausio 1 d. VirSorter (Roux ir kt., 2015) pagrįstas įvairių tipų nuorodų priklausomybe ir atskaitos nepriklausomumu. mikrobų sekos duomenis viruso signalui nustatyti. Eksperimentiniai rezultatai parodė, kad VirSorter turi gerą našumą, ypač numatant virusų sekas už šeimininko genomo ribų.
Minėti metodai konkrečiai klasifikuoja mikroorganizmus pagal skirtingus poreikius. Kai norime sužinoti mikroorganizmų taksonomijos informaciją, galime pasinaudoti Murali ir kt. pasiūlytu metodu. (2018). Be to, MARVEL, VirSort ir VirFinder gali nustatyti tam tikrus mikroorganizmų tipus. Remiantis Amgarten ir kt. (2018), šių trijų metodų specifiškumas yra panašus, tačiau MARVEL turi geresnį prisiminimo (jautrumo) našumą. Aukščiau išvardytiems metodams įgyvendinti mes sudarėme medžiagą, kuri parodyta 1 lentelėje.
1 lentelė. Turimi duomenys ir medžiaga mikrobų rūšims prognozuoti.
Aplinkos ir šeimininko fenotipų numatymas
Sukūrus naujos kartos DNR ir didelio našumo sekos nustatymą, buvo sukurta nauja mikrobiologijos sritis. Pagrindinis šios srities tyrimas yra susieti mikrobų populiacijas su fenotipais ir ekologine aplinka, kuri gali suteikti palankią paramą ligų protrūkiams ir tiksliajai medicinai (Atlas ir Bartha, 1981). Gerai žinoma, kad kai kurie mikroorganizmai yra parazitiniai ir kad supanti aplinka bei ląstelės-šeimininkės daro didelę įtaką mikrobų populiacijai. Maistinių medžiagų prieinamumo ir aplinkos sąlygų skirtumai lemia mikrobų bendruomenių skirtumus (Moran, 2015). Kadangi mikroorganizmai gali keistis informacija su supančia aplinka ir šeimininko ląstelėmis, galime numatyti aplinkos ir šeimininko fenotipus, remdamiesi esamais mikroorganizmais (Xie ir kt., 2018). Tai suteikia išsamesnį aplinkos ir šeimininko supratimą, kad galėtume geriau naudoti aplinką ir apsaugoti šeimininką. Neseniai buvo atlikta daug tyrimų, siekiant numatyti aplinkos ir šeimininko fenotipus naudojant mikroorganizmus. Šiame skyriuje pristatome šiuos tyrimus.
Asgari ir kt. (2018) naudojo seklią subimties atvaizdavimą, pagrįstą k-mer ir gilus mokymasis, atsitiktiniai miškai ir SVM, kad būtų galima numatyti aplinkos ir šeimininko fenotipus iš 16S rRNR genų sekos, naudojant MicroPheno sistemą. Jie nustatė, kad sekli pavyzdžio reprezentacija pagrįsta k-mer yra pranašesnis už OTU pagal kūno vietos atpažinimą ir Krono ligos prognozę. Be to, gilaus mokymosi metodas yra geresnis nei RF ir SVM dideliems duomenų rinkiniams. Šis metodas gali ne tik pagerinti našumą, bet ir išvengti per didelio pritaikymo. Be to, tai gali sutrumpinti išankstinio apdorojimo laiką. Statkovas ir kt. (2013) naudojo OTU kaip įvesties funkciją ir apdorojo duomenis taip. Pirma, autoriai sekvenavo pradinę DNR, po to pašalino žmogaus DNR seką ir apibrėžė OTU pagal mikrobų seką. Tada jie kiekybiškai įvertino santykinį visų sekų, priklausančių kiekvienam OTU, gausą. Autoriai naudojo SVM, branduolio keteros regresiją, reguliariąją logistinę regresiją, Bajeso logistinę regresiją, KNN metodą, RF metodą ir tikimybinius neuroninius tinklus su skirtingais parametrais ir branduolio funkcijomis. Apskritai jie ištyrė 18 ML metodų. Be to, jie naudojo penkis funkcijų išgavimo būdus. Eksperimentiniai rezultatai atskleidė, kad RF, SVM, branduolio regresija ir Bajeso logika naudojant Laplacian ankstesnę regresiją užtikrino geresnį našumą. Remiantis jų tyrimais, žmogaus odos mikroorganizmai, surinkti iš daiktų, kurie buvo liesti, gali būti naudojami identifikuojant individą, iš kurio jie kilę. Šiame darbe autorius naudojo įvairius klasifikavimo ir matmenų mažinimo metodus, siekdamas ištirti kiekvieno metodo poveikį. Tai labai naudinga kitam darbui, kuriame pateikiamas išsamus palyginimas. Schmedes ir kt. (2018) naudojo mikrobų bendruomenę teismo ekspertizei nustatyti. Savo tyrime jie sukūrė hidSkinPlex – naują tikslinį sekos nustatymo metodą, naudojant odos mikrobiomų žymenis, sukurtus žmogaus identifikavimui. Teismo medicinoje svarbu įvertinti mirties laiką. Johnsonas ir kt. (2016) naudojo KNN regresiją, kad prognozuotų laiko intervalą po mirties, naudodamas duomenų rinkinius iš nosies ir ausų mėginių. Tai rodo, kad odos mikrobiota gali būti svarbi teismo mirties tyrimo priemonė. Tradiciškai jūrų biologinis monitoringas apima didelių bentoso bestuburių klasifikavimą ir morfologinį identifikavimą, o tai reikalauja daug laiko ir pinigų. Cordier ir kt. (2017) naudojo eDNA metabarkodavimą ir prižiūrimą ML, kad sukurtų galingą bentoso stebėjimo prognozavimo modelį. Moitinho-Silva ir kt. (2017), tyrė kempinių mikrobų florą ir jų HMA-LMA statusą, įrodė ML pritaikymą tiriant su šeimininku susijusius mikrobų bendruomenės modelius.
Dėl mikrobų bendruomenių specifikos galime geriau atpažinti aplinką ir šeimininką. Be to, galime spręsti apie esamas aplinkos sąlygas ir šeimininko išgyvenimo būklę pagal mikrobų bendruomenės egzistavimą. Mes apibendriname turimus duomenų rinkinius ir metodus, kurie parodyti 2 lentelėje.
2 lentelė. Turimi duomenys ir medžiaga aplinkos ir šeimininko fenotipų prognozavimui.
Mikrobų bendruomenių naudojimas ligoms nuspėti
Mikrobiomai yra svarbūs žmonių sveikatai ir ligoms (Bourne ir kt., 2009). Iš tiesų žmogaus kūne yra daug mikrobų bendruomenių. Kai mikrobų bendruomenė išsibalansuoja arba įsiveržia svetimi mikroorganizmai, žmogaus organizmas gali susirgti. Pavyzdžiui, žarnyno mikrobų bendruomenės yra susijusios su nutukimu (Ley ir kt., 2006b), o plaučių bendruomenės – su plaučių infekcija (Sibley ir kt., 2008). Dėl šių bendruomenių sudėtingumo sunku nustatyti, kokios mikrobiomų bendruomenės sukelia ligą. Pastaruoju metu daugelyje tyrimų buvo tiriamas mikrobiomų bendruomenių naudojimas prognozuojant ligas, ypač bakterinę vaginozę (Srinivasan ir kt., 2012 Deng ir kt., 2018) ir uždegimines žarnyno ligas (Gillevet ir kt., 2010). Analizuodami mikrobų bendruomenes galime geriau suprasti ligą ir priimti veiksmingus sprendimus dėl gydymo. Todėl šiame skyriuje aptariame dabartinius tyrimus, kuriuose tiriamas mikrobiomų bendruomenių naudojimas ligoms prognozuoti.
Bakterinė vaginozė (BV) yra liga, susijusi su makšties mikrobioma. Beck ir Foster (2014) naudojo genetinį algoritmą (GP), RF ir logistinę regresiją (LR), kad klasifikuotų BV pagal mikrobų bendruomenes. Yra du BV kriterijai: Amselio standartas, kuris atitinka išskyrimą, kvapą, įkalčių ląsteles ir pH (Amsel ir kt., 1983), ir Nugent balas, kuris priklauso nuo gramteigiamų ląstelių skaičiavimo (Nugent ir kt. , 1991). Beck ir kt. duomenų rinkinys. tyrimas buvo atliktas iš Ravel ir kt. (2011) ir Sujatha ir kt. (2012). Straipsnyje pateiktas metodas (Beck ir Foster, 2014) pirmiausia klasifikuoja BV pagal makšties mikrobiotą ir susijusius aplinkos veiksnius, tada nustato svarbiausią mikrobų bendruomenę BV prognozavimui.
Hierarchinis bruožų išskyrimas pagrįstas mikrobų klasifikavimu iš karalysčių į rūšis. Esamas stratifikacijos ypatybių pasirinkimo algoritmas sukels informacijos praradimą, o kai kurių 16S rRNR sekų stratifikacijos informacija paprastai yra neišsami, o tai turi įtakos klasifikacijai. Todėl Oudah ir Henschel (2018) pasiūlė metodą, žinomą kaip hierarchinė funkcijų inžinerija (HFE), siekiant nustatyti gaubtinės ir tiesiosios žarnos vėžį (CRC). To accomplish this, they used RF, decision trees and the NB method to classify a dataset of Next Generation Sequencing based 16S rRNA sequences provided by metagenomics studies. This method is good for processing datasets with high dimensional features. Moreover, the available dataset and method are in https://github.com/HenschelLab/HierarchicalFeatureEngineering.
In another study (Wisittipanit, 2012), the author focused on predicting inflammatory bowel disease. In that study, patients with Crohn’s disease and ulcerative colitis were compared with healthy controls to identify differences between the mucosa and lumen in different intestinal locations. The author used the Relief algorithm (Kira and Rendell, 1992) to select features, and Metastats (White et al., 2009) to detect differential features. Finally, the author used KNN and SVM as classifiers to perform disease specificity and site specificity analysis.
In this section, we discuss using microorganisms to predict different diseases. Beck and Foster (2014) predicted BV according to the microorganisms and the diagnosis standard of BV. HFE identified the CRC according to the OTU ID and the taxonomy information. Wisittipanit proposed a method to predict Crohn’s disease, based on OTU and feature selection method. The above methods used different ideas to predict diseases by using microorganisms and obtained good results. This indicates that some diseases affect human colonies. According to these colony changes, we can not only predict the disease, but also treat the disease according to the colony condition, which is a direction for future research.
Machine learning applications in cell image analysis
Dr A Kan, Division of Immunology, The Walter and Eliza Hall Institute of Medical Research, 1G Royal Parade, Parkville, Victoria 3052, Australia. E-mail: [email protected] Search for more papers by this author
Division of Immunology, The Walter and Eliza Hall Institute of Medical Research, Parkville, Victoria, Australia
Department of Medical Biology, The University of Melbourne, Parkville, Victoria, Australia
Dr A Kan, Division of Immunology, The Walter and Eliza Hall Institute of Medical Research, 1G Royal Parade, Parkville, Victoria 3052, Australia. E-mail: [email protected] Search for more papers by this author
Abstraktus
Machine learning (ML) refers to a set of automatic pattern recognition methods that have been successfully applied across various problem domains, including biomedical image analysis. This review focuses on ML applications for image analysis in light microscopy experiments with typical tasks of segmenting and tracking individual cells, and modelling of reconstructed lineage trees. After describing a typical image analysis pipeline and highlighting challenges of automatic analysis (for example, variability in cell morphology, tracking in presence of clutters) this review gives a brief historical outlook of ML, followed by basic concepts and definitions required for understanding examples. This article then presents several example applications at various image processing stages, including the use of supervised learning methods for improving cell segmentation, and the application of active learning for tracking. The review concludes with remarks on parameter setting and future directions.
Machine learning and microscopy
With recent advances in machine learning (ML), an increasing number of scientists have been implementing ML techniques in image-based studies in biology and medicine, with the growing complexity of microscopic images providing an opportunity for computer aid in these fields. Machine learning helps speed up tasks, and with how time-consuming it can be to take information from images at different scales, all with different morphology and levels of noise, utilising algorithms can help automatically detect patterns in images and cells themselves.
Machine learning is a subset of artificial intelligence in which an algorithm learns from data and finds patterns and relationships. When observing cells, researchers typically use fluorescent tagging or stains to identify characteristics of a cell. In 2018, using a computer model to focus on details without using markers, an algorithm was able to correctly differentiate between smaller structures. To create an algorithm with high accuracy, a large amount of data is required to train models, and this had to be done with a lot of manual annotation. This helped with developing a neural network that could distinguish between cell types, label them down to where neurons’ bodies ended and their axons and dendrites began, and distinguish dead cells from living ones.
In addition to labelling, another area in which implementing ML models has been proven useful is in removing noise from microscopic images. Noise is caused by insufficient light, causing the graininess we often see in photographs taken at night. There will always be noise in photographs and some cannot be avoided. However, although algorithms to remove noise have been used for years, using deep learning models produces results that are far more effective.
Self-supervised learning is where the network is forced to learn what data has been withheld in order to solve a problem. Normally, with supervised learning, the machine knows what is looking for because it has been trained with images that have clean versions. However with self-supervised learning, researchers have to try using algorithms that train themselves. The outputs from these models look good, but that does not mean they are real.
The primary concern when using models is often whether data is being changed and the number of mistakes being made. With the labelling models, biologists consistently check computers’ work to ensure that structures have been defined accurately. In these scenarios, the original image is not changed, but another layer is added on top. With de-noising algorithms, the image has been modified to produce a cleaner result. If the noise in the original image is stronger, then these changes will be more pronounced. In one project, researchers were attempting to remove blur but rather than doing so, the algorithm simply picked up the pattern of stripes in the original images and removed any stripes in new images it had to de-noise, although this was fixed by adding training data.
There are now an increasing number of repositories containing different algorithms by researchers to de-noise images and in other areas like segmentation and classification. Neural networks are now being used in mapping brain tumours, studying RNA localisation and electron microscopy. As these models continue to develop in complexity and accuracy, and researchers continue to share results and work on algorithms together, we can already see how beneficial implementing AI in research can be.
Machine learning applications in cell image analysis
Machine learning (ML) refers to a set of automatic pattern recognition methods that have been successfully applied across various problem domains, including biomedical image analysis. This review focuses on ML applications for image analysis in light microscopy experiments with typical tasks of segmenting and tracking individual cells, and modelling of reconstructed lineage trees. After describing a typical image analysis pipeline and highlighting challenges of automatic analysis (for example, variability in cell morphology, tracking in presence of clutters) this review gives a brief historical outlook of ML, followed by basic concepts and definitions required for understanding examples. This article then presents several example applications at various image processing stages, including the use of supervised learning methods for improving cell segmentation, and the application of active learning for tracking. The review concludes with remarks on parameter setting and future directions.
Machine learning tool improves tracking of tiny moving particles
Scientists have developed an automated tool for mapping the movement of particles inside cells that may accelerate research in many fields, a new study in eLife reports.
Beyond manual tracing: An artist's impression of a deep neural network trained to recognise particle motion in space-time representations. Credit: Eva Pillai.
The movements of tiny molecules, proteins and cellular components throughout the body play an important role in health and disease. For example, they contribute to brain development and the progression of some diseases. The new tool, built with cutting-edge machine learning technology, will make tracking these movements faster, easier and less prone to bias.
Currently, scientists may use images called kymographs, which represent the movement of particles in time and space, for their analyses of particle movements. These kymographs are extracted from time-lapse videos of particle movements recorded using microscopes. The analysis needs to be done manually, which is both slow and vulnerable to unconscious biases of the researcher.
“We used the power of machine learning to solve this long-standing problem by automating the tracing of kymographs,” says lead author Maximilian Jakobs, a PhD student in the Department of Physiology, Development and Neuroscience at the University of Cambridge, UK.
The team developed the software, dubbed ‘KymoButler’, to automate the process. The software uses deep learning technology, which tries to mimic the networks in the brain to allow software to learn and become more proficient at a task over time and multiple attempts. They then tested KymoButler using both artificial and real data from scientists studying the movement of an array of different particles.
“We demonstrate that KymoButler performs as well as expert manual data analysis on kymographs with complex particle trajectories from a variety of biological systems,” Jakobs explains. The software could also complete analyses in under one minute that would take an expert 1.5 hours.
KymoButler is available for other researchers to download and use at kymobutler.deepmirror.ai. Senior author Kristian Franze, Reader in Neuronal Mechanics at the University of Cambridge, expects the software will continue to improve as it analyses more types of data. Researchers using the tool will be given the option of anonymously uploading their kymographs to help the team continue developing the software.
“We hope our tool will prove useful for others involved in analysing small particle movements, whichever field they may work in,” says Franze, whose lab is devoted to understanding how physical interactions between cells and their environment shape the development and regeneration of the brain.