Informacija

Koks yra atsako vektorius fMRI GLM modelyje?

Koks yra atsako vektorius fMRI GLM modelyje?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Atliekant fMRI, vienamatėje analizėje paprastai naudojamas bendrasis tiesinis modelis (GLM), kur ryšys tarp eksperimentinės būklės ir BOLD aktyvumo įvertinamas taikant linijinės regresijos modelį kiekvienam vokseliui atskirai ("masės vienamatis modelis"). Tačiau man buvo stebėtinai sunku išsiaiškinti, kas yra atsakymo vektoryje $Y$. Žinau, kad tai yra tam tikras nuo kraujo deguonies lygio priklausomo signalo matas (BOLD signalas), bet kas tiksliai matuojamas, t. y. kokie yra vienetai? Ar tai deguonies ir deoksido santykis, ar tai kita savybė?


Trumpas atsakymas

Vienetai nėra svarbūs ir paprastai yra normalizuoti.

Ilgesnis atsakymas

Pavadinimas "BOLD" iš tikrųjų yra labai pamokantis: kraujo deguonies lygis priklausomas nuo kontrasto (arba signalo). BOLD tiesiogiai nematuoja nieko panašaus į deguonies ir deguonies kiekį, arba tikriausiai pavadintume jį kažkuo panašesniu į tai: deguonies ir deguonies santykio.

Vietoj to, „BOLD“ yra tik MRT vaizdas, kurį gaunate, kai nustatote skaitytuvo savybes taip, kad tai būtų įtakojama kraujo prisotinimo deguonimi. Deguonies lygis toli gražu nėra vienintelis BOLD signalo veiksnys, tačiau eksperimentiškai bandote išskirti bet kokią įtaką, kuri kinta laikui bėgant, bet nėra įdomi, ir ignoruojate pradinius lygius, kurie nesikeičia.

fMRT veikia, nes skersinis vandens atsipalaidavimo laikas T2 kraujyje priklauso nuo kraujo prisotinimo deguonimi. Iš originalaus popieriaus, kuriame parodytas ryškus kontrastas žiurkės smegenyse, Ogawa ir kt. 1990 m.:

Esant šiame tyrime naudotam 7-T lauko stipriui, T2 svyruoja nuo 50 ms, esant 100 % deguonies prisotinimui, iki 4 ms, kai prisotinta deguonimi 0 %. Veninio kraujo signalas tampa labai silpnas, kai T2 vertė tampa panaši į signalo gavimo aido laiką arba trumpesnė už ją. Esant 60 % deguonies lygiui, apskaičiuota T2 vertė yra 18 ms, panaši į aido laiką, naudojamą šioje ataskaitoje.

Kitaip tariant, jei sukuriate gradiento aido vaizdus, ​​kurių aido laikas yra 18 ms, gaunami vaizdai rodo labai skirtingus signalo lygius esant 100% ir 60% deguonies. Atsižvelgdami į jūsų magneto stiprumą, šį laiką galite suderinti, kad atitiktumėte skirtumus, kuriuos norite pamatyti.

Nėra paprasto būdo palyginti įvairiomis sąlygomis (t. y. skirtingais skaitytuvais, skirtingais parametrais) įrašytus vaizdus bet kokia naudinga matavimo skale. Vietoj to žmonės paprastai praneša santykines vertes laike arba erdvėje. Dėl šios priežasties dažnai matote BOLD signalus, išreikštus % pokyčiu arba standartiniu nuokrypiu (t. y. z balais).

Galų gale, norint pritaikyti bendrą tiesinį modelį, tai nesvarbu: galite laisvai keisti priklausomo kintamojo mastelį, nekeisdami modelio atitikties struktūros, viskas, ką darote, yra pertraukos dydžių ir koeficientų interpretacija.

Nuorodos


Ogawa, S., Lee, T. M., Kay, A. R. ir Tank, D. W. (1990). Smegenų magnetinio rezonanso tomografija su kontrastu, priklausomai nuo kraujo prisotinimo deguonimi. Proceedings of the National Academy of Sciences, 87(24), 9868-9872.


Bendrasis tiesinis modelis (GLM)

Aprašytas t dviejų vidutinių reikšmių skirtumui įvertinti skirtas testas yra ypatingas kokybinio (kategoriško) nepriklausomo kintamojo analizės atvejis. Kokybinis kintamasis apibrėžiamas atskirais lygiais, pvz., "dirgiklis išjungtas" arba "dirgiklis įjungtas". Jei projekte yra daugiau nei du lygiai, priskirti vienam ar keliems veiksniams, galima atlikti dispersijos analizę (ANOVA), kuri gali būti laikoma t testo išplėtimu. Kita vertus, aprašytas koreliacijos koeficientas yra tinkamas kiekybinių nepriklausomų kintamųjų analizei. Kiekybinis kintamasis gali būti apibrėžtas bet kokia laipsniška laiko eiga. Jei reikia atsižvelgti į daugiau nei vieną atskaitos laiko kursą, galima atlikti daugkartinę regresinę analizę, kuri gali būti laikoma paprastos tiesinės koreliacinės analizės išplėtimu.

Bendrasis tiesinis modelis (GLM) yra matematiškai identiškas daugialypės regresijos analizei, tačiau pabrėžia jo tinkamumą tiek keliems kokybiniams, tiek keliems kiekybiniams kintamiesiems. GLM tinka bet kokiam parametriniam statistiniam testui su vienu priklausomu kintamuoju įgyvendinti, įskaitant bet kokį faktorinį ANOVA dizainą, taip pat projektus su kokybinių ir kiekybinių kintamųjų mišiniu (kovariacijos analizė, ANCOVA). Dėl savo lankstumo įtraukti kelis kiekybinius ir kokybinius nepriklausomus kintamuosius, GLM tapo pagrindine fMRI duomenų analizės priemone po to, kai Fristonas ir jo kolegos jį pristatė neurovaizdų bendruomenei (Friston ir kt., 1994, 1995). Tolesniuose skyriuose trumpai aprašomas matematinis GLM pagrindas fMRI duomenų analizės kontekste. Išsamų GLM traktavimą galima rasti standartinėje statistinėje literatūroje, pvz. Draper ir Smith (1998) ir Kutner ir kt. (2005).

Pastaba: fMRI literatūroje terminas „bendrasis tiesinis modelis“ reiškia jo vienmatinę versiją. Sąvoka „vienamatis“ šiame kontekste reiškia ne nepriklausomų kintamųjų skaičių, o priklausomų kintamųjų skaičių. Kaip minėta anksčiau, kiekvienai vokselio laiko eilutei (priklausomai kintamajam) atliekama atskira statistinė analizė. Bendrasis tiesinis modelis buvo apibrėžtas daugeliui priklausomų kintamųjų, t. y. jis apima tokius bendrus testus kaip daugiamatė kovariacinė analizė (MANCOVA).

Daugialypės regresijos analizės požiūriu GLM siekia „paaiškinti“ arba „numatyti“ priklausomo kintamojo kitimą kelių atskaitos funkcijų tiesiniu deriniu (svertine suma). Priklausomas kintamasis atitinka stebimą vokselio fMRI laiko eigą, o etaloninės funkcijos atitinka tikėtinų (idealizuotų) fMRI atsakų laiko eigą skirtingomis eksperimentinės paradigmos sąlygomis. Etaloninės funkcijos taip pat vadinamos prognozėmis, regresoriais, aiškinamaisiais kintamaisiais, kintamaisiais arba bazinėmis funkcijomis. Nurodytų prognozių rinkinys sudaro projektavimo matricą, dar vadinamą modeliu. Numatytoji laiko eiga paprastai gaunama susumavus būklės dėžės ir automobilio laiko eigą su standartine hemodinaminio atsako funkcija (dviejų gama HRF arba vieno gama HRF). Sąlygos dėžės-automobilio laiko kursas gali būti apibrėžtas nustatant reikšmes į 1 laiko momentais, kuriais apibrėžiama modeliuojama sąlyga ("įjungta") ir 0 visais kitais laiko momentais. Kiekviena prognozės laiko eiga X gauna susijusį koeficientą arba beta svorį b, kiekybiškai įvertinantį jo galimą indėlį paaiškinant vokselio laiko eigą y. Vokselio laiko eiga y modeliuojama kaip apibrėžtų prognozių suma, kiekviena padauginta iš susijusio beta svorio b. Kadangi šis tiesinis derinys dėl triukšmo svyravimų duomenų tiksliai nepaaiškins, į GLM lygčių sistemą su n duomenų taškų ir p prognozuotojais pridedama klaidos reikšmė e:

Kairėje pusėje esantis y kintamasis atitinka duomenis, ty išmatuotą vieno vokselio laiko eigą. Laikas eina iš viršaus į apačią, t. y. y1 yra išmatuota vertė 1 laiko taške, y2 yra išmatuota vertė 2 laiko taške ir pan. Vokselio laiko eiga (kairysis stulpelis) yra „paaiškinta“ dešinėje lygties pusėje esančiais terminais. Pirmasis stulpelis dešinėje atitinka pirmąjį beta svorį b0. Atitinkama prognozės laiko eiga X0 kiekvienam laiko taškui turi 1 reikšmę, todėl ji taip pat vadinama „konstanta“. Kadangi dauginimas iš 1 nekeičia b0 reikšmės, ši prognozės laiko eiga (X0) nėra aiškiai matoma lygtyje. Atlikus įvertinimą (žr. toliau), b0 reikšmė paprastai parodo pradinės būklės signalo lygį ir taip pat vadinama pertraukimu. Nors jo absoliuti vertė nėra informatyvi, svarbu įtraukti pastovų prognozuotoją į projektavimo matricą, nes tai leidžia kitiems prognozuotojams modeliuoti nedidelius su sąlyga susijusius svyravimus, kurie didėja arba mažėja, palyginti su pradinio signalo lygiu. Kiti dešinėje pusėje esantys prognozuotojai modeliuoja numatomą skirtingų sąlygų laiko eigą. Daugiafaktorių projektų atveju prognozės gali būti apibrėžtos kodavimo sąlygų lygių kombinacijos, kad būtų galima įvertinti pagrindinį ir sąveikos poveikį. Būklės prognozuotojo beta svoris kiekybiškai įvertina jo laiko eigos indėlį paaiškinant vokselio laiko eigą. Nors tikslus beta verčių aiškinimas priklauso nuo projektavimo matricos detalių, didelis teigiamas (neigiamas) beta svoris paprastai rodo, kad vokselis stipriai suaktyvėja (deaktyvuoja) modeliuojamomis eksperimentinėmis sąlygomis, palyginti su pradine linija. Visos beta vertės kartu apibūdina vokselių pirmenybę vienai ar daugiau eksperimentinių sąlygų. Paskutiniame lygčių sistemos stulpelyje yra klaidų reikšmės, dar vadinamos likučiais, numatymo paklaidomis arba triukšmu. Šios paklaidos reikšmės kiekybiškai įvertina išmatuoto vokselio laiko kurso nuokrypį nuo prognozuojamo laiko eigos, linijinės prognozių derinio.

GLM lygčių sistema gali būti išreikšta elegantiškai naudojant matricos žymėjimą. Šiuo tikslu vokselio laiko eigą, beta vertes ir likučius pateikiame kaip vektorius, o prognozių rinkinį – kaip matricą:

Pateikdami nurodytus vektorius ir matricą pavienėmis raidėmis, gauname tokią paprastą GLM lygčių sistemos formą:

Šiame žymėjime matrica X vaizduoja projektavimo matricą, kurioje yra numatymo laiko kursai kaip stulpelių vektoriai. Beta vertės dabar rodomos atskirame vektoriuje b. Terminas Xb rodo matricos-vektoriaus dauginimą. Aukščiau pateiktame paveikslėlyje parodytas grafinis GLM vaizdas. Signalo laiko kursai, prognozės ir likučiai išdėstyti stulpelių pavidalu, o laikas eina iš viršaus į apačią, kaip ir lygčių sistemoje.

Atsižvelgiant į duomenis y ir dizaino matrica X, GLM pritaikymo procedūra turi rasti beta verčių rinkinį, kuris kuo geriau paaiškintų duomenis. Modelio prognozuojamos laiko eigos reikšmės gaunamos naudojant linijinį prognozių derinį:

Geras atitikimas būtų pasiektas naudojant beta vertes, todėl numatomos vertės būtų kuo artimesnės išmatuotoms vertėms y. Pertvarkius lygčių sistemą, akivaizdu, kad geras duomenų numatymas reiškia mažas klaidų reikšmes:

Intuityvi idėja būtų rasti tas beta vertes, sumažinant klaidų reikšmių sumą. Kadangi klaidų reikšmėse yra ir teigiamų, ir neigiamų verčių (ir dėl papildomų statistinių svarstymų), GLM procedūra neapskaičiuoja beta verčių, sumažindama klaidų reikšmių sumą, bet randa tas beta vertes, sumažinančias klaidų reikšmių kvadratų sumą:

Terminas e'e yra kvadratų sumos vektorinis žymėjimas (Sigma e 2 ). Apostrofo simbolis reiškia vektoriaus arba matricos perkėlimą. Optimalūs beta svoriai, minimizuojantys kvadratinių klaidų reikšmes („mažiausių kvadratų įverčiai“), gaunami neiteratyviai pagal šią lygtį:

Terminas skliausteliuose apima matricos matricos dauginimą X“, ir neperkeltas, X, dizaino matrica. Dėl šio termino gaunama kvadratinė matrica su eilučių ir stulpelių skaičiumi, atitinkančiu prognozių skaičių. Kiekviena ląstelė X'X matricoje yra dviejų prognozių vektorių skaliarinė sandauga. Skaliarinė sandauga gaunama susumavus visas dviejų vektorių, atitinkančių kovariacijos skaičiavimą, atitinkamų įrašų sandaugas. Tai X'X Taigi matrica atitinka prognozės dispersijos-kovariacijos matricą. Dispersijos-kovariacijos matrica yra apversta, kaip pažymėta simboliu "-1". Gauta matrica (X'X) -1 vaidina esminį vaidmenį ne tik skaičiuojant beta vertes, bet ir tikrinant kontrastų reikšmę (žr. toliau). Likęs terminas dešinėje pusėje, X'y, įvertina kaip vektorių, kuriame yra tiek elementų, kiek numatytojų. Kiekvienas šio vektoriaus elementas yra prognozės laiko eigos skaliarinė sandauga (kovariacija) su stebima vokselio laiko eiga.

Įdomi mažiausių kvadratų įvertinimo metodo savybė yra ta, kad išmatuoto laiko eigos dispersiją galima išskaidyti į numatomų verčių dispersijos sumą (susijusią su modeliu dispersija) ir likučių dispersiją:

Kadangi vokselio laiko kurso dispersija yra fiksuota, paklaidos dispersijos sumažinimas mažiausiais kvadratais atitinka modelio paaiškintų reikšmių dispersijos maksimizavimą. Daugialypės koreliacijos koeficiento kvadratas R pateikia duomenų dispersijos proporcijos matą, kurį galima paaiškinti modeliu:

Daugialypės koreliacijos koeficiento reikšmės svyruoja nuo 0 (nepaaiškinama dispersija) iki 1 (visa dispersija paaiškinama modeliu). Koeficientas iš R = 0,7, pavyzdžiui, atitinka paaiškintą 49 % (0,7 x 0,7) dispersiją. Alternatyvus daugialypės koreliacijos koeficiento apskaičiavimo būdas – apskaičiuoti standartinį koreliacijos koeficientą tarp numatomų ir stebimų verčių: R = ryy. Ši lygtis suteikia dar vieną vaizdą apie daugialypės koreliacijos koeficiento reikšmę, kiekybiškai įvertinantį kombinuotų prognozuojamųjų kintamųjų aibės ryšį (koreliaciją) su stebima laiko eiga.


Koks yra atsako vektorius fMRI GLM modelyje? – Biologija

Buvo pasiūlyta daug metodų statistinei fMRI duomenų analizei, ir daugelis jų yra plačiai naudojami. Tokios analizės tikslas yra sukurti vaizdą, identifikuojantį regionus, kuriuose rodomas reikšmingas signalo pokytis reaguojant į užduotį. Kiekvienam pikseliui priskiriama reikšmė, priklausanti nuo nulinės hipotezės tikimybės, kad pastebėtus signalo pokyčius galima paaiškinti tik atsitiktine duomenų variacija, atitinkančia jo dispersiją, nes ji yra klaidinga. Toks vaizdas vadinamas statistiniu parametriniu žemėlapiu. Šio skyriaus tikslas – parodyti, kaip galima sukurti tokius žemėlapius.

Analizuojant šiame darbe pateiktus duomenis, vienu ar kitu metu buvo naudojami visi žemiau aprašyti metodai. Dauguma buvo įdiegtos kaip „C“ programos, išskyrus žymią išimtį SPM[10] bendrojo tiesinio modelio įgyvendinimas.

Šiame skyriuje aprašyti analizės metodai demonstruojami duomenų rinkinio pavyzdyje. Atliktas eksperimentas buvo skirtas aptikti aktyvacijas, atsirandančias dėl vizualiai nurodytos motorinės užduoties. Visos tiriamojo smegenys buvo vaizduojamos 16 vainikinių pjūvių, kurių skiriamoji geba yra 3 x 3 x 10 mm3, kas keturias sekundes. Kaip rodo LED ekranas, jie turėjo išspausti rutulį 2 Hz dažniu. Eksperimentas apėmė 16 s poilsio, po kurio sekė 16 s užduoties atlikimas, kartojamas 32 kartus.

Išsamesnės informacijos apie šiame skyriuje paminėtą statistiką galima rasti daugelyje statistikos vadovėlių, pavyzdžiui, Zar[11], Miller ir Freund[12].

6.3.1 Atimties metodai

Vienas iš paprasčiausių dviejų būsenų fMRI eksperimento rezultatų gavimo būdų yra atlikti paprastą atimtį. Tai atliekama apskaičiuojant visų vaizdų, gautų per užduoties „įjungtą“ fazę, vidurkį ir atimant visų „išjungtų“ vaizdų vidurkį. Tokios technikos trūkumas yra tai, kad ji itin jautriai reaguoja į galvos judesius, todėl vaizde susidaro daug artefaktų. 6.7a paveiksle parodytas vienas variklio žievės pjūvis iš pavyzdinio duomenų rinkinio, o 6.7b paveiksle parodytas „išjungtų“ vaizdų atėmimas iš „įjungtų“ vaizdų rezultatas. Nors signalo padidėjimą galima pastebėti pirminėje motorinėje žievėje, taip pat yra daug artefaktų, ypač vaizdo ribose.

Toks metodas neduoda statistikos, kurią būtų galima patikrinti pagal nulinę hipotezę, todėl vietoj tiesios atimties dažniau naudojamas Stjudento t-testas. Tai pasveria vidurkių skirtumą pagal standartinį „išjungimo“ arba „įjungimo“ verčių nuokrypį, suteikiant aukštus t balus dideliems skirtumams su mažais standartiniais nuokrypiais, o mažus t balus – mažiems skirtumams su dideliais standartiniais nuokrypiais. t balas apskaičiuojamas pagal pikselį po pikselio, laiko eilutei X, naudojant formulę

ir yra sujungta dispersija

Priesaga „1“ nurodo n 1 vaizdai buvo gauti per užduoties „įjungimo“ laikotarpį, o „2“ reiškia n 2 vaizdai gauti per poilsio laikotarpį. 6.7c paveiksle parodytas imties duomenų rinkinio t balų statistinis parametrinis žemėlapis. Vėlgi aiškiai matomas motorinės žievės aktyvavimas, tačiau judėjimo artefaktas yra mažesnis, palyginti su atimties technika.

6.7 pav Atimties metodų naudojimas fMRI duomenims analizuoti. a ) Vieno pjūvio vainikinio EPI vaizdas per pirminę motorinę žievę. b) vaizdų, gautų per fMRI eksperimento „išjungimo“ laikotarpį, vidurkis atimtas iš vaizdų, gautų per „įjungimo“ laikotarpį, vidurkio. c) t statistinis parametrų žemėlapis, atitinkantis (b) vaizdą.

6.3.2 Koreliacijos metodai

Kadangi žinome, kad BOLD atsaką tarpininkauja kraujotaka, galima pagerinti aktyvacijų aptikimą numatant reakcijos į dirgiklį formą ir apskaičiuojant koreliacijos koeficientus tarp kiekvieno pikselio laiko eigos ir šios atskaitos bangos formos. Tai mažiau jautrus kitiems fiziologiniams pokyčiams eksperimento metu ir judėjimui. Laiko kurso X ir etaloninės bangos formos Y koreliacijos koeficientas apskaičiuojamas kaip

ir turi vertę 1, kad būtų tobula koreliacija, nulinė, jei nėra koreliacijos, ir -1, kad būtų tobula antikoreliacija.

Norint, kad šis metodas būtų sėkmingas ieškant aktyvavimo, labai svarbu pasirinkti tinkamą atskaitos bangos formą. Pirmasis apytikslis variantas gali būti kvadratinė banga, kuri yra didelė atliekant nuskaitymą, gautą atliekant užduotį, ir žema, kai skenuojama ramybės metu (6.8a pav.). Tačiau tokioje bangos formoje neatsižvelgiama į hemodinaminio atsako, kuris reguliuoja BOLD kontrastą, vėlavimą ir sklandumą. To patobulinimas būtų pakeisti kvadratinės bangos fazę (6.8b pav.), kai delsa būtų nuo 3 iki 6 sekundžių.

Norint toliau pagerinti atskaitos bangos formą, reikia atidžiau pažvelgti į tikrąjį hemodinaminį atsaką. Eksperimente, tokiame kaip naudojamas duomenų rinkinio pavyzdyje, kai yra ir vizualinis, ir motorinis aktyvinimas, galima naudoti atsaką į vieno tipo dirgiklius, kad būtų suformuota atskaitos bangos forma, norint rasti kitą. Šiuo atveju vieno ar kelių pikselių laiko eilutė, tarkime, išimama regimoji žievė (6.8c pav.), o koreliacijos koeficientai apskaičiuojami tarp šios bangos formos ir kiekvieno kito vaizdo pikselio.Tokia analizė aptinka tik tas smegenų sritis, kurios reaguoja į dirgiklį taip pat, kaip ir regos žievė. Pagrindinis šio metodo trūkumas yra tai, kad jis yra ypač jautrus judesio artefaktui, nes jei toks artefaktas yra atskaitos bangos formoje, kitų sričių judėjimas bus labai koreliuojamas. Norint tai sumažinti, regos žievės atsakas į kiekvieną dirgiklį gali būti apskaičiuojamas kartu, sukuriant vidutinį atsaką į vieną ciklą. Tada atskaitos bangos forma sudaroma iš šių vieno ciklo vidutinių atsakų pasikartojimo (6.8d pav.).

6.8 pav. Įvairios nuorodų funkcijos, kurias galima naudoti norint susieti su pikselių laiko eiga, kad būtų galima aptikti aktyvacijas (apibūdinimus rasite tekste)

Norint labiau nuspėti hemodinaminį atsaką, kad būtų galima sukurti etaloninę bangos formą bet kokio ilgio dirgikliui, būtina žinoti atsaką į vieną dirgiklį. Fristonas [13] pasiūlė, kad hemodinaminio atsako funkcija galėtų būti laikoma taško sklaidos funkcija, kuri išlygina ir perkelia įvesties funkciją. Išskleidus atsaką iš žinomos aktyvacijos srities su stimulo funkcija, galima gauti hemodinaminio atsako funkciją. Tačiau hemodinaminio atsako funkcija nėra visiškai vienoda visose smegenyse, o forma, gauta iš vieno regiono, gali būti netinkama kitam. Kaip alternatyva, atsakas gali būti modeliuojamas matematine funkcija, tokia kaip Puasono arba beta funkcija. Puasono funkcija

kai plotis l = 6 sekundės, atrodo, kad gerai atitinka pastebėtus hemodinaminius atsakus (6.8e pav.).

Kadangi paprastai kiekviena vaizduojamo tūrio dalis nėra gaunama tą pačią akimirką, būtina atsižvelgti į laiko skirtumus koreliacijoje su atskaitos bangos forma. Norint tai padaryti, nuspėjamas santykinis aktyvacijos dydis tuo metu, kai buvo gautas kiekvienas pjūvis, sujungiant įvesties stimulą su Puasono funkcija. Tada iš šios serijos koreliacijos koeficientai gali būti apskaičiuojami pagal pjūvį po skilties, sukuriant atskaitos bangos formą iš atitinkamų numatomos laiko eilutės taškų.

Etaloninės bangos formos poveikio rezultatui pavyzdžiai pateikti 6.9 pav. Čia pikseliai galvoje, kurie koreliuoja su atskaitos bangų formomis (parodyta 6.8 paveiksle), kurių r > 0,20, rodomi raudonai, pagrindinio vaizdo viršuje. Kvadratinės bangos koreliacija yra mažiausiai efektyvi nustatant aktyvacijas (a), tačiau reikšmingas pagerėjimas pasiekiamas atidėjus bangos formą 4 sekundėmis (b). Nenuostabu, kad regos žievės koreliacija su savimi (c) yra didelė, tačiau naudojant vidutinį regos žievės atsaką (d) pagerėja koreliacija motorinėje žievėje. Hemodinaminio atsako (e) Puasono funkcijos modelis šiek tiek pagerina uždelstą kvadratinę bangą ir yra geras modelis.

a) Kvadratinė banga
b) Uždelsta kvadratinė banga
c) regos žievės atsakas
(d) Vidutinis regos žievės atsakas
(e) Puasono pasiskirstymo modelis

6.9 pav Aktyvinimo vaizdai, gauti koreliuojant bandymo duomenų rinkinius su etaloninėmis bangų formomis, parodytomis 6.8 paveiksle.

6.3.3 Bendrasis tiesinis modelis

Aukščiau aprašyti statistiniai metodai yra parametriniai testai. Tai reiškia, kad jie daro prielaidą, kad stebėjimai paimti iš normalių populiacijų. Dauguma parametrinio modeliavimo metodų yra specialūs bendrojo tiesinio modelio atvejai. Ši funkcinių vaizdo duomenų analizės sistema, pirmiausia sukurta PET, o vėliau išplėsta fMRI, yra įdiegta programinės įrangos pakete. SPM[14]. Bendrasis tiesinis modelis čia tik apibūdintas, nes teorija yra plačiai aprašyta literatūroje[15].

Bendrojo tiesinio modelio tikslas – paaiškinti laiko eigos kitimą y 1 . y i . y n , aiškinamųjų kintamųjų ir paklaidos termino tiesiniu deriniu. Paprastam modeliui su tik vienu aiškinamuoju kintamuoju x 1 . x i . x n , galima parašyti bendrąjį tiesinį modelį

kur b yra mastelio keitimo arba nuolydžio parametras ir e i yra klaidos terminas. Jei modelyje yra daugiau kintamųjų, bendrąjį tiesinį modelį patogu rašyti matricos forma

kur dabar Y yra stebimų pikselių reikšmių vektorius, b yra parametrų vektorius ir e yra klaidų terminų vektorius. Matrica X yra žinoma kaip dizaino matrica. Jame yra viena eilutė kiekvienam pradinių duomenų laiko taškui ir vienas stulpelis kiekvienam modelio aiškinamajam kintamajam. Analizuojant fMRI eksperimentą, stulpeliai X turi vektorius, atitinkančius pateikto stimulo „įjungimo“ ir „išjungimo“ elementus. Suradę parametro dydį b atitinkančius šiuos vektorius, galima aptikti aktyvacijos buvimą ar nebuvimą.

b gali būti nustatytas sprendžiant „normalias lygtis“

kur yra geriausias tiesinis įvertinimas b. Su sąlyga, kad (X T X) yra apverčiamas, tada yra pateiktas

Tokie parametrų įverčiai paprastai yra pasiskirstę, ir kadangi galima nustatyti klaidos terminą, galima padaryti statistinę išvadą, ar b parametras, atitinkantis aktyvavimo atsako modelį, labai skiriasi nuo nulinės hipotezės.

Bendrasis linijinis modelis suteikia pagrindą daugeliui duomenų modeliavimo tipų ir gali pašalinti poveikį, kuris gali supainioti analizę, pvz., dreifą ar kvėpavimą, jei juos galima modeliuoti.

6.3.4 Serijinis T testas

Visiems aukščiau aprašytiems metodams reikia numatyti laiko eigą, kurią seks aktyvūs regionai. Daugeliui eksperimentų, naudojant greitą vaizdavimą ir kruopščiai suplanuotas paradigmas, galima atskirti pažinimo įvykių tvarką. Vienas iš tokių pavyzdžių, kuris yra mūsų Parkinsono ligos tyrimo dalis ir išsamiau aprašytas 7 skyriuje, yra judėjimo inicijavimo paradigma. Šiame eksperimente tiriamasis turėjo reaguoti, paspaudęs rankoje laikomą mygtuką, į vizualų skaičių „5“ ir neatsakyti į „2“ pateikimą. Ši paradigma parodė du skirtumus nuo įprastinių, epochomis pagrįstų eksperimentų. Pirma, dominantys aktyvinimai, kurie yra atsakingi už mygtuko paspaudimą, įvyko nereguliariai. Antra, visi su užduotimi susiję pažinimo procesai, įskaitant judesio planavimą ir vykdymą, įvyko per kelis šimtus milisekundžių, o ne nuolatinis aktyvinimas, naudojamas epocha pagrįstose paradigmose. Toks eksperimentas reikalauja naujos analizės formos. Buvo įvertinti du metodai, kurie abu nedaro prielaidų dėl aktyvavimo laiko eigos atliekant užduotį: čia aprašytas nuoseklusis t testas ir dispersijos analizė, paaiškinta kitame skyriuje.

Serijinio t testo pagrindas yra nustatyti ramybės būsenos bazinę liniją ir palyginti vaizdus, ​​gautus kiekvienu laiko tašku prieš užduotį, jos metu ir po jos, su šia bazine linija. 6.10 pav. parodyta technika. Kiekvienam laiko taškui po dirgiklio sudaromas vidutinis ir standartinio nuokrypio vaizdas, taip pat bazinio vidurkio ir standartinio nuokrypio vaizdas. Tada t-statistinių parametrinių schemų rinkinys sudaromas apskaičiuojant kiekvieno pikselio pagrindu t balą (naudojant 6,5–6,7 lygtis) skirtumui tarp pirmojo vaizdo ir vidutinio pradinio vaizdo, antrojo vaizdo vidurkio ir bazinės linijos. , ir taip toliau.

6.10 pav. fMRI analizė naudojant serijinį t testą

6.11 paveiksle parodytas pavyzdinio duomenų rinkinio, naudojant šią techniką, analizės rezultatas. Toks duomenų rinkinys tikrai neparodo serijinės t-testo analizės naudos. 7 skyriuje pateikti rezultatai geriau iliustruoja jo naudojimą žiūrint į įvykių laiką ir nenuspėjamas bangų formas.

6.11 pav Bandymo duomenų rinkinio apdorojimo naudojant nuoseklųjį t testą rezultatai. Aštuoni tūrių vaizdų rinkiniai rodomi kaip eilutės, keturi viršutiniai atitinka eksperimento „poilsio“ laikotarpius, o kiti keturi – „užduočių“ laikotarpius. Suaktyvinimas gali būti matomas tiek pirminėje motorinėje, tiek regėjimo žievėje.

Technika turi du didelius trūkumus. Pirmasis yra tas, kad norint pasiekti pakankamą signalo ir triukšmo santykį, būtina turėti daug daugiau ciklų nei epocha pagrįsta paradigma, todėl eksperimentai trunka ilgiau. Tai gali būti nepatogu subjektui, o skaitytuvo aparatūrai keliami papildomi reikalavimai. Yra galimybė suartinti atskiro įvykio užduotis, tačiau turi būti pakankamas intervalas, kad BOLD signalas sugrįžtų į pradinę padėtį. Šis delsimas trunka mažiausiai dešimt sekundžių. Antrasis trūkumas yra tas, kad analizės rezultatas yra daug statistinių parametrinių žemėlapių, kuriuos reikia interpretuoti kaip visumą. Tačiau tai, kad ši technika daro mažai prielaidų apie duomenų laiko eigą, daro ją stipria technika ir atveria įvairesnio eksperimentinio plano galimybę bei nutolimą nuo epocha pagrįstų paradigmų.

6.3.5 Dispersijos analizė

Antrasis metodas, kuris nereikalauja jokių prielaidų apie aktyvinimo laiko eigos formą, nagrinėja dispersijos pokyčius, kai nustatomas vidurkis. Metodas pagrįstas paprasta signalų vidurkinimo teorija[16]. Paimkite, pavyzdžiui, atsaką, išmatuotą į pasikartojantį signalą, kaip parodyta 6.12 pav. Laiko eilutę sudaro du komponentai: vienas yra tikras atsakas į signalą, o kitas yra atsitiktiniai svyravimai dėl nesusijusių fiziologinių įvykių ir vaizdo triukšmo. Vidutiniškai įvertinus 32 ciklus kartu, triukšmingo komponento dydis sumažėja, o pasikartojančio signalo – ne. Triukšmingo komponento sumažėjimą galima išmatuoti apskaičiuojant tiek nesuvidurkinto, tiek suvidurkinto duomenų rinkinio dispersiją.

6.12 pav. Signalo vidurkis. Vidutinio signalo triukšmo dispersija yra N kartų mažiau nei yra pradiniame signale, kur N yra ciklų skaičius.

Norint aptikti aktyvinimo sritis, kiekvienam vaizdo pikseliui apskaičiuojamas suvidurkinto duomenų rinkinio dispersijos ir nesuvidurkinto duomenų rinkinio dispersijos santykis. Pikselių, esančių visiškai atsitiktinių intensyvumo pokyčių srityse, šis santykis bus maždaug 1/n, kur n yra ciklų skaičiaus vidurkis. Tačiau pikseliai aktyvinimo regionuose turės žymiai didesnį santykį nei šis, nes tiek nesuvidurkintų, tiek suvidurkintų duomenų rinkinių dispersijoje dominuoja BOLD efekto užrakinti intensyvumo kitimai, kurie nesumažėja vidurkiaujant.

Metodas formaliau paaiškinamas kaip dispersinė analizė (ANOVA)[17]. Jeigu X ij nurodo iLaiko taškas po stimulo jeksperimento ciklas

laikas t X 11 , X 12 , . X 1j , . X 1n X 1
laikas 2t X 21 , X 22 , . X 2j , . X 2n X 2
. . . . . . . .
laikas tai X i1 , X i2 , . X ij , . X in X i
. . . . . . . .
laikas kt X k1 , X k2, . X kj , . X kn X k
X

su n ciklai ir k taškų už ciklą. Nulinė hipotezė yra ta, kad nėra reikšmingo skirtumo tarpuose, . Tai galima patikrinti lyginant du populiacijos dispersijos įverčius s 2 , vieną pagrįstą to paties laiko taško matavimų skirtumais, o kitą - dispersija tarp laiko taškų.

Bet kurio laiko taško matavimo dispersija gali būti apskaičiuota pagal

taigi vidutinė dispersija laiko taškais yra pateikiama pagal

ir remiasi k(n-1) laisvės laipsniai. Laiko taško vidurkių dispersija pateikiama pagal

tada s 2 gali būti įvertintas pagal

kuri remiasi k-1 laisvės laipsnis. Pagal nulinę hipotezę abu ir nepriklausomai įvertinkite populiacijos dispersiją s 2 . Tai reiškia, kad santykis

turės F paskirstymą su k-1 ir k(n-1) laisvės laipsniai. Jei yra koks nors signalo pokytis, kuris yra užrakintas stimului, reikšmė bus didesnė, nei tikėtasi pagal nulinę hipotezę.

Analizuojant fMRI duomenis, F-statistiniam parametriniam žemėlapiui sudaryti naudojamos lygtys 6.15 - 6.19. Šios lygtys įgyvendinamos naudojant šias trumpąsias formules

Siekiant įvertinti šio metodo pagrįstumą realiais duomenimis, buvo analizuojami fantominiai ir galvos vaizdai. Fantominių duomenų rinkinį sudarė 256 tūriniai vaizdai, kurių kiekvienas buvo 128 x 128 x 16 matricos dydžio, gautų 4 sekundžių pasikartojimo dažniu. Galvos duomenų rinkinį sudarė 256 to paties matricos dydžio galvos vaizdai, o subjektas neatliko jokios konkrečios užduoties. Abu duomenų rinkiniai buvo iš anksto apdoroti taip pat, kaip ir funkcinis vaizdo duomenų rinkinys, o tada buvo atlikta dispersijos analizė, darant prielaidą, kad per ciklą ir 16 ciklų yra 16 taškų. Histogramos iš F kiekvienam duomenų rinkiniui yra parodyta 6.13 pav. su atitinkamu F pasiskirstymu, parodyta punktyrine linija, nurodyta

kur n 1 yra taškų skaičius per ciklą atėmus vieną ir n 2 yra bendras duomenų taškų skaičius, atėmus taškų skaičių per ciklą[18]. Visos trys histogramos gerai tinka F pasiskirstymui, patvirtinančios šio metodo taikymo fMRI duomenims pagrįstumą.

6.13 pav Apskaičiuotų F balų (ištisinė linija) ir atitinkamo F pasiskirstymo (punktyrinė linija) grafikai a) modeliuotiems duomenims, b) fantominiams duomenims ir c) galvos duomenims.

Pavyzdinio aktyvinimo duomenų rinkinio analizės naudojant ANOVA metodiką rezultatai parodyti 6.14 pav. Kaip ir naudojant serijinį t testą, toks duomenų rinkinys geriausiai neparodo šios technikos potencialo. Geresnis pavyzdys yra trumpalaikės atminties tyrimo tyrimo analizė.

6.14 pav Testo duomenų rinkinio apdorojimo naudojant dispersinės analizės metodą rezultatai. Tie pikseliai, nuspalvinti raudonai, atitinka sritis, kurios tam tikru būdu skiriasi, t.

Šio eksperimento stimulų paradigma turėjo tris etapus. Pirmieji trys skaitmenys iš eilės buvo pateikti subjektui. Po aštuonių sekundžių buvo pateiktas ketvirtas skaitmuo, o tiriamasis turėjo atsakyti paspausdamas dešinėje esantį mygtuką, jei šis paskutinis skaitmuo sutampa su bet kuriuo iš trijų anksčiau pateiktų skaitmenų, arba paspaudus mygtuką kairėje rankoje, jei ne. [19]. Paskutinis etapas buvo poilsio laikotarpis, siekiant sudaryti pradinę padėtį. Visas testas buvo pakartotas 32 kartus.

Tikėtina, kad kai kurie smegenų regionai bus aktyvūs tik skaitmenų pateikimo metu, kai kurie jų saugojimo laikotarpiu, kai kurie tik prisiminimo stadijoje, o kiti – per visą atminties užduotį. Išanalizuoti tokius duomenis naudojant koreliacijos metodą reikštų numatyti visą etaloninių bangų formų rinkinį. Tačiau ANOVA technika aptiko skirtingų formų atsakymus viename bandyme. 6.15 paveiksle pavaizduoti aktyvavimo žemėlapiai, gauti iš trumpalaikės atminties eksperimento ANOVA analizės, kartu su laiko eigos diagramomis iš kelių sričių.

6.15 pav Variacijos metodo, taikomo duomenims iš trumpalaikės atminties eksperimento, aprašyto tekste, analizė kartu su kelių dominančių regionų vidutinių ciklo diagramomis. Smegenų sritis, kurios skirtingai veikia stimulą, gali būti matomos viename aktyvinimo vaizde.

Galutinis ANOVA analizės vaizdas iš esmės parodo visas sritis, kurios skiriasi tam tikru būdu, kuris yra sinchroniškas su stimulo pateikimu. Jis taip pat gerai atrenka išjungimus ir suaktyvinimus. Dėl to šie vaizdai yra geras atspirties taškas kitoms analizės formoms, pvz., pagrindinių komponentų analizei arba klasterių analizei, kad būtų galima surinkti visą turimą informaciją.

6.3.6 Programinės įrangos diegimas

Dėl testų, kuriuos galima atlikti viename duomenų rinkinyje, įvairovės, aukščiau aprašytiems testams įgyvendinti skirta programinė įranga buvo parašyta kaip atskirų programų rinkinys.

Programa koreliuoti sukuria atskaitos bangos formą iš vartotojo nurodytų verčių ir pasirinktinai sujungia tai su vartotojo nurodyto pločio Puasono funkcija. Koreliacijos koeficientai apskaičiuojami naudojant 6.8 lygtį. Jei etaloninė bangos forma svyruoja tarp 0 ir 1, tada procentinio pokyčio po aktyvavimo matą galima gauti apskaičiuojant formos tiesinę regresiją

Procentinį pokytį galima apskaičiuoti kaip (b/a) x 100 %.

Programinė įranga taip pat apskaičiuoja atitinkamą z balų vaizdą naudodama Fishers Z transformaciją ir sumažintus laisvės laipsnius, kaip paaiškinta tolesniuose skyriuose. Kiekvieno iš šių išėjimų failų pavadinimai yra

cc_<file>.img koreliacijos koeficientai išsaugoti kaip „trumpai“ x 10 000
pc_<file>.img procentinis pokytis išsaugotas kaip „šortai“ x 1 000 (toks, kad 1 % signalo pokytis x 1 000)
cz_<file>.img z balai išsaugoti kaip „plaukiojantys“ (nepakeisti)

Serijinius t testus atlieka tmap ir tmapnc, pirmasis tinka cikliniams eksperimentams, o antrasis - necikliniams eksperimentams. Neciklinei versijai stimulų laikai gaunami iš tekstinio failo, o abu išvesties t-score žemėlapiai išsaugomi kaip "trumpai", kurių mastelis yra 1000, faile, pavadintame tt_<file>.img.

ANOVA testus atlieka programos anova, ir anovanc, kuris abu išveda f balus, padidintus 1000, faile pavadinimu va_<file>.img.


2 atsakymai 2

Tai gana platus klausimas – aš iš esmės tai išversčiau į: kas yra GLM, o kas yra mišrus modelis. Visų pirma rašai, kad nori tikti GLM, bet įtariu, kad turi omenyje LM, nes formulė

paprastai reikštų LM. GLM turėtume papildomą susiejimo funkciją.

Aukščiau pateiktoje formulėje $Y$ yra jūsų atsakymas, $X$ yra jūsų prognozės (dizaino matrica), o $eta$ yra šių prognozių regresijos koeficientai (kontrastai, jei kategoriški).

Jūsų užrašas apie atsitiktinių efektų modelį yra šiek tiek neįprastas (nežinau, iš kur tai paimta), bet įtariu

$Y = Xeta + epsilon$ $eta = X'eta' + epsilon'$

reiškia, kad norite pritaikyti vadinamąjį atsitiktinio nuolydžio modelį, kuriame regresijos koeficientai / kontrastai gali skirtis kiekvienam grupavimo veiksniui. Atsitiktinio nuolydžio modelio prielaida yra ta, kad $eta$ skirtumai tarp grupių nustatomi iš normalaus skirstinio $epsilon'$, kuris yra kintamumas tarp grupių. Taigi galutinis visas prognozių vektorius $eta$ susideda iš bendro $eta'$ ir atsitiktinių efektų $epsilon'$.

Apskritai, nesu tikras, ar šis užrašas yra labai naudingas norint suprasti, kaip veikia mišrus modelis – siūlyčiau pradėti nuo bendro vadovėlio ar vadovėlio apie mišrius modelius.

  • Paprasta pamoka R yra Bates, D. Mächler, M. Bolker, B. & Walker, S. (2014) Linijinių mišrių efektų modelių pritaikymas naudojant lme4.
  • Statistinė nuoroda yra Gelman, A. & Hill, J. (2006) Duomenų analizė naudojant regresiją ir daugiapakopius/hierarchinius modelius. Cambridge University Press, ypač 11,12 sk
  • Norėdami gauti pagrindinį paaiškinimą apie skaičiavimo metodus, galite pažvelgti į Bates, D. M. (2010) lme4: Mixed- Effects Modeling with R.

Žinoma, yra daug kitų gerų knygų, tai priklauso nuo jūsų srities ir nuo to, kokio lygio matematikos ieškote.


Hibridinis SVM-GLM metodas fMRI duomenų analizei

Hipotezėmis pagrįsti fMRI duomenų analizės metodai, atstovaujami įprastinio bendrojo tiesinio modelio (GLM), turi griežtai apibrėžtą statistinę sistemą, skirtą regioniniam specifiniam aktyvavimui įvertinti, tačiau reikalauja išankstinio smegenų atsako modeliavimo, kurį paprastai sunku būti tiksliai. Priešingai, tiriamieji metodai, tokie kaip paramos vektoriaus mašina (SVM), nepriklauso nuo ankstesnės hemodinaminio atsako funkcijos (HRF), tačiau paprastai neturi statistinių išvadų sistemos. Siekiant pasinaudoti abiejų tipų metodų pranašumais, šiame darbe pateikiamas sudėtinis metodas, derinant įprastą GLM su SVM. Ši hibridinė SVM-GLM koncepcija yra panaudoti SVM galią, kad gautų duomenų išvestinę atskaitos funkciją ir įvestų ją į įprastą GLM statistinėms išvadoms atlikti. Duomenų atskaitos funkcija buvo išgauta iš SVM klasifikatoriaus naudojant naują laiko profilio ištraukimo metodą. Modeliuojant su sintetiniais fMRI duomenimis, SVM-GLM parodė geresnį jautrumą ir specifiškumą nustatant sintetinius aktyvavimus, palyginti su įprastu GLM. Turėdamas tikrus fMRI duomenis, SVM-GLM parodė didesnį jautrumą nei įprastas GLM, kad būtų galima aptikti sensomotorinius aktyvavimus.

Figūros

SVM pagrįsta klasifikacija ir laiko profilis…

SVM pagrįsta klasifikacija ir laiko profilio ištraukimas. A) Dvimatis duomenų klasifikavimas naudojant tiesinį…

A) CNR apibrėžimas, B) dirbtinio smegenų aktyvavimo laiko kursas modeliavimui...

SDPtp, išgautas iš…

SDPtp, išgautas iš reprezentatyvaus subjekto sensomotorinių BOLD fMRI duomenų. A)…

Vidutinis (n=8) įprastų…

Sugeneruotų sintetinių duomenų vidutiniai (n=8) įprastų GLM ir SVM-GLM AUC...

Grupės lygio statistinės analizės rezultatai…

Kairiojo sensomotorinio BOLD fMRI duomenų grupės lygio statistinės analizės rezultatai. The…

Grupės lygio T balo histogramos…

Grupės lygio analizės T balo histogramos, pagrįstos individualiais GLM ir SVM-GLM rezultatais...

Grupės lygio statistinės analizės rezultatai…

Dešinės pusės sensomotorinės ASL perfuzijos fMRI duomenų grupės lygio statistinės analizės rezultatai.


Kaip sukurti generalizuotą linijinį modelį (GLM)

  • amžius: asmens amžius. Skaitinis
  • išsilavinimas: Asmens išsilavinimo lygis. veiksnys.
  • šeimyninė padėtis: asmens šeiminė padėtis. Veiksnys, ty niekada nevedęs, vedęs pilietis, .
  • lytis: asmens lytis. Faktorius, t.y. vyras ar moteris
  • pajamos: Tikslinis kintamasis. Pajamos didesnės arba mažesnės nei 50 tūkst. Koeficientas, ty >50K, <=50K
  • 1 veiksmas: patikrinkite nuolatinius kintamuosius
  • 2 veiksmas: patikrinkite faktoriaus kintamuosius
  • 3 veiksmas: funkcijų projektavimas
  • 4 veiksmas: suvestinė statistika
  • 5 veiksmas: treniruočių/bandymo rinkinys
  • 6 veiksmas: sukurkite modelį
  • 7 veiksmas: įvertinkite modelio veikimą
  • 8 veiksmas: patobulinkite modelį

Jūsų užduotis yra numatyti, kurio asmens pajamos bus didesnės nei 50 tūkst.

Šioje mokymo programoje kiekvienas veiksmas bus išsamiai aprašytas norint atlikti tikro duomenų rinkinio analizę.

1 veiksmas) Patikrinkite nuolatinius kintamuosius

Pirmajame žingsnyje galite pamatyti nuolatinių kintamųjų pasiskirstymą.

  • tęstinis <- select_if(data_adult, is.numeric): naudokite funkciją select_if() iš dplyr bibliotekos, kad pasirinktumėte tik skaitinius stulpelius
  • santrauka (nepertraukiama): spausdinti suvestinę statistiką

Iš aukščiau pateiktos lentelės matote, kad duomenų skalė visiškai skiriasi, o valandos.per.sav. turi didelius nuokrypius (t. y. pažiūrėkite į paskutinį kvartilį ir didžiausią vertę).

  • 1: Nubraižykite valandų pasiskirstymą per savaitę
  • 2: standartizuokite nuolatinius kintamuosius
  1. Nubraižykite paskirstymą

Pažvelkime atidžiau į valandų.per.sav. pasiskirstymą

Kintamasis turi daug nuokrypių ir nėra tiksliai apibrėžtas. Galite iš dalies išspręsti šią problemą ištrindami didžiausią 0,01 procento valandų per savaitę.

Apskaičiuojame viršutinį 2 procentų procentilį

98 procentai gyventojų dirba mažiau nei 80 valandų per savaitę.

Stebėjimus galite atsisakyti virš šios ribos. Naudojate filtrą iš dplyr bibliotekos.

Galite standartizuoti kiekvieną stulpelį, kad pagerintumėte našumą, nes jūsų duomenų skalė skiriasi. Galite naudoti funkciją mute_if iš dplyr bibliotekos. Pagrindinė sintaksė yra tokia:

Skaitinius stulpelius galite standartizuoti taip:

2 veiksmas) Patikrinkite faktorių kintamuosius

  • Pasirinkite kategorinius stulpelius
  • Išsaugokite kiekvieno stulpelio juostinę diagramą sąraše
  • Atspausdinkite grafikus

Mes galime pasirinkti faktoriaus stulpelius su toliau pateiktu kodu:

  • data.frame(select_if(data_adult, is.factor)): faktoriaus stulpelius saugome kaip faktorių duomenų rėmelio tipe. Bibliotekai ggplot2 reikalingas duomenų rėmelio objektas.

Duomenų rinkinyje yra 6 kategoriniai kintamieji

Antrasis žingsnis yra labiau kvalifikuotas. Norite nubrėžti kiekvieno duomenų rėmelio faktoriaus stulpelio juostinę diagramą. Patogiau yra automatizuoti procesą, ypač kai yra daug stulpelių.

  • lapply(): naudokite funkciją lapply() norėdami perduoti funkciją visuose duomenų rinkinio stulpeliuose. Išvestį saugote sąraše
  • funkcija(x): funkcija bus apdorojama kiekvienam x. Čia x yra stulpeliai
  • ggplot(factor, aes(get(x))) + geom_bar()+ theme(axis.text.x = element_text(kampas = 90)): Kiekvienam x elementui sukurkite juostinę diagramą. Atminkite, kad norėdami grąžinti x kaip stulpelį, turite jį įtraukti į get()

Paskutinis žingsnis yra gana lengvas. Norite atspausdinti 6 grafikus.

Pastaba: Norėdami pereiti į kitą diagramą, naudokite kitą mygtuką

3 veiksmas) Funkcijų projektavimas

Švietimas iš naujo

Iš aukščiau esančio grafiko matote, kad kintamasis išsilavinimas turi 16 lygių. Tai reikšminga, o kai kuriuose lygiuose stebėjimų skaičius yra palyginti mažas. Jei norite padidinti informacijos, kurią galite gauti iš šio kintamojo, kiekį, galite iš naujo pateikti jį aukštesniu lygiu. Būtent jūs kuriate didesnes grupes su panašaus išsilavinimo lygiu. Pavyzdžiui, žemas išsilavinimo lygis bus konvertuojamas iš mokyklos nebaigimo. Aukštasis išsilavinimas bus pakeistas į magistrantūros studijas.

  • Mes naudojame veiksmažodį mutuoti iš dplyr bibliotekos. Švietimo vertybes keičiame teiginiu ifelse

Žemiau esančioje lentelėje sukuriate suvestinę statistiką, kad pamatytumėte, kiek vidutiniškai studijų metų (z reikšmė) reikia bakalauro, magistro ar daktaro laipsniui pasiekti.

Iš naujo išdėstyti šeimyninę padėtį

4 žingsnis) Suvestinė statistika

Atėjo laikas patikrinti kai kuriuos statistinius duomenis apie mūsų tikslinius kintamuosius. Toliau pateiktoje diagramoje skaičiuojate procentą asmenų, uždirbančių daugiau nei 50 tūkst., atsižvelgiant į jų lytį.

Tada patikrinkite, ar asmens kilmė turi įtakos jo uždarbiui.

Darbo valandų skaičius pagal lytį.

Dėžutės brėžinys patvirtina, kad darbo laiko paskirstymas tinka skirtingoms grupėms. Dėžutės diagramoje abi lytys neturi vienalyčių stebėjimų.

Galite patikrinti savaitės darbo laiko tankį pagal išsilavinimo tipą. Paskirstymai turi daug skirtingų pasirinkimų. Tikriausiai tai galima paaiškinti sutarties tipu JAV.

  • ggplot(recast_data, aes(x= hours.per.week)): tankio diagramai reikalingas tik vienas kintamasis
  • geom_density(aes(spalva = išsilavinimas), alfa =0,5): geometrinis objektas tankiui valdyti

Norėdami patvirtinti savo mintis, galite atlikti vienpusį ANOVA testą:

ANOVA testas patvirtina vidutinių grupių skirtumą.

Netiesiškumas

Prieš paleisdami modelį galite pamatyti, ar dirbtų valandų skaičius yra susijęs su amžiumi.

  • ggplot(recast_data, aes(x = amžius, y = valandos.per.sav.)): nustatykite grafiko estetiką
  • geom_point(aes(spalva = pajamos), dydis = 0,5): Sukurkite taškinį brėžinį
  • stat_smooth(): pridėkite tendencijos eilutę su šiais argumentais:
    • method='lm': Nubraižykite pritaikytą reikšmę, jei tiesinė regresija
    • formulė = y

    Trumpai tariant, galite išbandyti sąveikos terminus modelyje, kad pastebėtumėte savaitės darbo laiko ir kitų funkcijų netiesiškumo efektą. Svarbu nustatyti, kokiomis sąlygomis darbo laikas skiriasi.

    Koreliacija

    Kitas patikrinimas yra vizualizuoti koreliaciją tarp kintamųjų. Faktoriaus lygio tipą konvertuojate į skaitinį, kad galėtumėte sudaryti šilumos žemėlapį, kuriame yra koreliacijos koeficientas, apskaičiuotas naudojant Spearman metodą.

    • data.frame(lapply(recast_data,as.integer)): konvertuoti duomenis į skaitinius
    • ggcorr() nubraižykite šilumos žemėlapį šiais argumentais:
      • Metodas: Koreliacijos skaičiavimo metodas
      • npertraukos = 6: pertraukų skaičius
      • hjust = 0,8: Valdykite kintamojo pavadinimo vietą diagramoje
      • etiketė = TRUE: pridėkite etiketes langų centre
      • label_size = 3: dydžio etiketės
      • spalva = "grey50"): etiketės spalva

      5 žingsnis) Treniruotės/bandymo rinkinys

      Bet kuriai prižiūrimai mašininio mokymosi užduočiai reikia padalyti duomenis į traukinio rinkinį ir bandomąjį rinkinį. Galite naudoti „funkciją“, kurią sukūrėte kitose prižiūrimose mokymo programose, kad sukurtumėte mokymų / bandymų rinkinį.

      6 veiksmas) Sukurkite modelį

      Norėdami pamatyti, kaip veikia algoritmas, naudokite paketą glm(). The Apibendrintas tiesinis modelis yra modelių kolekcija. Pagrindinė sintaksė yra tokia:

      Esate pasiruošę įvertinti logistikos modelį, kad padalytų pajamų lygį tarp funkcijų rinkinio.

      • AIC (Akaike Information Criteria): Tai atitikmuo R2 logistinėje regresijoje. Jis matuoja tinkamumą, kai parametrų skaičiui taikoma bauda. Mažesnis AIC reikšmės rodo, kad modelis yra arčiau tiesos.
      • Nulinis nuokrypis: tinka modeliui tik su pertrauka. Laisvės laipsnis yra n-1. Galime jį interpretuoti kaip Chi kvadrato reikšmę (pritaikyta vertė skiriasi nuo tikrosios vertės hipotezės testavimo).
      • Likutinis nuokrypis: modelis su visais kintamaisiais. Jis taip pat interpretuojamas kaip chi kvadrato hipotezės tikrinimas.
      • Fisher Scoring iteracijų skaičius: iteracijų skaičius prieš konvergavimą.

      Funkcijos glm() išvestis saugoma sąraše. Toliau pateiktame kode rodomi visi elementai, esantys logit kintamajame, kurį sukūrėme logistinei regresijai įvertinti.

      # Sąrašas labai ilgas, spausdinkite tik pirmus tris elementus

      Kiekvieną reikšmę galima išgauti naudojant $ ženklą, po kurio nurodomas metrikos pavadinimas. Pavyzdžiui, jūs išsaugojote modelį kaip logit. Norėdami išgauti AIC kriterijus, naudokite:

      7 veiksmas) Įvertinkite modelio veikimą

      Sumišimo matrica

      The painiavos matrica yra geresnis pasirinkimas vertinant klasifikavimo našumą, palyginti su įvairia metrika, kurią matėte anksčiau. Bendra idėja yra suskaičiuoti, kiek kartų tikri atvejai klasifikuojami kaip klaidingi.

      Norėdami apskaičiuoti painiavos matricą, pirmiausia turite turėti prognozių rinkinį, kad jas būtų galima palyginti su faktiniais tikslais.

      • numatyti(logit,duomenų_testas, tipas = 'atsakymas'): apskaičiuokite numatymą bandymų rinkinyje. Nustatykite tipą = 'atsakymas', kad apskaičiuotumėte atsakymo tikimybę.
      • lentelė(duomenų_testas$pajamos, prognozuoti > 0,5): apskaičiuokite painiavos matricą. numatyti > 0,5 reiškia, kad grąžinama 1, jei numatoma tikimybė didesnė nei 0,5, kitu atveju 0.

      Kiekviena painiavos matricos eilutė žymi tikrąjį tikslą, o kiekvienas stulpelis – numatomą tikslą. Pirmoje šios matricos eilutėje nurodytos mažesnės nei 50 000 pajamos (klaidinga klasė): 6241 buvo teisingai priskirti asmenims, kurių pajamos mažesnės nei 50 tūkst.Tikras neigiamas), o likusi dalis buvo klaidingai klasifikuota kaip didesnė nei 50 tūkst.Klaidingai teigiamas). Antroje eilutėje nurodytos pajamos, viršijančios 50 tūkst., teigiama klasė buvo 1229 (Tikrai teigiamas), kol Tikras neigiamas buvo 1074.

      Galite apskaičiuoti modelį tikslumu susumavus tikrą teigiamą + tikrąjį neigiamą bendrą stebėjimą

      Atrodo, kad modelis kenčia nuo vienos problemos – jis pervertina klaidingų neigiamų skaičių. Tai vadinama tikslumo testo paradoksas. Teigėme, kad tikslumas yra teisingų prognozių ir bendro atvejų skaičiaus santykis. Galime turėti gana didelį tikslumą, bet nenaudingą modelį. Taip atsitinka, kai yra dominuojanti klasė. Jei pažvelgsite atgal į painiavos matricą, pamatysite, kad dauguma atvejų yra klasifikuojami kaip tikrai neigiami. Dabar įsivaizduokite, kad modelis visas klases klasifikavo kaip neigiamas (ty žemesnes nei 50 tūkst.). Turėtumėte 75 procentų tikslumą (6718/6718+2257). Jūsų modelis veikia geriau, tačiau jam sunku atskirti tikrąjį teigiamą nuo tikro neigiamo.

      Tikslumas vs prisiminimas

      Tikslumas žiūri į teigiamos prognozės tikslumą. Prisiminkite yra teigiamų atvejų, kuriuos teisingai nustato klasifikatorius, santykis

      • mat[1,1]: grąžina pirmąjį duomenų rėmelio pirmojo stulpelio langelį, t. y. tikrą teigiamą.
      • mat[1,2] Grąžina pirmąjį duomenų rėmelio antrojo stulpelio langelį, t. y. klaidingai teigiamą
      • mat[1,1]: grąžina pirmąjį duomenų rėmelio pirmojo stulpelio langelį, t. y. tikrą teigiamą.
      • mat[2,1] Grąžina pirmąjį duomenų rėmelio stulpelio antrą langelį, t. y. klaidingai neigiamą

      Galite išbandyti savo funkcijas

      Kai modelis sako, kad tai yra vyresnis nei 50 000 asmuo, tai teisinga tik 54 procentais atvejų, o 72 procentais atvejų gali pretenduoti į vyresnius nei 50 tūkst.

      Galite sukurti /> balą pagal tikslumą ir prisiminimą. /> yra harmoningas šių dviejų metrikų vidurkis, o tai reiškia, kad ji suteikia daugiau svorio mažesnėms reikšmėms.

      Precision vs Recall kompromisas

      Neįmanoma turėti ir didelio tikslumo, ir didelio prisiminimo.

      • Įsivaizduokite, jums reikia numatyti, ar pacientas serga liga. Norite būti kuo tikslesni.
      • Jei jums reikia aptikti galimus sukčiavimus gatvėje naudojant veido atpažinimą, geriau būtų sugauti daug žmonių, pažymėtų kaip sukčiai, net jei tikslumas yra mažas. Neapgaulę asmenį policija galės paleisti.

      ROC kreivė

      The Imtuvo veikimo charakteristika kreivė yra dar vienas įprastas įrankis, naudojamas dvejetainei klasifikacijai. Ji labai panaši į tikslumo/atsišaukimo kreivę, tačiau užuot nubrėžusi tikslumą ir atšaukimą, ROC kreivė rodo tikrąjį teigiamą rodiklį (t. y. atšaukimą), palyginti su klaidingai teigiamu rodikliu. Klaidingai teigiamų atvejų rodiklis yra neigiamų atvejų, kurie neteisingai klasifikuojami kaip teigiami, santykis. Jis lygus vienetui atėmus tikrą neigiamą normą. Tikrasis neigiamas kursas taip pat vadinamas specifiškumas. Taigi ROC kreivės brėžiniai jautrumas (atsišaukimas) prieš 1 specifiškumą

      Norėdami nubrėžti ROC kreivę, turime įdiegti biblioteką pavadinimu RORC. Galime rasti Conda bibliotekoje. Galite įvesti kodą:

      conda install -c r r-rocr --yes

      Galime nubraižyti ROC su prognozės () ir performance () funkcijomis.

      • prognozė(numatymas, duomenų_testas$pajamos): ROCR biblioteka turi sukurti numatymo objektą, kad pakeistų įvesties duomenis
      • našumas (ROCRpred, 'tpr', 'fpr'): grąžinkite du derinius, kuriuos norite sukurti diagramoje. Čia sukonstruoti tpr ir fpr. Nubraižykite tiksliai ir prisiminkite kartu, naudokite „prec“, „rec“.

      8 veiksmas) Pagerinkite modelį

      Norėdami palyginti abu modelius, turite naudoti balų testą

      Rezultatas yra šiek tiek didesnis nei ankstesnis. Galite toliau dirbti su duomenimis ir pabandyti įveikti rezultatą.


      Palaikykite vektoriniu mašininiu mokymusi pagrįstą fMRI duomenų grupių analizę ☆

      Norint ištirti daugiamatį fMRI duomenų pobūdį ir atsižvelgti į smegenų atsako skirtumus tarp subjektų, iš esmės reikalingas daugiamatis ir smegenų atsako modelio neturintis metodas. Šiame darbe pateikiami du tokie metodai, integruojant mašininio mokymosi algoritmą, paramos vektorių mašiną (SVM) ir atsitiktinio efekto modelį. Be jokio smegenų atsako modeliavimo, SVM buvo naudojamas išgauti visą smegenų erdvinės diskriminacijos žemėlapį (SDM), atspindintį smegenų atsako skirtumą tarp kontrastingų eksperimentinių sąlygų. Po to populiacijos išvados buvo padarytos atliekant atsitiktinio poveikio analizę (RFX) arba permutacijos testą (PMU) atskiriems tiriamiesiems & #x27 SDM. Taikant arterijų sukimosi žymėjimo (ASL) perfuzijos fMRI duomenims, SDM RFX davė mažesnį klaidingų teigiamų rezultatų skaičių atliekant nulinės hipotezės testą ir didesnį aptikimo jautrumą sintetiniams aktyvinimams su įvairaus klasterio dydžiu ir aktyvavimo stiprumu, palyginti su vienmačiu bendruoju tiesiniu modeliu (GLM). pagrįstas RFX. Atliekant jutiminio-motorinio ASL fMRI tyrimą, tiek SDM RFX, tiek SDM PMU davė panašius aktyvavimo modelius atitinkamai kaip GLM RFX ir GLM PMU, bet su didesniu t reikšmės ir klasterių plėtiniai tame pačiame reikšmingumo lygyje. Atsižvelgiant į tai, kad ASL duomenyse nėra laiko triukšmo koreliacijos, šis tyrimas taip pat įtraukė PMU į individualaus lygio GLM ir SVM analizes kartu su grupės lygio analize per RFX arba grupės lygio PMU. Teikiant išvadas apie tikimybę, kad jis bus suaktyvintas arba išjungtas kiekviename vokselyje, šie individualaus lygio PMU pagrįsti grupės analizės metodai gali būti naudojami GLM RFX, SDM RFX arba SDM PMU analizės rezultatams nustatyti.


      Nepriklausoma vektorių analizė (IVA): daugiamatis metodas fMRI grupės tyrimui

      Nepriklausoma fMRI duomenų komponentų analizė (ICA) sukuria seanso / atskiro specifinio smegenų aktyvavimo žemėlapius be a priori prielaidų dėl nuo kraujo deguonies lygio priklausančių (BOLD) signalų atsakų laiko ar modelio. Tačiau dėl atsitiktinės išvesties komponentų permutacijos ICA nepasiūlo aiškaus sprendimo, kaip padaryti išvadą apie aktyvavimą grupės lygiu. Šiame tyrime pristatome nepriklausomą vektorinės analizės (IVA) metodą, skirtą permutacijos problemai išspręsti atliekant fMRI grupės duomenų analizę. Palyginti su ICA, IVA siūlo papildomų priklausomų komponentų, kurie buvo priskirti naudoti automatizuotai grupuojant priklausomus aktyvavimo modelius tarp tiriamųjų, analizę. Atlikus testavimą naudojant imituotus bandymus pagrįstus fMRI duomenis, mūsų siūlomas metodas buvo pritaikytas tikriems fMRI duomenims, naudojant tiek vieno bandymo užduoties paradigmą (dešinės rankos variklio suspaudimo ir vidinės kalbos generavimo užduotys), tiek trijų bandymų užduočių paradigmą (dešinė ranka). motorinių vaizdų užduotis). Apibendrintas tiesinis modelis (GLM) ir fMRI įrankių rinkinio (GIFT) grupė ICA taip pat buvo pritaikyti tam pačiam duomenų rinkiniui, kad būtų galima palyginti su IVA. Palyginti su GLM, IVA sėkmingai užfiksavo aktyvacijos modelius net tada, kai funkcinėse srityse buvo kintamas hemodinaminis atsakas, kuris nukrypo nuo hipotetinio atsako. Mes taip pat parodėme, kad IVA veiksmingai išvedė nežinomos kilmės grupių aktyvinimo modelius, nereikalaujant išankstinio apdorojimo etapo (pvz., duomenų sujungimo ICA pagrįstoje GIFT). IVA gali būti naudojama kaip galima alternatyva arba priedas prie dabartinių ICA pagrįstų fMRI grupės apdorojimo metodų.


      1.4 Kintamojo pasirinkimas

      Kintamojo pasirinkimas GLM modeliui yra panašus į OLS modelio procesą. Pirmenybė teikiama įdėtiesiems modelio testams koeficiento reikšmingumui nustatyti, o ne Waldo koeficientų testui. Taip yra dėl to, kad GLM koeficientų standartinės paklaidos yra jautrios net nedideliems nukrypimams nuo modelio prielaidų.Taip pat tiksliau gauti GLM koeficientų p vertes iš įdėto modelio testų.

      Tikimybės koeficiento testas (LRT) paprastai naudojamas įdėtiesiems modeliams išbandyti. Kvazišeimos modeliams F testas naudojamas įdėtųjų modelių testams (arba kai tinkamumas yra per daug arba nepakankamai išsklaidytas). Šis F statistikos naudojimas yra tinkamas, jei grupių dydžiai yra maždaug vienodi.

      Kurį kintamąjį pasirinkti modeliui, gali priklausyti nuo modelyje naudojamos šeimos. Tokiais atvejais kintamoji atranka yra susijusi su šeimos atranka. Kintamieji atrankos kriterijai, tokie kaip AIC ir BIC, paprastai netaikomi renkantis tarp šeimų.


      Rezultatai

      Veido dekodavimas ir rekonstrukcija

      Smegenų dekodavimo sistemai išmokyti naudojome iš anksto paruoštą VAE-GAN modelį, aprašytą 1 pav. (su „užšaldytais“ parametrais). Treniruotės metu (2a pav.) sistema išmoko atitiktį tarp smegenų veiklos modelių, reaguodama į daugybę veido vaizdų ir atitinkamą 1024-D latentinį tų pačių veidų atvaizdavimą VAE tinkle. Vidutiniškai buvo panaudota daugiau nei 8000 skirtingų pavyzdžių (diapazonas tarp dalykų: 7664–8626), kurie apėmė 12 valandų nuskaitymą per aštuonias atskiras kiekvieno dalyko sesijas. Mokymosi procedūroje buvo daroma prielaida, kad kiekvieno smegenų vokselio aktyvavimas gali būti apibūdintas kaip svertinė 1024 latentinių parametrų suma, ir mes tiesiog įvertinome atitinkamus svorius tiesine regresija (GLM funkcija SPM žr. Metodus). Po treniruotės (2b pav.) tiesinę sistemą apvertėme taip, kad dekoderiui būtų suteiktas subjekto, žiūrinčio konkretų, naują veido vaizdą (veidą, kuris nebuvo įtrauktas į treniruočių rinkinį), smegenų modelis. išvestis buvo to veido 1024 matmenų latentinės funkcijos vektoriaus įvertinimas. Tada veido vaizdas buvo sukurtas (arba „atkurtas“) per generatyvinį (VAE – GAN) neuroninį tinklą.

      Veido vaizdų smegenų dekodavimas, pagrįstas VAE-GAN latentiniais vaizdais. a Treniruotės etapas. Kiekvienas subjektas matė

      8000 veidų (kiekvienas po vieną pristatymą) greitai su įvykiu susijusiame dizaine. Tie patys veido vaizdai taip pat buvo paleisti per „Encoder“ tinklą (kaip aprašyta 1 pav.) arba PCA skaidymu, kad būtų gautas 1024 matmenų latentinis veido aprašymas. „Smegenų dekoderis“ buvo paprasta tiesinė regresija, išmokyta susieti 1024 matmenų latentinį vektorių su atitinkamu smegenų atsako modeliu. Ši tiesinė regresija su 1024 parametriniais BOLD signalo regresoriais (ir papildomu pastoviu „šališkumo“ terminu) sukūrė svorio matricą W (1025 m nvokseliai matmenys), optimizuotas nuspėti smegenų modelius reaguojant į veido dirgiklius. b Bandymo etapas. Tiriamiesiems taip pat pristatėme 20 skirtingų „bandomųjų“ veidų (nepriklauso nuo mokymo rinkinio bent 45 atsitiktinai persipynusių pristatymų). Gauti smegenų veiklos modeliai buvo tiesiog padauginti iš perkeltos svorio matricos W T (nvokseliai pagal 1025 matmenis) ir jos atvirkštinės kovariacijos matricą, kad būtų gautas tiesinis latentinio paviršiaus matmenų įvertinimas. Tada buvo pritaikytas generatoriaus tinklas (1a pav.) arba atvirkštinė PCA transformacija, kad numatomas latentinis vektorius būtų paverstas rekonstruotu veido vaizdu.

      Šio gilaus neuroninio tinklo modelio rezultatus palyginome su rezultatais, gautais naudojant kitą, paprastesnį veido vaizdo skaidymo modelį: pagrindinių komponentų analizę (PCA, išlaikant tik pirmuosius 1024 pagrindinius komponentus iš mokymo duomenų rinkinio, žr. 1 papildomą pav.). PCA modelis taip pat aprašo kiekvieną veidą vektoriumi 1024 matmenų latentinėje erdvėje ir taip pat gali būti naudojamas rekonstruoti veidus remiantis šio 1024-D požymių vektoriaus įvertinimu, kaip parodyta naujausiuose tyrimuose 13, 14 .

      Tiek giliojo neuroninio tinklo, tiek PCA pagrįstų modelių atveju mes apibrėžėme pilkosios medžiagos vokselių poaibį kaip mūsų „domėjimosi regioną“ (ROI). Iš tiesų, daugelis smegenų dalių atlieka skaičiavimus, nesusijusius su veido apdorojimu arba atpažinimu, patekus į tokius regionus mūsų analizėje, neigiamai paveiktų signalo ir triukšmo perdavimą. Mūsų atrankos kriterijus apjungė du veiksnius: i) tikimasi, kad vokseliai reaguos į veido dirgiklius (kaip nustatyta t bandymas tarp veido ir bazinės būklės, ty tuščio ekrano fiksavimas), ir (ii) tikimasi, kad paaiškinta BOLD atsako dispersija pagerės, kai 1024 latentinės veido savybės buvo įvestos kaip regresoriai tiesiniame modelyje (palyginti su bazinis modelis su tik dvejetainiu veido regresoriumi: veidas yra / nėra). Vokselių pasiskirstymas pagal šiuos du matmenis ir atitinkamas atrankos kriterijus yra iliustruotas vienam reprezentatyviam subjektui 2 papildomame paveikslėlyje. Visuose keturiuose subjektuose gautų vokselių skaičius atrankoje buvo

      100 000 (vidurkis: 106 612 diapazonas: 74 388–162 388). Pasirinkti vokseliai pavaizduoti 3 pav. Jie apima pakaušio, laiko, parietalinę ir priekinę sritis. Buvo atliktas atskiras pasirinkimas pagal PCA veido parametrus ir naudojamas PCA pagrįstam „smegenų dekoderiui“ (vidutinis pasirinktų vokselių skaičius: 106 685 diapazonas: 74 073–164 524), pasirinktos sritys buvo beveik identiškos abiem modeliams. Svarbu pabrėžti, kad aukščiau pateikti vokselių atrankos kriterijai buvo taikomi remiantis BOLD atsakymais tik mokomiesiems veido vaizdams, bet ne 20 bandomųjų vaizdų, todėl dekodavimo analizė neturi „apvalaus samprotavimo“ problemų, kurias sukelia šis vokselių pasirinkimas. 16 .

      Vokseliai, parinkti smegenų dekodavimui. Smegenų dekoderio mokymo etape vokseliai buvo atrinkti atsižvelgiant į jų vizualinį reagavimą ir jų GLM tinkamumą (2a pav.). Spalvos kodas (nuo raudonos iki geltonos) nurodo tiriamųjų skaičių (1–4), kuriems buvo pasirinktas kiekvienas konkretus vokselis. Spalvotos linijos rodo standartinių žievės sričių ribas 43

      Atkurtų veido vaizdų pavyzdžiai iš kiekvieno iš keturių tiriamųjų bandomųjų vaizdų rinkinio parodyti 4a pav. Nors tiek VAE-GAN, tiek PCA modeliai galėjo atkurti priimtiną originalių veidų panašumą, vaizdai, atkurti iš gilaus generacinio neuroninio tinklo (VAE-GAN), atrodo tikroviškesni ir artimesni pradiniam vaizdui. Kiekybiškai įvertinome savo smegenų dekodavimo sistemos veikimą, koreliuodami smegenyse įvertintus latentinius 20 bandomųjų veidų vektorius su 20 faktinių vektorių, ir naudojome porines koreliacijos reikšmes, kad išmatuotų teisingos klasifikacijos procentą. Kiekvienam tiriamajam, kiekvienam iš 20 bandomųjų veidų, palyginome dekoduotą 1024-D vektorių su pagrindinio tiesos vektoriumi iš tikrojo bandomojo vaizdo ir su kito bandomojo vaizdo (distraktoriumi): smegenų dekodavimas buvo „teisingas“, jei koreliacija su tikruoju tiksliniu vektoriumi buvo didesnė nei su distraktoriaus vektoriumi. Tai buvo pakartota visoms (20 × 19) bandomųjų vaizdų poroms, o vidutinis našumas, palyginti su atsitiktinumu (50%), naudojant neparametrinį Monte-Carlo testą (žr. Metodai: statistika). GAN modelio rekonstrukcijos pasiekė 95,5% klasifikaciją (diapazonas: 91,3–98,7%, visi p < 10 −6 ), o PCA modelis pasiekė tik 87,5 % (diapazonas 76,6–92,4 %, vis tiek gerokai viršija tikimybę). p < 10 –4 , bet daug mažesnis už GAN modelį, Friedmano neparametrinis testas, χ 2 (1) = 4, p < 0,05). Taip pat išbandėme smegenų dekoderio gebėjimą iš 20 bandomųjų veidų pasirinkti tikslų teisingą veidą: ši „visiško atpažinimo“ užduotis buvo laikoma teisinga tada ir tik tada, kai rekonstruotas latentinis vektorius buvo labiau koreliuojamas su tikruoju tiksliniu vektoriumi nei su visais 19 distraktorių vektorių. Tai yra griežtesnis veido atpažinimo testas, kurio tikimybė yra 5 %: VAE–GAN modelis pasiekė 65 % teisingą rezultatą (diapazonas: 40–75%, dvinario testas, visi p < 10 -6 ), o PCA modelis leido tik 41,25 % teisingo atpažinimo (diapazonas 25–50 %, visi p < 10 -3), VAE-GAN modelio našumas buvo žymiai didesnis nei PCA (χ 2 (1) = 4, p < 0,05).

      Veido rekonstrukcija. a Rekonstruotų veido vaizdų pavyzdžiai. Kiekvienam iš mūsų keturių tiriamųjų (S1–4) pirmame stulpelyje rodomi keturi pavyzdiniai veidai (du vyrai ir dvi moterys, pasirinktos iš 20 bandomųjų veidų), iš tikrųjų rodomi tiriamajam per nuskaitymo seansus. Kiti du stulpeliai yra veido rekonstrukcijos, pagrįstos atitinkamais smegenų dekodavimo sistemos fMRI aktyvinimo modeliais, apmokytais naudojant VAE – GAN latentinę erdvę (vidurinis stulpelis) arba PCA skaidymą (dešinysis stulpelis). b Porinis atpažinimas. Smegenų dekodavimo kokybė buvo kiekybiškai įvertinta naudojant porų modelių klasifikaciją (veikiant latentinio vektoriaus įverčiais), o vidutinis našumas lyginamas su atsitiktinumu (50%). Smegenų dekodavimas iš VAE–GAN modelio pasiekė vidutiniškai 95,5 % teisingą veikimą (p < 10 -6), PCA modelis tik 87,5% (p < 10 −4 ) skirtumas tarp dviejų modelių buvo reikšmingas (χ 2 (1) = 4, p < 0,05). c Visiškas pripažinimas. Taip pat buvo taikomas griežtesnis veikimo kriterijus, pagal kurį dekodavimas buvo laikomas teisingu tada ir tik tada, kai procedūra nustatė tikslų tikslinį veidą iš visų 20 bandomųjų veidų (tikimybė = 5%). Vėlgi, VAE–GAN modelio našumas (65 %) buvo daug didesnis už galimybę (p < 10 −6 ), ir pralenkė (χ 2 (1) = 4, p < 0,05) PCA modelis (41,25 proc. p < 10–3)

      Kadangi tiesinės regresijos modeliams paprastai reikia daug daugiau duomenų pavyzdžių nei jų įvesties matmenys, iš pradžių nusprendėme apmokyti smegenų dekodavimo sistemą

      8000 veidų vienam subjektui (palyginti su 1024 latentiniais matmenimis). Norėdami nustatyti, ar gali pakakti mažesnių treniruočių rinkinių, pakartojome tiesinės regresijos žingsnį (apskaičiavimas W 2a pav.), naudojant tik pusę, ketvirtadalį arba aštuntąją mokymo duomenų rinkinio (žr. papildomą 3 pav.). Tiek porinių, tiek visiško atpažinimo priemonių atveju jau galima pasiekti didesnį našumą

      1000 treniruočių veidų, tačiau dekodavimo našumas augo, nes buvo didinamas treniruočių rinkinio dydis ir buvo didžiausias

      8000 treniruočių veidų. Svarbu tai, kad PCA modelis liko mažesnis už VAE – GAN modelį visiems treniruočių rinkinių dydžiams.

      Šie palyginimai rodo, kad lengviau ir efektyviau sukurti linijinį atvaizdavimą iš žmogaus smegenų aktyvavimo į VAE – GAN latentinę erdvę nei į PCA erdvę. Tai suderinama su mūsų hipoteze, kad gilusis generacinis neuroninis tinklas yra labiau panašus į žmogaus veido vaizdų erdvę. Be to, šis klasifikavimo tikslumas čia buvo matuojamas pagal atstumą (arba vektorinę koreliaciją) kiekvieno modelio latentinėje erdvėje, netgi gali būti, kad skirtumas tarp dviejų modelių gali padidėti, jei jų tikslumas būtų įvertintas naudojant bendrą metriką, pvz. kaip atkurtų vaizdų suvokimo kokybė. Norėdami paremti šią idėją, paprašėme naivių žmonių stebėtojų palyginti dviem modeliais rekonstruotų veidų kokybę: kiekvienas originalus bandomasis vaizdas iš kiekvieno iš keturių tiriamųjų buvo parodytas kartu su atitinkamomis VAE – GAN ir PCA rekonstrukcijomis, stebėtojas nusprendė, kuri rekonstrukcija buvo suvokimu panašesnis į originalą. Kiekviena pora iš viso buvo įvertinta 15 kartų, mažiausiai 10 skirtingų dalyvių, mažiausiai penki dalyviai matė dvi atsakymo parinktis bet kuria tvarka, pirmiausia VAE–GAN arba PCA. VAE-GAN rekonstrukcija buvo pasirinkta 76,1% tyrimų, o PCA rekonstrukcija tik 23,9% tyrimų. Tai reiškia, kad stebėtojai tris kartus labiau teikė pirmenybę VAE-GAN rekonstruotų veidų kokybei nei PCA rekonstrukcijoms, o tai buvo mažai tikėtina, kad jis atsiras atsitiktinai (binominis testas, 1200 stebėjimų, p < 10 −10).

      Įnašai iš skirtingų smegenų regionų

      Norėdami nustatyti, kurie smegenų regionai labiausiai prisidėjo prie dviejų smegenų dekodavimo modelių veido atkūrimo gebėjimų, kiekvienam subjektui suskirstėme vokselių pasirinkimą į tris vienodo dydžio pogrupius, kaip parodyta 5a pav. Tada šiems trims pogrupiams buvo taikoma smegenų dekodavimo ir veido atkūrimo procedūra. Porinio atpažinimo rezultatai atskleidė, kad pakaušio vokseliai ir kiek mažiau laiko vokseliai suteikė didžiąją dalį smegenų dekodavimui reikalingos informacijos (5b pav.). Abiejų modelių pakaušio vokselių dekodavimo našumas buvo daug didesnis nei tikimybė (50 %) (VAE–GAN: 91,8 %, visi individualūs p < 10 −6 PCA: 87,2%, visi p < 10 −4 ), ir panašiai laikiniesiems voksiams (VAE–GAN: 78,8%, visi p < 10 −3 PCA: 73,6%, visi p < 0,01). Kita vertus, nors frontoparietaliniai vokseliai atitiko mūsų atrankos kriterijus (žr. 3 pav.), patys jie neturėjo pakankamai patikimos informacijos, kad būtų galima tiksliai klasifikuoti (VAE–GAN: 60,1%, vienas tiriamasis su p < 10 −6 , visa kita p > 0,2 PCA: 56,4%, vienas tiriamasis su p < 10 −6 , visa kita p > 0,05, tačiau žr. Lee ir kt. 14). Rezultatų modelis buvo identiškas tiek VAE-GAN, tiek PCA pagrįsto dekodavimo modeliams: neparametrinis Friedmano testas parodė, kad našumas skyrėsi trijuose pogrupiuose (VAE-GAN: χ 2 (2) = 8, p < 0,02 PCA: χ 2 (2) = 6.5, p < 0,04), o post hoc testai atskleidė, kad pakaušio vokseliai veikė žymiai geriau nei frontoparietaliniai, o laikinieji vokseliai yra tarp jų (nelabai skiriasi nuo kitų dviejų). Visuose vokselių pasirinkimuose PCA visada davė mažesnį tikslumą nei VAE-GAN, nors šis skirtumas nepasiekė statistinio reikšmingumo, atsižvelgiant į ribotą dalykų skaičių (visuose trijuose vokselių pasirinkimuose, χ 2 (1) ≥ 3, p > 0,08).

      Įnašai iš skirtingų smegenų regionų. a Vokselių segmentavimo procedūra. Norėdami ištirti smegenų sritis, kurios labiausiai palaikė mūsų smegenų dekodavimo našumą, tuo pačiu išlaikant palyginamus skirtingus pogrupius, tiesiškai atskyrėme savo vokselių pasirinkimą į tris vienodo dydžio pogrupius. Pirma, 1/3 daugumos užpakalinių vokselių kiekvienam tiriamajam buvo pažymėti kaip „pakaušis“. Tarp likusių vokselių labiau rostralinė pusė (1/3 pradinio skaičiaus) buvo pažymėta kaip „laikinė“, o likusi uodeginė pusė kaip „frontoparietal“. Šis trijų krypčių segmentavimas, skirtingas kiekvienam subjektui, buvo pasirinktas, nes mūsų smegenų dekodavimo procedūra yra labai jautri įtrauktų vokselių skaičiui. b Porinis atpažinimo našumas skirtingiems dominantiems regionams. Visas pasirinkimas susijęs su vokselių rinkiniu, pavaizduotu 3 pav., tai yra tie patys duomenys kaip ir 4b pav., apskaičiuojant subjektų vidurkį (klaidų juostos atspindi standartinę vidurkio paklaidą). Apskritimai rodo atskirų dalykų rezultatus. Taškinė linija yra p < 0,05 reikšmingumo riba atskirų dalykų rezultatams. Tarp trijų pogrupių ir VAE-GAN, ir PCA modelių našumas yra didžiausias pakaušio vokseliais, po kurių seka laiko vokseliai. Frontoparietaliniai vokseliai patys savaime nepalaiko didesnio našumo (išskyrus vieną iš keturių tiriamųjų). Visais atvejais VAE-GAN modelio našumas išlieka aukštesnis nei PCA modelio

      Norėdami dar labiau atskirti santykinį trijų smegenų regionų indėlį į smegenų dekodavimo veikimą, taip pat taikėme dispersijos padalijimo metodą (papildomas 4 pav.). Suderinami su 5b pav. jau aprašytais rezultatais, mes nustatėme, kad latentinio vektoriaus prognozės, gautos iš pakaušio vokselių, sudarė didžiausią atitinkamų pagrindinio tiesos latentinių vektorių dispersijos dalį, po to seka laiko vokseliai ir galiausiai frontoparietaliniai vokseliai. Kiekviena iš trijų sričių taip pat turėjo unikalų, nepriklausomą indėlį į paaiškintą dispersiją, kuri VAE-GAN buvo daug didesnė nei PCA modelio. Tai yra, nors pakaušio vokseliai suteikė tiksliausias rekonstrukcijas, laikinieji vokseliai ne tik perteikė perteklinę informaciją.

      Galimos programos: lyties dekodavimas kaip pavyzdys

      Išmoktas smegenų aktyvavimo modelių ir giluminio generatyvinio neuroninio tinklo latentinės erdvės (t. y. matricos) atvaizdavimas W 2a pav.) gali būti galinga priemonė žmogaus smegenims veidų vaizdui tirti, nebūtinai atlikti brangių papildomų eksperimentų. Pavyzdžiui, paprastas pritaikymas galėtų būti bet kurio smegenų vokselio ar ROI veido bruožų selektyvumo vizualizavimas. Vokselis arba ROI apibrėžia stulpelių poaibį W matrica (2 pav.), kiekviename stulpelyje saugomas latentinis vektorius, atspindintis vokselio veido selektyvumą. Tiesiog paleidus šį latentinį vektorių (arba jo vidurkį per ROI) į veido generatoriaus tinklą, vokselio arba ROI selektyvumas gali būti atskleistas kaip tikras veido vaizdas.

      Kitas išplėtimas būtų ištirti elgsenai svarbių veido bruožų, tokių kaip lytis, rasė, emocijos ar amžius, smegenyse. Bet kuri tokia veido savybė gali būti išreikšta kaip latentinis vektorius, kurį galima lengvai apskaičiuoti remiantis daugybe pažymėtų veidų pavyzdžių (atimant vidutinį latentinį vektorių veidams be atributo etiketės iš vidutinio latentinio vektoriaus veidams su etikete, žr. 1b latentinių vektorių, apskaičiuotų su veidais su etikete „šypsena“ arba „vyriška“ etikete, pavyzdžiai). Mūsų eksperimentuose naudojamas viešai prieinamas įžymybių veidų duomenų rinkinys (CelebA 17 ) jau yra susietas su 40 tokių etikečių, apibūdinančių lytį, išraiškas, odos ar plaukų spalvą ir daugybę kitų kiekvieno veido savybių. Atkreipkite dėmesį, kad šios 40 dvejetainių etikečių (ypatybės yra / nėra) buvo surinktos naudojant rankinę anotacijos procedūrą kiekvienam veido duomenų rinkinio veido stimului ir buvo parinktos taip, kad atspindėtų duomenų rinkinio kintamumą. Atsižvelgdami į latentinį vektorių, apibūdinantį tokią veido savybę, galime naudoti smegenų dekodavimo modelį, kad išsiaiškintume, kurie smegenų vokseliai yra jautriausi susijusiai veido savybei. Ši procedūra iliustruota papildomame 5 paveiksle, kuriame pateikiamas „lyties“ požymio („vyro“ etiketė) pavyzdys. Vokseliai, jautriausi šiai veido savybei, atkuriami apskaičiuojant matricos koreliaciją pagal stulpelius W su „vyrišku“ latentiniu vektoriumi: pagal lytį selektyvūs vokseliai turi turėti stipriai teigiamas arba stipriai neigiamas koreliacijos reikšmes (priklausomai nuo jų pirmenybės vyriškiems ar moteriškiems veidams). Vokseliai su didžiausia (absoliučia verte) koreliacija randami pakaušio ir laiko srityse, ypač tiek ankstyvose regėjimo srityse, tiek fusiforminėje žievėje (papildomas 5 pav.), atitinkantis ankstesnę ataskaitą apie paskirstytą lyčių informacijos pateikimą 6 .

      Galiausiai, kitas būdas ištirti konkretaus veido atributo vaizdą smegenyse yra sukurti paprastą klasifikatorių, pagal kurį būtų galima pažymėti smegenų dekoduotus latentinius vektorius pagal šią veido savybę. Tai iliustruota 6 pav., vėlgi, „lyties“ veido atributo pavyzdyje. Kiekvienas smegenų dekoduotas latentinis vektorius projektuojamas į latentinės erdvės „lyties“ ašį (6a pav.), o projekcijos ženklas lemia klasifikacijos išvestį („vyras“ – teigiamas, „moteris“ – neigiamas). Šis elementarus klasifikatorius suteikia pakankamai informacijos, kad būtų galima klasifikuoti veido lytį 70 % tikslumu (binominis testas, p = 0,0001 6b pav.). Neparametrinis Friedmano testas rodo, kad lyties dekodavimo našumas skiriasi trijuose vokselių pogrupiuose (χ 2 (2) = 7.6, p < 0,03), o post hoc testas atskleidžia, kad pakaušio vokseliai veikia žymiai geriau nei frontoparietaliniai, o laiko vokseliai yra tarp jų (nelabai skiriasi nuo kitų dviejų). Ankstesni bandymai klasifikuoti veido lytį naudojant kelių vokselių modelio analizę buvo riboti, o didžiausias klasifikavimo tikslumas buvo mažesnis nei 60 % 6,8 . Mūsų paprastas linijinis smegenų dekoderis (6a pav.) jau patobulina šiuos ankstesnius metodus, tačiau vis dar palieka vietos būsimiems patobulinimams, pvz., naudojant galingesnius klasifikavimo metodus (pvz., SVM) smegenų dekoduotuose latentiniuose vektoriuose.

      Lyties dekodavimas. a Pagrindinis linijinis klasifikatorius. Paprastas lyčių klasifikatorius buvo įgyvendintas kaip principo įrodymas. „Lyties“ ašis buvo apskaičiuota atimant vidutinį latentinį 10 000 moterų veidų aprašymą iš vidutinio latentinio 10 000 vyrų veidų aprašymo. Kiekvienas latentinis vektorius buvo tiesiog projektuojamas ant šios „lyties“ ašies, o teigiamos projekcijos buvo klasifikuojamos kaip vyriškos, o neigiamos – kaip moteriškos. b Dekodavimo tikslumas. Pritaikius tikriesiems latentiniams kiekvieno tiriamojo tiriamojo veido vektoriams, šis pagrindinis klasifikatorius buvo 85 % teisingas (diapazonas: 80–90 %). Tai yra klasifikatoriaus lubų našumas, vaizduojamas kaip horizontali pilka sritis (vidurkis ± sem tarp tiriamųjų). Operuojant su latentiniais vektoriais, apskaičiuotais taikant mūsų smegenų dekodavimo procedūrą, tas pats lyties klasifikatorius buvo atliktas 70 % teisingai, gerokai viršijant tikimybę (binominis testas, p = 0,0001 juosta rodo grupės vidutinį tikslumą ± sem tarp tiriamųjų, apskritimai rodo atskirų tiriamųjų veiklą). Lyčių klasifikacija taip pat buvo tiksli, kai analizė buvo apribota pakaušio vokseliais (71,25 proc. p = 0,00005) arba laikinus vokselius (66,25 proc. p < 0,001), bet ne frontoparietaliniai vokseliai (51,25 proc. p = 0,37). Žvaigždės simboliai nurodo grupės lygio reikšmę: ***p < 0,001, **p < 0,01. Taškinė linija yra p < 0,05 reikšmingumo riba atskirų dalykų rezultatams

      Vaizdų dekodavimas

      Norėdami dar labiau parodyti mūsų smegenų dekodavimo metodo universalumą, mes jį pritaikėme kitai žinomai sudėtingai problemai: informacijos apie dirgiklius, kurių subjektas tiesiogiai nepatiria, o tik įsivaizduojamus „proto akimis“, gavimas. Ankstesni tyrimai parodė, kad šią klasifikavimo problemą galima išspręsti, kai skirtingos įsivaizduojamų dirgiklių klasės yra vizualiai savitos 18 , pavyzdžiui, skirtingų kategorijų vaizdai 19, 20, 21, 22, 23, 24 . Tačiau, kiek žinome, anksčiau nebuvo pranešta apie galimybę atskirti labai vizualiai panašius objektus, pvz., skirtingus veidus.

      Prieš eksperimentą kiekvienas tiriamasis pasirinko vieną veidą iš 20 galimų vaizdų rinkinio (skirtingų nuo mokymo ir bandomųjų vaizdų rinkinių). Eksperimento metu jiems buvo liepta įsivaizduoti šį konkretų veidą, kai ekrano viduryje atsirastų didelis pilkas kvadratas (12 sekundžių pristatymas). Šie vaizdų bandymai buvo kartojami vidutiniškai 52 kartus (diapazonas tarp tiriamųjų: 51–55) per fMRI nuskaitymo seansus, kartu su įprastais stimulų pristatymais. Tada vidutinis BOLD atsakas vaizdų metu buvo naudojamas latentiniam veido vektoriui įvertinti (naudojant smegenų dekoderį, pavaizduotą 2b pav.), ir šis vektorius buvo lyginamas su 20 galimų latentinių vektorių poromis, kaip aprašyta anksčiau bandomiesiems vaizdams ( 4b, 5b pav.). Kaip parodyta 7 pav. (taip pat žr. papildomą 6 pav.), porinis dekodavimo našumas nesiskyrė nuo atsitiktinumo (50 %) kiekviename iš mūsų iš anksto nustatytų dominančių regionų (visas pasirinkimas). p = 0,53, pakaušio p = 0,30 arba frontoparietalinės sritys p = 0,43), išskyrus laikinojo vokselio pasirinkimą, kuris davė 84,2 % teisingo dekodavimo (p = 0,012). Neparametrinis Friedmano testas parodė, kad vaizdų dekodavimo našumas skyrėsi trijuose pogrupiuose (χ 2 (2) = 6.5, p < 0,04), o post hoc testas atskleidė, kad laiko vokseliai veikia žymiai geriau nei frontoparietaliniai, o pakaušio vokseliai yra tarp jų (nelabai skiriasi nuo kitų dviejų). Apskritai, laikinieji regionai, bet ne pakaušio ar frontoparietaliniai, gali palaikyti psichinių vaizdų rekonstrukciją. Šis pasirodymas gali atspindėti stiprų laikinųjų smegenų regionų dalyvavimą aukšto lygio veido apdorojime 25, 26, 27 , taip pat psichinių vaizdų pobūdį iš viršaus į apačią 28 . Bet kuriuo atveju galimybė klasifikuoti įsivaizduojamus veidus pagal smegenų reakcijos modelius dar kartą pabrėžia mūsų požiūrio lankstumą ir potencialą.

      Vaizdų dekodavimas. FMRI BOLD atsako modelis, užfiksuotas atliekant psichinius konkretaus veido vaizdus (nematomas ekrane), buvo perduotas per mūsų smegenų dekodavimo sistemą. Gautas apskaičiuotas latentinis vektorius buvo lyginamas su tikruoju vektoriumi ir 19 išblaškančių vektorių poromis. Tik laikinojo vokselio pasirinkimas palaikė didesnio atsitiktinumo vaizdų dekodavimą su 84,2 % teisingu našumu (p = 0,012). Nei pakaušio, nei frontoparietalinės sritys, nei visa vokselio atranka nebuvo atlikta aukščiau atsitiktinumo (visi p > 0,30). Juostos rodo grupės vidutinį tikslumą (± sem tarp tiriamųjų), apskritimai rodo atskirų tiriamųjų veiklą. Žvaigždučių simboliai rodo grupės lygio reikšmę: * už p < 0,05


      Prieiga prie dokumento

      • APA
      • Standartinis
      • Harvardas
      • Vankuveris
      • Autorius
      • BIBTEX
      • UIP

      In: NeuroImage, Vol. 40, Nr. 1, 2008 03 01, p. 86-109.

      Tyrimo rezultatai : Įnašas į žurnalą › Straipsnis › recenzija

      T1 – nepriklausoma vektorių analizė (IVA)

      T2 – daugiamatis metodas fMRI grupės tyrimui

      N1 – Informacija apie finansavimą: šis darbas buvo iš dalies paremtas NIH R01-NS048242 dotacijomis Yoo, SS ir NIH U41RR019703 Jolesz FA.

      N2 – fMRI duomenų nepriklausoma komponentų analizė (ICA) sukuria seanso/individualaus specifinio smegenų aktyvavimo žemėlapius be a priori prielaidų dėl nuo kraujo deguonies lygio priklausomų (BOLD) signalų atsakų laiko ar modelio. Tačiau dėl atsitiktinės išvesties komponentų permutacijos ICA nepasiūlo aiškaus sprendimo, kaip padaryti išvadą apie aktyvavimą grupės lygiu. Šiame tyrime pristatome nepriklausomą vektorinės analizės (IVA) metodą, skirtą permutacijos problemai išspręsti atliekant fMRI grupės duomenų analizę. Palyginti su ICA, IVA siūlo papildomų priklausomų komponentų, kurie buvo priskirti naudoti automatizuojant priklausomų aktyvavimo modelių grupavimą tarp tiriamųjų, analizę. Atlikus testavimą naudojant imituotus bandymų fMRI duomenis, mūsų siūlomas metodas buvo pritaikytas tikriems fMRI duomenims, naudojant tiek vieno bandymo užduoties paradigmą (dešinės rankos variklio suspaudimo ir vidinės kalbos generavimo užduotys), tiek trijų bandymų užduočių paradigmą (dešinėje). motorinių vaizdų užduotis). Apibendrintas tiesinis modelis (GLM) ir fMRI įrankių rinkinio (GIFT) grupė ICA taip pat buvo pritaikyti tam pačiam duomenų rinkiniui, kad būtų galima palyginti su IVA. Palyginti su GLM, IVA sėkmingai užfiksavo aktyvacijos modelius net tada, kai funkcinėse srityse buvo kintamas hemodinaminis atsakas, kuris nukrypo nuo hipotetinio atsako. Mes taip pat parodėme, kad IVA veiksmingai padarė išvadą apie nežinomos kilmės grupių aktyvinimo modelius, nereikalaujant išankstinio apdorojimo etapo (pvz., duomenų sujungimo ICA pagrindu GIFT). IVA gali būti naudojama kaip galima alternatyva arba priedas prie dabartinių ICA pagrįstų fMRI grupės apdorojimo metodų.

      AB – Nepriklausoma fMRI duomenų komponentų analizė (ICA) sukuria seanso/individualaus specifinio smegenų aktyvavimo žemėlapius be a priori prielaidų dėl nuo kraujo deguonies lygio priklausomų (BOLD) signalų atsakų laiko ar modelio. Tačiau dėl atsitiktinės išvesties komponentų permutacijos ICA nepasiūlo aiškaus sprendimo, kaip padaryti išvadą apie aktyvavimą grupės lygiu. Šiame tyrime pristatome nepriklausomą vektorinės analizės (IVA) metodą, skirtą permutacijos problemai išspręsti atliekant fMRI grupės duomenų analizę. Palyginti su ICA, IVA siūlo papildomų priklausomų komponentų, kurie buvo priskirti naudoti automatizuojant priklausomų aktyvavimo modelių grupavimą tarp tiriamųjų, analizę. Atlikus testavimą naudojant imituotus bandymų fMRI duomenis, mūsų siūlomas metodas buvo pritaikytas tikriems fMRI duomenims, naudojant tiek vieno bandymo užduoties paradigmą (dešinės rankos variklio suspaudimo ir vidinės kalbos generavimo užduotys), tiek trijų bandymų užduočių paradigmą (dešinėje). motorinių vaizdų užduotis). Apibendrintas tiesinis modelis (GLM) ir fMRI įrankių rinkinio (GIFT) grupė ICA taip pat buvo pritaikyti tam pačiam duomenų rinkiniui, kad būtų galima palyginti su IVA. Palyginti su GLM, IVA sėkmingai užfiksavo aktyvacijos modelius net tada, kai funkcinėse srityse buvo kintamas hemodinaminis atsakas, kuris nukrypo nuo hipotetinio atsako. Mes taip pat parodėme, kad IVA veiksmingai padarė išvadą apie nežinomos kilmės grupių aktyvinimo modelius, nereikalaujant išankstinio apdorojimo etapo (pvz., duomenų sujungimo ICA pagrindu GIFT). IVA gali būti naudojama kaip galima alternatyva arba priedas prie dabartinių ICA pagrįstų fMRI grupės apdorojimo metodų.