I ’ ve had a ”why and how I transitioned from SPSS to R” post in the works for a while. Halusin korostaa, miten R voi olla hyödyllisempi läpinäkyvässä datavirrassa. Sitten, muutama päivä sitten, vielä yksi ”what’ s better SPSS or R?”Twitterissä syntyi eräänlainen keskustelu. Se muistuttaa p-arvosotia tai jatkuvia frequentist vs bayesilaisia taisteluita, jotka onnistuvat samanaikaisesti turhauttamaan ja kiehtomaan minua. Keskustelussa voi olla jotain hyötyäkin, mutta usein se on vain päiden pullistelua ja muiden tärkeiden asioiden puuttumista.
tämä viesti on kinkkukätinen, Coors-öljyinen yritys mashing together why debating what is the better software is (mostly) important and why there are more important issues to address.
there ’ s something that happens pretty early on learning a programming language like R, eritoten when transitioning from the pointy-clicky, draggy-Droppy-ness of SPSS. Lyhyesti, sinusta alkaa tulla yksi niistä persereiät, jotka rehellisesti ajatellut, että kaikkien pitäisi vain käyttää R, ja alkaa kertoa heille täsmälleen, että. Ehkä niin ei käy kaikille, oletan, että on mukavampia ihmisiä kuin minä. Vähintäänkin tuntuu, että R on jotenkin ”parempi” kuin SPSS.
sitten tapahtuu jotain. Ehkä kollega muistuttaa sinua r: n rajoituksista, jotka johtuvat siitä, että muut käyttävät pelkästään SPSS: ää, tai vietät kokonaisen viikon lausuen kaikkein epäpyhintä kieltä, joka on rajoittunut tietokoneen rasismiin, koska paskomiskoodisi ei tee sitä asiaa, jota sen pitäisi tehdä (minun tarkat sanani ei kauan sitten). Joka tapauksessa alat ymmärtää, ettei tietojenkäsittelyyn ja analysointiin ole olemassa yhden koon ratkaisua. Jotkut työkalut ovat parempia tiettyjä asioita, mutta, jos se toimii niin anna sen toimia ihmisille (vaihtoehtoisesti, älä ole dogmatisti bawbag väittäen yleistä lähestymistapaa).
käytitpä sitten R: ää, SPSS: ää, Pythonia, JASP: tä (shout out to JASP for being amazing), MATLABIA, Exceliä tai mitä tahansa muuta ohjelmointikieltä tai stats-ohjelmistoa, voit suorittaa tarvittavat analyysit, jotta voit tehdä tilastollisia päätelmiä tiedoistasi. Jos olet erittäin innokas ja / tai vihaat itseäsi, voit myös tehdä kaiken käsin. Mutta meidän kaikkien pitäisi olla yhtä mieltä siitä, että t-testi tehdään, mikä tahansa toimii.
se, onko jokin tietty ohjelmisto ”parempi” kuin toinen, varsinkin jos kannatat sen laajempaa käyttöä, riippuu siitä, mitä paremmalla tarkoitetaan. Jos parempi tarkoittaa parempia tilastoja, niin sitten on paska tuuri, koska se voidaan tehdä missä tahansa.
on niin monia muita tärkeitä seikkoja, jotka jäävät pois keskusteltaessa ohjelmistojen välillä, kuten; onko ohjelmisto vapaa ja avoimen lähdekoodin, ja tarjoaako työkalu Bayesilaista tilastointia. Olen käyttänyt JASP noin 30 minuuttia ja olen jo mieluummin sitä SPSS, koska se on; pikapalautetta, Bayesilaisia tilastoja, ja se on ilmaista. Haluaisin myös käyttää Pythonia, koska silloin minulla olisi yksi kieli tehtäviini, tietojen käsittelyyn, analysointiin ja raportointiin. Mutta, ottaa aikaa oppia kieltä on yli rajani tällä hetkellä.
tietojen käsittelyyn ja analysointiin ei ole olemassa yhden koon lähestymistapaa eikä ”parasta ohjelmistoa”.
läpinäkyvä tiedon käsittely
tässä on kysymys, jota olen miettinyt ja johon voisimme sen sijaan keskittyä. Miten voimme tehdä tietojen käsittelystä ja analysoinnista läpinäkyvää ja toistettavaa? Tämä on tieteen edistämisen kannalta paljon tärkeämpää kuin ohjelmistojen mollaaminen.
Tämä on kuitenkin yksi syy siihen, että suosin R: ää; dokumentoitua tietojenkäsittelyä ja analysointia. Skripti voidaan jakaa ja arvioida. Voit jopa tehdä hienoja juttuja ja saada r: n sylkemään markdown PDF: n (APA-muodossa) tietojenkäsittelysi ja-analyysisi jokaisessa vaiheessa kuin vitun velho.
”mutta, voit tallentaa ja jakaa SPSS-syntaksin Sam you gigantic dong!”väittää mukava ihminen olkapäälläni. OK, käyttämällä SPSS voit ajaa kaiken raakadatasta lopulliseen analyysiin ja tallentaa syntaksin. Hienoa, jos näkisin, että tämä todella tapahtuu, olisin haltioissani. Mutta, koska tätä ei opeteta standardina undergrad statistics, päädymme massoittain paperiton hölynpölyä.
Mitä myös tapahtuu (ja lyön vetoa, että raha on todennäköisempää), on, että jotain muuta käytetään (excel) manipuloimaan tietoja ainakin jonkinasteisella copy+pastella tai vetämällä arvoja yhdestä tiedostosta toiseen niiden kokoamiseksi. Mutta, ehkä minun käsitys on värittynyt viettää noin 6 tuntia minun masters kopiointi, liittäminen, vetämällä alas kaksi solua, ja tallennus muuttujia kunkin yksittäisen osallistujien EEG tiedot, Excelissä, ennen kuin se Matlab bash sitä lisää.
vähintäänkin tietojenkäsittelyssä tulee olemaan jokin vaihe, jota ei parhaimmillaan dokumentoida, ja pahimmillaan se on klusteriveikko, jota ei voisi monistaa edes parhain aikomuksin.
tekeekö tämä R: stä paremman? Vastaus on, ettei sen tarvitse. Pidän siitä, että R: llä voin siirtyä raakadatasta, joka on luotu, jalostettuun dataan, lopullisten tilastollisten analyysien tuotokseen yhdessä skriptissä. Se on puhdas ja tuntuu tehokkaammalta. Se tarkoittaa, että jokainen vaihe voidaan tarkistaa. Mutta, tämä voidaan saavuttaa myös, jos olet bashed tiedot excel, tuotu SPSS, lyödä sitä moukarilla, ja sitten clickedy napsautti joitakin analyysi, edellyttäen, että vaiheet on dokumentoitu. Täysin läpinäkyvä ja toistettavissa oleva työnkulku on mahdollista ilman skriptattua ohjelmointikieltä. Suurin ero on se, että R: ssä prosessin jokainen vaihe dokumentoidaan automaattisesti ja kopioidaan oletusarvoisesti.
niin, kannattaako ohjelmiston välillä vaihtaa? ei välttämättä. Ensinnäkin, mielestäni parempi vaihtoehto on investoida aikaa tehdä tietojen luovuttamisesta laskennallisesti toistettavissa ja läpinäkyvä. Tämä voidaan tehdä missä tahansa, SPSS-syntaksin käytöstä erittäin yksityiskohtaisen tilin kirjoittamiseen siitä, mikä osa asiakirjasta, jonka kopioit ja liitit. Niin kauan kuin voit olettaa, että joku muu voi luoda tuloksesi, olemme sujut.
Tämä saattaa myös johtaa sinut kohti ohjelmointikieltä, kuten R, python tai Matlab, koska lopulta näiden analyysivaiheiden integrointi yhteen skriptiin vie vähemmän aikaa. Loppujen lopuksi avoimuus on parempi tavoite kuin ohjelmistojen kiihkoilu. Minun kotiin viesti on, että sen sijaan, että kysyt ” mitä ohjelmistoja minun pitäisi oppia?”, meidän pitäisi kehottaa toisiamme kysymään ” miten voin läpinäkyvästi dokumentoida tietojenkäsittelyni ja analyysini?”.
I do still prefer R to pointy-clicky though…