Introducere
“Numerele au fost inventate pentru a măsura grânele și pentru a administra bogățiile regatului.” — Mesopotamia antică
“Datele sunt noul petrol. (en.Data is the new oil.)” — Clive Humby (2006)
“…acum nu mai e nimic nou de descoperit;
tot ce rămâne e doar măsurătoarea din ce în ce mai precisă”— Lord Kelvin (1894)
“Cartea tipărită merită răsfoită”, spunea Nicoleta Caragea, în anul 2018, unul dintre apreciații profesori și profesioniști statisticieni ai României, în introducerea cărții Statistica. Concepte, tehnici si instrumente softwaRe. Deși internetul ne oferă aproape tot doar la un click distanță, informația fiind disponibilă oricând și oricum, sezația unei cărți tipărite rămâne de neegalat. Dacă lângă carte adăugăm o coală de hârtie și un creion, putem spune că într-adevăr studiem. Și mai mult, dacă adormim în gând cu o problemă de rezolvat și ne trezim plini de speranță că vom găsi rezolvarea, atunci am început activitatea de cercetare științifică.
Obiectivul principal al cărții pe care o propun este de a fi un ghid cuprinzător, în termeni de concepte și tehnici, reprezentativ și, mai ales, practic, în ceea ce privește utilizarea instrumentelor software de analiză statistică, R fiind principalul software utilizat pentru aplicațiile propuse. Ca abordare generală, cartea prezintă principalele concepte utilizate în statistică, cu exemple și explicații descriptive. Exemplele din viața economică - cele mai multe dintre ele bazate pe date statistice reale - problemele rezolvate, dar și cele propuse, acoperă o arie cuprinzătoare de tematici, cititorul având șansa de a fi introdus în sfera aplicativă a conceptelor teoretice parcurse.
Cartea este destinată tuturor celor care doresc să înțeleagă, prin mijloace științifice, fenomenele economice și sociale, sub aspectul măsurării cantitative și din perspectiva determinării cauzale. Deși se adresează, în principal, studenților care se pregătesc să devină specialiști în științele economice, lucrarea este utilă și celor care își propun să cunoască un domeniu atât de frumos și de captivant. Tocmai nevoia de informații, din ce în ce mai complexe, dar și posibilitățile de calcul avansat cu ajutorul soft-urilor tot mai performante, au condus la crearea unui bazin imens de date care pot fi cu ușurință exploatate pe baza analizei statistice. Poate că acesta este și motivul pentru care statistica rămâne o disciplină percepută ca fiind adesea prea matematizată, destinată specialiștilor. Pentru mulți cititori, mai ales dintre cei care nu au o formare bazată pe un aparat matematic, studiul fenomenelor economice prin metode statistice și matematice, presupune un efort deosebit. Din acest motiv, am încercat să tratez aspectele teoretice, dar și problemele cu aplicație practică din sfera economică, într-o manieră simplă, accesibilă. Așadar, lucrarea are menirea de a facilita înțelegerea conceptelor fundamentale cu care operează statistica, utilizarea adecvată a metodelor de analiză statistică, precum și interpretarea corectă a rezultatelor, în vederea cunoașterii modului de manifestare a fenomenelor.
Quarto
Această carte a fost editată cu ajutorul pachetului R bookdown (Xie 2015).
Cartea are la bază manualul Statistică - concepte și metode de analiză a datelor(Caragea 2015).
Pachetul R bookdown este integrat R Markdown (http://rmarkdown.rstudio.com). Documentele elaborate pe baza acestui tip de instrumentar de editare sunt pe deplin reproductibile și dau posibilitatea creării unor formate de ieșire diverse (PDF/HTML/Word/…). Informații suplimentare referitoare la utilizarea pachetului bookdown se pot găsi la adresa: https://bookdown.org.
Informații despre software
Software-ul a devenit în prezent unul dintre cele mai utilizate instrumente de analiză statistică, fiind utilizat în statisticile oficiale, în mediile universitare și de cercetare academică, dar și în mediul de afaceri. Acest manual este destinat tuturor celor care doresc să învețe statistica, fiind un material introductiv de studiu, care prezintă un spectru larg de exemple, prezentări grafice și analiză a datelor, dezvoltate cu ajutorul .
Aplicațiile din această carte utilizează , ceea ce înseamnă că pentru reproducerea acestora va fi nevoie de instalarea pe calculatorul pe care lucrați.
este un sistem pentru analize statistice și reprezentare grafică creat de către Ross Ihaka și Robert Gentleman, profesori de statistică la Universitatea Auckland din Noua Zeelandă.
este considerat un dialect al limbajului creat de AT&T Bell Laboratories. este disponibil sub forma software-ului S-PLUS, comercializat de compania Insightful. Există diferențe importante între cele două limbaje, și : acestea sunt documentate de către Ihaka & Gentleman (1996) sau se regăsesc în R-FAQ.
Astfel, numele limbajului R provine de la inițiala prenumelui creatorilor, dar este totodată și un omagiu adus limbajului .
În primul rând, este open-source, fiind distribuit în mod gratuit sub licență ; dezvoltarea și distribuirea sunt în grija câtorva profesori și statisticieni, afiliați companiilor și universităților, cunoscuți sub denumirea generică de .
Conform filosofiei , software-ul open-source este caracterizat de libertatea acordată utilizatorilor săi de a-l utiliza, copia, distribui, studia, modifica și îmbunătăți. Mai exact, este vorba de patru forme de libertate acordate utilizatorilor(Dușa, Caragea, and Alexandru 2015):
Faptul că este gratuit atrage automat avantajul competitiv în fața altor software-uri de analiză statistică, precum Stata, SAS și SPSS. Astfel, costurile alocate licenței de software dispar. este denumit de către Norman Nie, unul dintre fondatorii SPSS și CEO al Revolution Analytics, “cel mai puternic și flexibil limbaj de programare statistică din lume” (în engleză ). Dovadă a succesului pe care îl are în știința datelor, s-au dezvoltat medii de integrare a acestuia în SAS și chiar SPSS. Este vorba despre modulul SAS/IML, care integrează limbajul în SAS, și despre , un serviciu de translatare a codului SPSS direct în dezvoltat de compania . are susținerea comunității științifice, dar și a multor companii internaționale. Dintre acestea, menționăm: Google, Facebook, Mozilla, Twitter, The New York Times, The Economist, NewScientist, Lloyd’s, Bing, Johnson&Johnson, Pfizer, Shell, Bank of America, Ford. este susținut și de mediul academic. Marile universități din lume sprijină , la fel cum sprijină și alte inițiative sau software-uri open-source, precum sistemul de operare Linux sau sistemul de preparare a documentelor .