Table Of ContentBioestadística
Aplicada con
R y RKTeaching
Alfredo Sánchez Alberca
ioestadıstica plicada
B ´ A
con y eaching
R RKT
Alfredo Sa´nchez Alberca
[email protected]
http://aprendeconalf.es
Septiembrede2014
Bioestad´ısticaAplicadaconR yRKTeaching
AlfredoSa´nchezAlberca ([email protected]).
Estaobraesta´ bajounalicenciaReconocimiento–Nocomercial–Compartirbajolamismalicencia
3.0Espan˜adeCreativeCommons.Paraverunacopiadeestalicencia,visitehttp://creativecommons.
org/licenses/by-nc-sa/3.0/es/.
Conestalicenciaereslibrede:
Copiar,distribuirymostrarestetrabajo.
Realizarmodificacionesdeestetrabajo.
Bajolassiguientescondiciones:
Reconocimiento. Debe reconocer los cre´ditos de la obra de la
manera especificada por el autor o el licenciador (pero no de
unamaneraquesugieraquetienesuapoyooapoyanelusoque
hacedesuobra).
No comercial. No puede utilizar esta obra para fines comercia-
les.
Compartir bajo la misma licencia. Si altera o transforma esta
obra, o genera una obra derivada, so´lo puede distribuir la obra
generadabajounalicenciaide´nticaae´sta.
Alreutilizarodistribuirlaobra,tienequedejarbienclaroloste´rminosdelalicenciadeestaobra.
Alguna de estas condiciones puede no aplicarse si se obtiene el permiso del titular de los dere-
chosdeautor
Nadaenestalicenciamenoscabaorestringelosderechosmoralesdelautor.
´
Indice general
1. Introduccio´naRyRKWard 1
1.1. Introduccio´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Instalacio´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.1. Instalacio´ndeR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.2. Instalacio´ndelainterfazgra´ficaRKWardyelpaqueterkTeaching . . . . . . . . . 2
1.3. Arranque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4. Tiposdedatosyoperadoresaritme´ticosylo´gicos . . . . . . . . . . . . . . . . . . . . . . 4
1.5. Introduccio´nymanipulacio´n dedatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5.1. Introduccio´ndedatosenl´ıneadecomandos . . . . . . . . . . . . . . . . . . . . . 5
1.5.2. Introduccio´ndedatosenRKWard . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5.3. Ponderacio´ndedatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5.4. Guardardatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5.5. Abrirdatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.6. Eliminacio´n dedatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6. Transformacio´ndedatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.1. Filtradodedatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.2. Ca´lculodevariables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.3. Recodificacio´ndevariables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7. Manipulacio´n deficherosderesultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7.1. Guardarlosresultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7.2. Limpiarlaventanaderesultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.8. Manipulacio´n deguionesdecomandos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.8.1. Creacio´ndeunguio´ndecomandos . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.8.2. Guardarunguio´ndecomandos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.8.3. Abrirunguio´ndecomandos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.9. Ayuda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.10.Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.11.Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2. DistribucionesdeFrecuenciasyRepresentacionesGra´ficas 17
2.1. Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1. Ca´lculodeFrecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2. RepresentacionesGra´ficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2. Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3. Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3. Estad´ısticosMuestrales 27
3.1. Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.1. Medidasdeposicio´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.2. Medidasdedispersio´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.3. Medidasdeforma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
v
3.1.4. Estad´ısticosdevariablesenlasquesedefinengrupos . . . . . . . . . . . . . . . 30
3.2. Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3. Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4. Regresio´nLinealSimpleyCorrelacio´n 35
4.1. Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1.1. Regresio´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1.2. Correlacio´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2. Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3. Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5. Regresio´nnolineal 49
5.1. Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.2. Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.3. Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6. Probabilidad 55
6.1. Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.1.1. Introduccio´n. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.1.2. Experimentosysucesosaleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.1.3. Definicio´ndeprobabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.1.4. Probabilidad condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6.1.5. Espaciosprobabil´ısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.1.6. Teoremadelaprobabilidadtotal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.1.7. TeoremadeBayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.1.8. Testsdiagno´sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
6.2. Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.3. Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7. VariablesAleatoriasDiscretas 73
7.1. Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
7.1.1. Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
7.1.2. Variables AleatoriasDiscretas(v.a.d.) . . . . . . . . . . . . . . . . . . . . . . . . . 73
7.2. Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
7.3. Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
8. VariablesAleatoriasContinuas 81
8.1. Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.1.1. Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.1.2. Variables AleatoriasContinuas(v.a.c.) . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.2. Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
8.3. Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
9. IntervalosdeConfianzaparaMediasyProporciones 93
9.1. Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.1.1. InferenciaEstad´ısticayEstimacio´ndePara´metros . . . . . . . . . . . . . . . . . . 93
9.1.2. IntervalosdeConfianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.2. Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
9.3. Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
10.IntervalosdeConfianzaparalaComparacio´nde2Poblaciones 103
10.1.Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
10.1.1.InferenciaEstad´ısticayEstimacio´ndePara´metros . . . . . . . . . . . . . . . . . . 103
10.1.2.IntervalosdeConfianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
10.2.Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
10.3.Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
vi
11.ContrastedeHipo´tesis 113
11.1.Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
11.1.1.InferenciaEstad´ısticayContrastesdeHipo´tesis . . . . . . . . . . . . . . . . . . . 113
11.1.2.TiposdeContrastesdeHipo´tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
11.1.3.ElementosdeunContraste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
11.2.Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
11.3.Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
12.Ana´lisisdelaVarianzade1Factor 127
12.1.Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
12.1.1.Notacio´n,ModeloyContraste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
12.2.Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
12.3.Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
13.ANOVAdemu´ltiplesfactoresymedidasrepetidas 135
13.1.Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
13.1.1.ANOVAdemu´ltiplesfactores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
13.1.2.ANOVAdemedidasrepetidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
13.1.3.ANOVAdemedidasrepetidas+ANOVAdeunaoma´sv´ıas . . . . . . . . . . . . . 145
13.2.Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
13.3.Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
14.Contrastesdehipo´tesisnoparame´tricos 153
14.1.Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
14.1.1.Contrastesnoparame´tricosma´shabituales . . . . . . . . . . . . . . . . . . . . . . 154
14.1.2.Aleatoriedad deunamuestra:TestdeRachas . . . . . . . . . . . . . . . . . . . . 155
14.1.3.PruebasdeNormalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
14.1.4.TestdelaUdeMann-Whitney . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
14.1.5.TestdeWilcoxonparadatosemparejados . . . . . . . . . . . . . . . . . . . . . . . 159
14.1.6.TestdeKruskal-Wallis:comparacio´nnoparame´tricadekmediasindependientes . 159
14.1.7.TestdeFriedman:equivalentenoparame´tricodelANOVAconmedidasrepetidas 160
14.1.8.TestdeLeveneparaelcontrastedehomogenidaddevarianzas . . . . . . . . . . 161
14.1.9.Elcoeficientedecorrelacio´ndeSpearman . . . . . . . . . . . . . . . . . . . . . . 162
14.2.Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
14.3.Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
15.ContrastesBasadosenelEstad´ısticoχ2 169
15.1.Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
15.1.1.Contrasteχ2 dePearsonparaajustededistribuciones . . . . . . . . . . . . . . . . 170
15.1.2.Contrasteχ2 entablasdecontingencia . . . . . . . . . . . . . . . . . . . . . . . . 170
15.1.3.TestExactodeFisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
15.1.4.TestdeMcNemarparadatosemparejados . . . . . . . . . . . . . . . . . . . . . . 172
15.2.Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
15.3.Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
16.Ana´lisisdeConcordancia 177
16.1.Fundamentosteo´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
16.1.1.Introduccio´n. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
16.1.2.Ana´lisisdelaConcordanciaentredosVariables Cuantitativas . . . . . . . . . . . . 177
16.1.3.Ana´lisisdelaConcordanciaentredosVariables Cualitativas . . . . . . . . . . . . 178
16.2.Ejerciciosresueltos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
16.3.Ejerciciospropuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
viii
1
Pra´ctica
Introduccio´ n a R y RKWard
1 Introduccio´n
Lagranpotenciadeca´lculoalcanzadaporlosordenadoreshaconvertidoalosmismosenpodero-
sasherramientas alserviciodetodasaquellas disciplinas que,comolaestad´ıstica,requierenmanejar
un gran volumen de datos. Actualmente, pra´cticamente nadie se plantea hacer un estudio estad´ıstico
seriosinlaayudadeunbuenprogramadeana´lisisestad´ıstico.
R es un potente lenguaje de programacio´n que incluye multitud de funciones para la representa-
cio´n el ana´lisis de datos. Fue desarrollado por Robert Gentleman y Ross Ihaka en la Universidad de
AucklandenNuevaZelanda, aunque actualmente esmantenido por unaenormecomunidad cient´ıfica
entodoelmundo.
LasventajasdeRfrenteaotrosprogramashabitualesdeana´lisisdedatos,comopuedenserSPSS,
SAS,SPlus,MatlaboMinitab,sonmu´ltiples:
Es softwarelibre ypor tanto gratuito.Puede descargarsedesdelaweb http://www.r-project.
org/.
Esmultiplataforma. ExistenversionesparaWindows,Macintosh,Linuxyotrasplataformas.
Esta´ avalado y en constante desarrollo por una amplia comunidad cient´ıfica que lo utiliza como
esta´ndarparaelana´lisisdedatos.
Cuentaconmultituddepaquetesparatodotipodeana´lisisestad´ısticosyrepresentacionesgra´fi-
cas, desde los ma´s habituales, hasta los ma´s novedosos y sofisticados que no incluyen otros
programas. Los paquetes esta´n organizados y documentados en un repositorio CRAN (Com-
prehensive R Archive Network) desde donde pueden descargarse libremente. En Espan˜a hay
unacopiadeesterepositorioenlawebhttp://cran.es.r-project.org/.
Es programable, lo que permite que el usuario pueda crear fa´cilmente sus propias funciones o
paquetesparaana´lisisdedatosespec´ıficos.
Existen multitud de libros, manuales y tutoriales libres que permiten su aprendizaje e ilustran el
ana´lisis estad´ıstico de datos en distintas disciplinas cient´ıficas como las matema´ticas, la f´ısica,
labiolog´ıa,lapsicolog´ıa,lamedicina,etc.
1
Bioestad´ısticaAplicadaconRyRKTeaching
Por defecto el entorno de trabajo de R es en l´ınea de comandos, lo que significa que los ca´lculos
y los ana´lisis se relizan mediante comandos o instrucciones que el usuario teclea en una ventana
de texto. No obstante, existen distintas interfaces gra´ficas de usuario que facilitan su uso, sobre todo
para usuarios noveles. La interfaz gra´fica que se utilizara´ para realizar estas pra´cticas sera´ RKWard,
desarrolladaporThomasFriedrichsmeier,juntoalpaqueterkTeachingespecialmentedesarrolladopor
eldepartamentodeMatema´ticasdelaUniversidadSanPabloCEUparaladocenciadeestad´ıstica.
Elobjetivodeestapra´cticaesintroduciralalumnoenlautilizacio´ndeesteprograma,ensen˜a´ndole
arealizarlasoperacionesba´sicasma´shabitualesdecargaymanipulacio´ndedatos.
2 Instalacio´n
2.1 Instalacio´n deR
Linux Enladistribucio´nDebianycualquieradesusderivadas(Ubuntu,Kubuntu,etc.)bastaconteclear
enlal´ıneadecomandos
> sudo apt-get install r-base-html r-cran-rcmdr r-cran-rodbc r-doc-html r
-recommended
Windows Descargardehttp://cran.es.r-project.org/bin/windows/base/release.htmelprogra-
madeinstalacio´ndeR,ejecutarloyseguirlasinstruccionesdeinstalacio´n.
2.2 Instalacio´n dela interfazgra´fica RKWardyelpaqueterkTeaching
La interfaz gra´fica de usuario RKWard puede descargarse desde la web http://rkward.
sourceforge.net/dondeseindicanlasinstruccionesparainstalarloencadaplataforma.
ParaWindows serecomiendaseleccionarelpaquetedeinstalacio´ncompletaqueincorporaR,las
librer´ıasgra´ficasdeKDEyelpropioRKWard.
R dispone de una gran librer´ıa de paquetes que incorporan nuevas funciones y procedimientos.
En la instalacio´n base de R vienen ya cargados los procedimientos y funciones para los ana´lisis ma´s
comunes,pero en ocasiones,paraotros ana´lisis sera´ necesario cargar algu´n paquete adicional como
por ejemplo el paquete rkTeaching que incorpora un nuevo menu´ a RKWard con la mayor´ıa de los
ana´lisisqueserealizara´nenestaspra´cticas.
Para instalar el paquete rk.Teaching, basta con descargarlo desde la direccio´n http://asalber.
github.io/rkTeaching_es/,arrancarRoRKWardy,enlaconsoladecomandos,teclearelcomando
> setwd("ruta_a_descargas")
> install.packages("rk.Teaching",repos=NULL,dep=True)
La instalacio´n de cualquier otro paquete se realiza con el mismo comando, cambiando el nombre
delpaqueteporeldeseado.
En RKWard, tambie´n puede instalarse desde la ventana de R mediante el menu´ Preferencias
Configurar paquetes.Con esto aparecera´ una ventana donde se muestran los paquetes instalados
localmente. Paracargarunpaquete instalado localmentebastasonseleccionarloyhacerclicsobreel
boto´n Cargar.Enesa mismaventana apareceunasolapa Install/Update/Removequepermite insta-
larnuevospaquetesdesdeunrepositoriodeR.Alhacerclicsobreestasolapaseabrira´ unaconexio´n
ainternetyaparecera´ unaventanaconlosdistintosrepositoriosdisponibles.Normalmenteselecciona-
remos en ma´s cercanogeogra´ficamente, en nuestro caso Spain(Madrid). Despue´s aparecera´ un lista
de paquetes instalados y nuevos.Para instalar un paquete nuevobasta conseleccionarlo y hacer clic
enelboto´nAceptar.Unavezinstaladolocalmente,podra´ cargarsecomosehaindicadoantes.
2
Description:está fuera del intervalo [-2,2] se dice que la distribución es, o demasiado apuntada, o demasiado plana, como para que los datos provengan de una