Content uploaded by Mónica Balzarini
Author content
All content in this area was uploaded by Mónica Balzarini on Nov 17, 2015
Content may be subject to copyright.
InfoStat
Software Estadístico
Manual del Usuario
Versión 2008
InfoStat
Manual del Usuario
Versión 2008
El software y la documentación de InfoStat es el resultado de la participación activa y
multidisciplinaria de todos los miembros del Grupo InfoStat, quienes son titulares del
Copyright. La asignación de roles y actividades principales son:
Programación: Julio A. Di Rienzo
Algoritmos estadísticos: Mónica G. Balzarini, Julio A. Di Rienzo, Carlos W. Robledo
Control de calidad: Fernando Casanoves
Dirección editorial del Manual del Usuario: Mónica G. Balzarini.
Edición electrónica del Manual: Laura A. Gonzalez
Ayuda en línea: Elena M. Tablada
La cita bibliográfica correcta para este manual es como sigue:
InfoStat (2008). InfoStat, versión 2008. Manual del Usuario. Grupo InfoStat, FCA,
Universidad Nacional de Córdoba. Primera Edición, Editorial Brujas Argentina.
Los derechos de autor de este manual, corresponden a: Mónica G. Balzarini, Laura A.
Gonzalez, Elena M. Tablada, Fernando Casanoves, Julio A. Di Rienzo, Carlos W. Robledo.
La obra de software a la que se refiere este manual debe citarse en bibliografía como sigue:
InfoStat (2008). InfoStat versión 2008. Grupo InfoStat, FCA, Universidad Nacional de
Córdoba, Argentina.
Queda prohibida la reproducción total o parcial de este libro en forma idéntica o modificada
por cualquier medio mecánico o electrónico, incluyendo fotocopia, grabación o cualquier
sistema de almacenamiento y recuperación de información no autorizada por los titulares del
Copyright.
Prólogo
InfoStat es un software estadístico desarrollado por el Grupo InfoStat, un equipo de
trabajo conformado por profesionales de la Estadística Aplicada con sede en la Facultad de
Ciencias Agropecuarias de la Universidad Nacional de Córdoba. Por la Cátedra de
Estadística y Biometría participaron en la elaboración de InfoStat los profesores. Julio A. Di
Rienzo, Mónica G. Balzarini, Fernando Casanoves, Laura A. Gonzalez, Elena M.
Tablada y por la Cátedra de Diseño de Experimentos participó el Prof. Carlos W.
Robledo. InfoStat, como proyecto de investigación y desarrollo representa una síntesis de la
experiencia acumulada desde 1982 en la Unidad de Procesamiento Electrónico de Datos y
en la Cátedras de Estadística y de Diseño de Experimentos. Labor enriquecida por la tarea
docente de grado y postgrado, la consultoría estadística y la formación de recursos humanos
en estadística aplicada realizada por los miembros del equipo de desarrollo. Nos enorgullece
hoy el nivel de aceptación que InfoStat tiene en el ámbito universitario, en centros de
investigación y tecnología y en empresas de producción de bienes y servicios.
El presente manual consta de cuatro capítulos: Manejo de Datos, Estadísticas, Gráficos y
Aplicaciones. El capítulo Manejo de Datos contiene información acerca de cómo operar el
programa para la utilización de archivos y describe las acciones que se pueden realizar sobre
tablas de datos. El capítulo Estadísticas describe las herramientas metodológicas que el
usuario puede seleccionar para el análisis de sus datos. Estas descripciones están
acompañadas de ejemplos de su implementación en InfoStat construido a partir de
numerosas situaciones reales donde la aplicación de una o más técnicas estadísticas resulta
beneficiosa. El capítulo Gráficos describe también a través de la ejemplificación diferentes
tipos de representaciones gráficas disponibles. El capítulo Aplicaciones presenta métodos
estadísticos usados en el control estadístico de la calidad, la cuantificación de biodiversidad
y herramientas computacionales para facilitar el proceso de enseñanza – aprendizaje de
conceptos clásicos de la estadística.
El presente manual refleja el estado de avance de InfoStat al momento de su impresión, sin
embargo InfoStat está creciendo, actualizando y mejorando continuamente algoritmos e
interfases con el usuario. En el menú ayuda de InfoStat encontrará acceso a la versión a la
versión electrónica de este manual y a un link para su actualización en línea.
4
Índice de contenidos
Instalación_____________________________________________________________ 8
Actualización __________________________________________________________ 8
Requerimientos_________________________________________________________ 8
Aspectos generales _____________________________________________________ 10
Manejo de datos _______________________________________________________13
Archivo ___________________________________________________________________ 13
Nueva tabla______________________________________________________________ 13
Abrir tabla ______________________________________________________________ 13
Guardar tabla ____________________________________________________________ 16
Guardar tabla como _______________________________________________________ 16
Cerrar tabla______________________________________________________________ 16
Edición ___________________________________________________________________ 17
Datos_____________________________________________________________________ 18
Nueva fila_______________________________________________________________ 18
Insertar fila______________________________________________________________ 18
Eliminar fila _____________________________________________________________ 19
Desactivar caso___________________________________________________________ 19
Activar caso _____________________________________________________________ 19
Invertir activación ________________________________________________________ 19
Seleccionar caso __________________________________________________________ 19
Nueva columna___________________________________________________________ 21
Insertar columna__________________________________________________________ 21
Eliminar columna _________________________________________________________ 21
Editar Etiquetas __________________________________________________________ 21
Leer etiquetas desde… _____________________________________________________ 22
Tipo de dato _____________________________________________________________ 22
Alineación ______________________________________________________________ 22
Decimales_______________________________________________________________ 22
Ajuste automático de columnas ______________________________________________ 22
Ordenar_________________________________________________________________ 22
Categorizar ______________________________________________________________ 23
Editar categorías__________________________________________________________ 25
Transformar _____________________________________________________________ 26
Crear variables auxiliares (dummy) ___________________________________________ 28
Llenar con... _____________________________________________________________ 29
Fórmulas________________________________________________________________ 34
Buscar__________________________________________________________________ 38
Remuestreo______________________________________________________________ 39
Colorear selección ________________________________________________________ 39
Unir tablas ______________________________________________________________ 39
Ubicar columnas una debajo de la otra_________________________________________ 40
Reubicar filas como columnas _______________________________________________ 40
Crear nueva tabla con los casos activos ________________________________________ 40
Cruzar categorías _________________________________________________________ 40
Resultados_________________________________________________________________ 41
5
Cargar resultados__________________________________________________________41
Guardar resultados_________________________________________________________41
Decimales _______________________________________________________________41
Separador de campos_______________________________________________________41
Tipografía _______________________________________________________________41
Exportar resultados como tabla _______________________________________________42
Estadísticas ___________________________________________________________ 43
Estadística descriptiva ________________________________________________________44
Medidas resumen__________________________________________________________44
Tablas de frecuencias_______________________________________________________46
Probabilidades y cuantiles ___________________________________________________48
Estimadores de características poblacionales_______________________________________ 49
Definiciones de términos relacionados al muestreo________________________________49
Muestreo aleatorio simple ___________________________________________________51
Muestreo estratificado ______________________________________________________53
Muestreo por conglomerados ________________________________________________56
Cálculo del tamaño muestral ___________________________________________________58
Estimar una media _________________________________________________________58
Para detectar una diferencia mínima significativa _________________________________59
Estimar una proporción _____________________________________________________59
Para la estimación de la diferencia entre dos proporciones __________________________60
Inferencia en una y dos poblaciones _____________________________________________ 60
Inferencia basada en una muestra _____________________________________________ 60
Inferencia basada en dos muestras_____________________________________________67
Análisis de la varianza ________________________________________________________80
Modelo__________________________________________________________________82
Diseño completamente aleatorizado ___________________________________________82
Diseño en bloques _________________________________________________________85
Diseño en cuadrado latino ___________________________________________________87
Diseños con estructura factorial de tratamientos __________________________________89
Diseño con estructura anidada de tratamientos ___________________________________94
Diseño en parcelas divididas _________________________________________________96
Diseño en Parcelas Subdivididas_____________________________________________100
Comparaciones Múltiples __________________________________________________104
Contrastes ______________________________________________________________107
Supuestos del ANAVA ____________________________________________________111
Análisis de covarianza_____________________________________________________115
Análisis de la varianza no paramétrico __________________________________________117
Prueba de Kruskal-Wallis __________________________________________________117
Prueba de Friedman_______________________________________________________118
Análisis de regresión lineal ___________________________________________________120
Modelo_________________________________________________________________120
Validación de los supuestos_________________________________________________128
Regresión con variables auxiliares (dummy)____________________________________134
Análisis de regresión no lineal_________________________________________________139
Modelos predeterminados __________________________________________________140
Análisis de correlación_______________________________________________________142
Coeficientes de correlación _________________________________________________142
Coeficientes de correlación parcial ___________________________________________143
Coeficientes de sendero (path analysis) _______________________________________144
6
Correlación entre matrices de distancia _______________________________________ 146
Datos Categorizados________________________________________________________ 147
Tablas de contingencia____________________________________________________ 147
Regresión logística _______________________________________________________ 158
Sobrevida de Kaplan-Meier ________________________________________________ 160
Análisis multivariado__________________________________________________ 165
Estadística descriptiva multivariada ____________________________________________ 166
Análisis de conglomerados___________________________________________________ 171
Métodos de agrupamiento jerárquicos ________________________________________ 175
Métodos de agrupamiento no jerárquicos______________________________________ 179
Distancias ______________________________________________________________ 180
Componentes principales ____________________________________________________ 180
Biplot _________________________________________________________________ 186
Arboles de Recorrido Mínimo (ARM)________________________________________ 187
Análisis discriminante ______________________________________________________ 187
Correlaciones canónicas _____________________________________________________ 195
Regresión por Mínimos Cuadrados Parciales _____________________________________ 199
Análisis de la varianza multivariado____________________________________________ 202
Correlación-distancias-similitudes _____________________________________________ 210
Análisis de correspondencias _________________________________________________ 215
Análisis de coordenadas principales____________________________________________ 219
Árboles de clasificación y árboles de regresión ___________________________________ 221
Biplot y árbol de mínimo recorrido ____________________________________________ 223
Procrustes generalizado _____________________________________________________ 225
Series de Tiempo _____________________________________________________ 231
Simulación y transformaciones________________________________________________ 232
Prueba de raíz unitaria ______________________________________________________ 234
Correlaciones cruzadas ______________________________________________________ 235
Espectro de potencia________________________________________________________ 237
Metodología ARIMA de Box y Jenkins _________________________________________ 239
Suavizados y ajustes ________________________________________________________ 253
Técnicas de suavizado ____________________________________________________ 254
Gráficos _____________________________________________________________ 256
Herramientas Gráficas ______________________________________________________ 257
Solapa Series ___________________________________________________________ 257
Solapa Eje X____________________________________________________________ 260
Solapa Eje Y____________________________________________________________ 261
Solapa Herramientas _____________________________________________________ 262
Ventana Gráficos __________________________________________________________ 263
Suscripción y copia de formatos gráficos______________________________________ 264
Leyendas ______________________________________________________________ 264
Líneas de texto __________________________________________________________ 265
Diagrama de dispersión _____________________________________________________ 266
Gráfico de Puntos __________________________________________________________ 268
Gráfico de barras___________________________________________________________ 269
Gráfico de cajas (box-plot)___________________________________________________ 271
Gráfico de densidad de puntos ________________________________________________ 272
Q-Q plot _________________________________________________________________ 273
Gráfico de la distribución empírica_____________________________________________ 274
7
Histograma________________________________________________________________275
Diagrama de perfiles multivariados_____________________________________________276
Gráfico de estrellas _________________________________________________________278
Gráfico de Sectores _________________________________________________________279
Gráfico de barras apiladas ____________________________________________________282
Matriz de diagramas de dispersión______________________________________________284
Graficador de funciones______________________________________________________285
Aplicaciones _________________________________________________________ 286
Control de calidad __________________________________________________________286
Diagrama de control para atributos ___________________________________________289
Diagramas de control de variables____________________________________________293
Diagrama de Pareto _______________________________________________________298
Capacidad de Proceso _____________________________________________________299
Aplicaciones Didácticas______________________________________________________ 300
Gráficos de funciones de densidad continuas ___________________________________ 300
Intervalos de confianza ____________________________________________________306
Todas las muestras posibles_________________________________________________308
Muestrear desde la distribución empírica ______________________________________310
Remuestreo _____________________________________________________________311
Indices ___________________________________________________________________314
Indices de biodiversidad ___________________________________________________314
Bibliografía __________________________________________________________ 323
Indice de contenidos___________________________________________________ 329
8
Instalación
Para la instalación de InfoStat desde la página web www.infostat.com.ar se deben seguir las
instrucciones que allí se detallan. Para la instalación desde un CD de distribución, la
computadora requiere unos segundos para leer los archivos de iniciación. Este proceso
puede demorar hasta 2 minutos en algunas máquinas. Una vez que se inicia el proceso de
instalación sólo apriete la tecla <Enter> en cada ventana de opciones que se le presente en
pantalla. Cuando el proceso concluye exitosamente entonces el instalador habrá creado una
carpeta InfoStat dentro de C:\Archivos de programa\ y un ícono de acceso
directo en InicioProgramasInfoStat. Si eventualmente el CD no inicia
el proceso de instalación automática entonces abra el directorio del mismo,
busque el ícono que tiene como leyenda InfoStatInstaller.exe y haga doble
click sobre él.
Dentro de la carpeta de InfoStat, C:\Archivos de Programa\InfoStat, se
encontrará la siguiente información:
Carpeta Datos: contiene todos los archivos de datos a los que hace referencia este manual.
Carpeta Ayuda: contiene el archivo de ayuda en línea.
Archivo Manual.pdf: contiene el material impreso que se recibió junto con el C.D. La
versión electrónica del manual puede contener actualizaciones de este material impreso.
Actualización
Puede acceder a las instrucciones de actualización a través del menú AYUDA. La opción
ACTUALIZAR abre la página web de InfoStat desde donde puede bajar las últimas
actualizaciones.
Requerimientos
Procesador requerido: Tipo Pentium o superior
Memoria mínima sugerida: 128 Mb
Sistemas operativos: Windows 98, 2000, XP, NT, Vista.
9
Configuración del monitor: definición mínima 800x600 píxeles, fuentes pequeñas. Si las
fuentes de la configuración del monitor son grandes se pueden presentar problemas para ver
parte de las ventanas que InfoStat despliega durante el trabajo. Bajo Windows 98 las fuentes
pequeñas se especifican pidiendo Propiedades del monitor y seleccionando la solapa
Configuración. Allí apretar el botón Avanzada, lo que conducirá a una ventana de diálogo
en la que se puede especificar el tamaño de las tipografías del monitor.
IMPORTANTE: InfoStat reconoce automáticamente la configuración regional de la
computadora. Esta, define entre otras cosas, el símbolo a utilizar como separador decimal,
ya sea coma “,” o punto “.”. Por defecto, las versiones en español de Windows configuran
su sistema para que reconozca a la coma como separador decimal. Si la computadora está
configurada para reconocer comas, cuando se use punto como separador decimal durante el
ingreso de datos desde el teclado, InfoStat considerará que se ingresó un conjunto de
caracteres alfanuméricos y no un valor numérico y por lo tanto no podrá tratarlos para hacer
cálculos. Este comportamiento es común a todas las aplicaciones Windows, pero se hace
crítico cuando la aplicación procesa datos numéricos cargados por el usuario.
Si Ud. quiere cambiar la configuración regional para utilizar punto (o coma),
debe entrar a Panel de Control (Menú InicioConfiguraciónPanel de
Control) y localizar el ícono de la configuración regional. Haga doble click
sobre ese ícono y aparecerá una ventana cuya parte superior se muestra a
continuación. Una opción es simplemente cambiar la configuración regional
eligiendo Estados Unidos, por ejemplo. La otra es tocando la solapa Número y cambiando
allí el símbolo decimal. Esta opción es probablemente más recomendable ya que las otras
pueden cambiar los estilos de fechas y criterios de ordenamiento alfabético.