BookPDF Available

Abstract

InfoStat es un software para análisis estadístico de aplicación general desarrollado bajo la plataforma Windows. Cubre tanto las necesidades elementales para la obtención de estadísticas descriptivas y gráficos para el análisis exploratorio, como métodos avanzados de modelación estadística y análisis multivariado. Una de sus fortalezas es la sencillez de su interfaz combinada con capacidades profesionales para el análisis estadístico y el manejo de datos. Debido al origen universitario, el programa tiene muchas facilidades para la enseñanza de la estadística que no son fáciles en encontrar en otros programas similares. La versión en español es muy valorada por los usuarios, especialmente por los estudiantes. Una propiedad casi única entre el software estadístico es la habilidad de InfoStat se conectarse con R, una plataforma de desarrollo de algoritmos estadísticos de dominio público de gran crecimiento. InfoStat de conecta con R de dos maneras: mediante un intérprete integrado que permite ejecutar script de R sin salir del ambiente de trabajo de InfoStat y mediante el desarrollo de aplicaciones utilizando el motor de cálculo de R pero con la interfaz amigable que los usuarios esperan. Ese es el caso del la inclusión de modelos lineales mixtos y generalizados mixtos en InfoStat. Estos han sido siempre modelos difíciles de especificar por su complejidad, pero la interfaz lograda en InfoStat nos ha permitido incorporar sus contenidos en cursos de postgrado y capacitaciones a técnicos de empresas que de otra manera hubieran sido imposibles de abordar. http://www.infostat.com.ar/
InfoStat
Software Estadístico
Manual del Usuario
Versión 2008
InfoStat
Manual del Usuario
Versión 2008
El software y la documentación de InfoStat es el resultado de la participación activa y
multidisciplinaria de todos los miembros del Grupo InfoStat, quienes son titulares del
Copyright. La asignación de roles y actividades principales son:
Programación: Julio A. Di Rienzo
Algoritmos estadísticos: Mónica G. Balzarini, Julio A. Di Rienzo, Carlos W. Robledo
Control de calidad: Fernando Casanoves
Dirección editorial del Manual del Usuario: Mónica G. Balzarini.
Edición electrónica del Manual: Laura A. Gonzalez
Ayuda en línea: Elena M. Tablada
La cita bibliográfica correcta para este manual es como sigue:
InfoStat (2008). InfoStat, versión 2008. Manual del Usuario. Grupo InfoStat, FCA,
Universidad Nacional de Córdoba. Primera Edición, Editorial Brujas Argentina.
Los derechos de autor de este manual, corresponden a: Mónica G. Balzarini, Laura A.
Gonzalez, Elena M. Tablada, Fernando Casanoves, Julio A. Di Rienzo, Carlos W. Robledo.
La obra de software a la que se refiere este manual debe citarse en bibliografía como sigue:
InfoStat (2008). InfoStat versión 2008. Grupo InfoStat, FCA, Universidad Nacional de
Córdoba, Argentina.
Queda prohibida la reproducción total o parcial de este libro en forma idéntica o modificada
por cualquier medio mecánico o electrónico, incluyendo fotocopia, grabación o cualquier
sistema de almacenamiento y recuperación de información no autorizada por los titulares del
Copyright.
Prólogo
InfoStat es un software estadístico desarrollado por el Grupo InfoStat, un equipo de
trabajo conformado por profesionales de la Estadística Aplicada con sede en la Facultad de
Ciencias Agropecuarias de la Universidad Nacional de Córdoba. Por la Cátedra de
Estadística y Biometría participaron en la elaboración de InfoStat los profesores. Julio A. Di
Rienzo, Mónica G. Balzarini, Fernando Casanoves, Laura A. Gonzalez, Elena M.
Tablada y por la Cátedra de Diseño de Experimentos participó el Prof. Carlos W.
Robledo. InfoStat, como proyecto de investigación y desarrollo representa una síntesis de la
experiencia acumulada desde 1982 en la Unidad de Procesamiento Electrónico de Datos y
en la Cátedras de Estadística y de Diseño de Experimentos. Labor enriquecida por la tarea
docente de grado y postgrado, la consultoría estadística y la formación de recursos humanos
en estadística aplicada realizada por los miembros del equipo de desarrollo. Nos enorgullece
hoy el nivel de aceptación que InfoStat tiene en el ámbito universitario, en centros de
investigación y tecnología y en empresas de producción de bienes y servicios.
El presente manual consta de cuatro capítulos: Manejo de Datos, Estadísticas, Gráficos y
Aplicaciones. El capítulo Manejo de Datos contiene información acerca de cómo operar el
programa para la utilización de archivos y describe las acciones que se pueden realizar sobre
tablas de datos. El capítulo Estadísticas describe las herramientas metodológicas que el
usuario puede seleccionar para el análisis de sus datos. Estas descripciones están
acompañadas de ejemplos de su implementación en InfoStat construido a partir de
numerosas situaciones reales donde la aplicación de una o más técnicas estadísticas resulta
beneficiosa. El capítulo Gráficos describe también a través de la ejemplificación diferentes
tipos de representaciones gráficas disponibles. El capítulo Aplicaciones presenta métodos
estadísticos usados en el control estadístico de la calidad, la cuantificación de biodiversidad
y herramientas computacionales para facilitar el proceso de enseñanza – aprendizaje de
conceptos clásicos de la estadística.
El presente manual refleja el estado de avance de InfoStat al momento de su impresión, sin
embargo InfoStat está creciendo, actualizando y mejorando continuamente algoritmos e
interfases con el usuario. En el menú ayuda de InfoStat encontrará acceso a la versión a la
versión electrónica de este manual y a un link para su actualización en línea.
4
Índice de contenidos
Instalación_____________________________________________________________ 8
Actualización __________________________________________________________ 8
Requerimientos_________________________________________________________ 8
Aspectos generales _____________________________________________________ 10
Manejo de datos _______________________________________________________13
Archivo ___________________________________________________________________ 13
Nueva tabla______________________________________________________________ 13
Abrir tabla ______________________________________________________________ 13
Guardar tabla ____________________________________________________________ 16
Guardar tabla como _______________________________________________________ 16
Cerrar tabla______________________________________________________________ 16
Edición ___________________________________________________________________ 17
Datos_____________________________________________________________________ 18
Nueva fila_______________________________________________________________ 18
Insertar fila______________________________________________________________ 18
Eliminar fila _____________________________________________________________ 19
Desactivar caso___________________________________________________________ 19
Activar caso _____________________________________________________________ 19
Invertir activación ________________________________________________________ 19
Seleccionar caso __________________________________________________________ 19
Nueva columna___________________________________________________________ 21
Insertar columna__________________________________________________________ 21
Eliminar columna _________________________________________________________ 21
Editar Etiquetas __________________________________________________________ 21
Leer etiquetas desde… _____________________________________________________ 22
Tipo de dato _____________________________________________________________ 22
Alineación ______________________________________________________________ 22
Decimales_______________________________________________________________ 22
Ajuste automático de columnas ______________________________________________ 22
Ordenar_________________________________________________________________ 22
Categorizar ______________________________________________________________ 23
Editar categorías__________________________________________________________ 25
Transformar _____________________________________________________________ 26
Crear variables auxiliares (dummy) ___________________________________________ 28
Llenar con... _____________________________________________________________ 29
Fórmulas________________________________________________________________ 34
Buscar__________________________________________________________________ 38
Remuestreo______________________________________________________________ 39
Colorear selección ________________________________________________________ 39
Unir tablas ______________________________________________________________ 39
Ubicar columnas una debajo de la otra_________________________________________ 40
Reubicar filas como columnas _______________________________________________ 40
Crear nueva tabla con los casos activos ________________________________________ 40
Cruzar categorías _________________________________________________________ 40
Resultados_________________________________________________________________ 41
5
Cargar resultados__________________________________________________________41
Guardar resultados_________________________________________________________41
Decimales _______________________________________________________________41
Separador de campos_______________________________________________________41
Tipografía _______________________________________________________________41
Exportar resultados como tabla _______________________________________________42
Estadísticas ___________________________________________________________ 43
Estadística descriptiva ________________________________________________________44
Medidas resumen__________________________________________________________44
Tablas de frecuencias_______________________________________________________46
Probabilidades y cuantiles ___________________________________________________48
Estimadores de características poblacionales_______________________________________ 49
Definiciones de términos relacionados al muestreo________________________________49
Muestreo aleatorio simple ___________________________________________________51
Muestreo estratificado ______________________________________________________53
Muestreo por conglomerados ________________________________________________56
Cálculo del tamaño muestral ___________________________________________________58
Estimar una media _________________________________________________________58
Para detectar una diferencia mínima significativa _________________________________59
Estimar una proporción _____________________________________________________59
Para la estimación de la diferencia entre dos proporciones __________________________60
Inferencia en una y dos poblaciones _____________________________________________ 60
Inferencia basada en una muestra _____________________________________________ 60
Inferencia basada en dos muestras_____________________________________________67
Análisis de la varianza ________________________________________________________80
Modelo__________________________________________________________________82
Diseño completamente aleatorizado ___________________________________________82
Diseño en bloques _________________________________________________________85
Diseño en cuadrado latino ___________________________________________________87
Diseños con estructura factorial de tratamientos __________________________________89
Diseño con estructura anidada de tratamientos ___________________________________94
Diseño en parcelas divididas _________________________________________________96
Diseño en Parcelas Subdivididas_____________________________________________100
Comparaciones Múltiples __________________________________________________104
Contrastes ______________________________________________________________107
Supuestos del ANAVA ____________________________________________________111
Análisis de covarianza_____________________________________________________115
Análisis de la varianza no paramétrico __________________________________________117
Prueba de Kruskal-Wallis __________________________________________________117
Prueba de Friedman_______________________________________________________118
Análisis de regresión lineal ___________________________________________________120
Modelo_________________________________________________________________120
Validación de los supuestos_________________________________________________128
Regresión con variables auxiliares (dummy)____________________________________134
Análisis de regresión no lineal_________________________________________________139
Modelos predeterminados __________________________________________________140
Análisis de correlación_______________________________________________________142
Coeficientes de correlación _________________________________________________142
Coeficientes de correlación parcial ___________________________________________143
Coeficientes de sendero (path analysis) _______________________________________144
6
Correlación entre matrices de distancia _______________________________________ 146
Datos Categorizados________________________________________________________ 147
Tablas de contingencia____________________________________________________ 147
Regresión logística _______________________________________________________ 158
Sobrevida de Kaplan-Meier ________________________________________________ 160
Análisis multivariado__________________________________________________ 165
Estadística descriptiva multivariada ____________________________________________ 166
Análisis de conglomerados___________________________________________________ 171
Métodos de agrupamiento jerárquicos ________________________________________ 175
Métodos de agrupamiento no jerárquicos______________________________________ 179
Distancias ______________________________________________________________ 180
Componentes principales ____________________________________________________ 180
Biplot _________________________________________________________________ 186
Arboles de Recorrido Mínimo (ARM)________________________________________ 187
Análisis discriminante ______________________________________________________ 187
Correlaciones canónicas _____________________________________________________ 195
Regresión por Mínimos Cuadrados Parciales _____________________________________ 199
Análisis de la varianza multivariado____________________________________________ 202
Correlación-distancias-similitudes _____________________________________________ 210
Análisis de correspondencias _________________________________________________ 215
Análisis de coordenadas principales____________________________________________ 219
Árboles de clasificación y árboles de regresión ___________________________________ 221
Biplot y árbol de mínimo recorrido ____________________________________________ 223
Procrustes generalizado _____________________________________________________ 225
Series de Tiempo _____________________________________________________ 231
Simulación y transformaciones________________________________________________ 232
Prueba de raíz unitaria ______________________________________________________ 234
Correlaciones cruzadas ______________________________________________________ 235
Espectro de potencia________________________________________________________ 237
Metodología ARIMA de Box y Jenkins _________________________________________ 239
Suavizados y ajustes ________________________________________________________ 253
Técnicas de suavizado ____________________________________________________ 254
Gráficos _____________________________________________________________ 256
Herramientas Gráficas ______________________________________________________ 257
Solapa Series ___________________________________________________________ 257
Solapa Eje X____________________________________________________________ 260
Solapa Eje Y____________________________________________________________ 261
Solapa Herramientas _____________________________________________________ 262
Ventana Gráficos __________________________________________________________ 263
Suscripción y copia de formatos gráficos______________________________________ 264
Leyendas ______________________________________________________________ 264
Líneas de texto __________________________________________________________ 265
Diagrama de dispersión _____________________________________________________ 266
Gráfico de Puntos __________________________________________________________ 268
Gráfico de barras___________________________________________________________ 269
Gráfico de cajas (box-plot)___________________________________________________ 271
Gráfico de densidad de puntos ________________________________________________ 272
Q-Q plot _________________________________________________________________ 273
Gráfico de la distribución empírica_____________________________________________ 274
7
Histograma________________________________________________________________275
Diagrama de perfiles multivariados_____________________________________________276
Gráfico de estrellas _________________________________________________________278
Gráfico de Sectores _________________________________________________________279
Gráfico de barras apiladas ____________________________________________________282
Matriz de diagramas de dispersión______________________________________________284
Graficador de funciones______________________________________________________285
Aplicaciones _________________________________________________________ 286
Control de calidad __________________________________________________________286
Diagrama de control para atributos ___________________________________________289
Diagramas de control de variables____________________________________________293
Diagrama de Pareto _____________________________________