La Estadística que conocemos hoy en día debe gran parte de su realización a los trabajos matemáticos de aquellos hombres que desarrollaron la teoría de las probabilidades, con la cual se adhirió la Estadística a las ciencias formales.
Definición de Estadística
Aunque el nombre de estadística es internacionalmente reconocido, su enorme campo de aplicaciones, ha hecho que se den diferentes interpretaciones a su quehacer.
Kal Pearson uno de los precursores de las estadística moderna, la definió en 1922, como la ciencia que trata de las aplicaciones de la teoría matemática a la interpretación de observaciones masivas. Es decir, se trata de aplicar matemática al mundo real, donde se tiene gran número de objetos o individuos, a los cuales se les mide o determina una o más características.
Otro ejemplo de esta variedad de definiciones lo encontramos en palabras de Harald Cramer ( 1893-1985), para quien el objetivo fundamental de la estadística consiste en investigar la posibilidad de extraer de los datos estadísticos, inferencias válidas, elaborando los métodos mediante los cuales pueden obtenerse dichas inferencias.
Esta amplia gama de definiciones se hace más extensa si consideramos lo que dicen los científicos que trabajan en campos de aplicaciones estadística, como la econometría, psicometría, etc.
Una idea más acabada de lo que es estadística, aunque quizás menos rigurosa, la encontramos en Ferreiro y Fernández de la Reguera, cuando luego de comentar su definición y campo de aplicación, anota: "Como sea, estamos hablando de la ciencia de la recolección y análisis de datos para la toma de decisiones. La idea es transformar datos en información; para ello comienza presentando técnicas de diseño y recolección de datos a una situación particular, luego, la estadística descriptiva permite resumir lo medular de la información, finalmente inferencia estadística extiende las condiciones obtenidas de la muestra a la población de la que ella es parte y postula modelos que se ajusten a los datos".
División de la Estadística
La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la estadística Descriptiva e Inferencial.
Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar deducir o sacar conclusiones futuras que vayan más allá de los datos, como tales.
Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto numeroso de elementos y esto implica que su análisis requiere de generalizaciones que van más allá de los datos. Como consecuencia, la característica más importante del reciente crecimiento de la estadística ha sido un cambio en el énfasis de los métodos que describen a métodos que sirven para hacer generalizaciones. La Estadística Inferencial investiga o analiza una población partiendo de una muestra tomada.
Es el conjunto de los métodos que se utilizan para extraer la mayor cantidad de información. Estos métodos se pueden dividir en los siguientes seis pasos:
- Definición del problema.
- Recopilación de la información existente.
- Obtención de información original.
- Clasificación.
- Presentación.
- Análisis.
Errores Estadísticos Comunes
Al momento de recopilar los datos que serán procesados se es susceptible de cometer errores así como durante los cómputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitación y que no son tan fácilmente identificables. Algunos de éstos errores son:
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilación y en el análisis de la información. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinión que a aquellos que la contradicen. Un caso extremo de sesgo sería la situación donde primero se toma una decisión y despuès se utiliza el análisis estadístico para justificar la decisión ya tomada.
Datos no comparables: el establecer comparaciones es una de las partes más importantes del análisis estadístico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean comparables.
Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno de los errores que más ha desacreditado el uso del análisis estadístico.
Muestreo Incorrecto: en la mayoría de los estudios sucede que el volumen de información disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la población a que pertenece la muestra. Si la muestra se selecciona correctamente, tendrá básicamente las mismas propiedades que la población de la cual fue extraída; pero si el muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada.
Poblaciones y muestras
Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar resultados de una muestra a una población. Se estudia en particular a un reducido número de individuos a los que se tiene con la idea de poder generalizar los hallazgos a la población de la cual esa muestra procede. Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la probabilidad.
La población representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas características determinadas.
La muestra es el conjunto menor de individuos (subconjunto de la población accesible y limitado sobre el que realizamos las mediciones con la idea de obtener conclusiones generalizables a la población ). La muestra debe ser representativa de la población y con ello queremos decir que cualquier individuo de la población en estudio debe haber tenido la misma probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar:
1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
2. Estudiar la totalidad de las o personas con una característica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar.
3. Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las observaciones y mediciones realizadas a un reducido número de individuos pueden ser más exactas y plurales que si las tuviésemos que realizar a una población.
Clasificación de Variables
Los datos que deben manejarse en una investigación científica para describir los objetivos de interés son, en general, de naturaleza diversa. La consideración de esta diferenciación es esencial para decidir el método de análisis estadístico adecuado. Los datos son valores o categorías específicas de las variables relacionadas al problema.
Se presentan cuatro criterios diferentes para clasificar variables:
Niveles de Medición
1. Nivel Nominal: Este nivel solo permite distinguir entre clases; utilizando números (u otro símbolo), se identifican los grupos a los que pertenecen los diferentes individuos. La recopilación de la información consiste en determinar el número de individuo por clase.
Ejemplo:
- Variable: color de ojos ----> Clases: Café, azules, verdes, etc.
2. Nivel Ordinal: La variable permite un cierto ordenamiento, existe un orden total en cada clase.
Ejemplo:
- Variable: Calificaciones ----> Clases: Excelente, bueno, regular, malo.
3. Nivel de Intervalo: La variable están expresadas en forma numérica, por lo tanto las clases vienen dadas a través de intervalos
Ejemplo:
- Variable: Estatura ----> Clases: [1.30, 1.40], [1.40, 1.50], [1.50, 1.60]
- Variable: N° de hijos --> Clases: 0 – 1, 2 – 3, 4 - 5
4. Nivel de Razón: Escala de intervalo con cero absoluto que significa ausencia del atributo.
Ejemplo:
- Variable: Ingreso familiar ---> Clases: 0, entre 0 y 100000, entre 100000 y 250000, …
En estos ejemplos se observa que existen dos tipos de variables intervalares, que son:
Variable continua: Los valores pueden ser tomados en el intervalo, admitiendo valores intermedios. Ej. Números reales
Variable discreta: Los valores pueden ser tomados dentro del intervalo, no admitiendo valores intermedios. Ej. Números naturales

MUY BUEN DOCUMENTO
ResponderEliminar