lunes

Introducción


¿Qué es la estadística?


ESTADÍSTICA es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos.

Los datos son generalmente imperfectos en el sentido que aún cuando posean información útil no nos cuentan la historia completa. Es necesario contar con métodos que nos permitan extraer información a partir de los datos observados para comprender mejor las situaciones que los mismos representan.

Algunas técnicas de análisis de datos son sorprendentemente simples de aprender y usar más allá del hecho que la teoría matemática que las sustentan puede ser muy compleja. Todos, aún los estadísticos, tenemos problemas al enfrentarnos con listados de datos.

Existen muchos métodos estadísticos cuyo propósito es ayudarnos a poner de manifiesto las características sobresalientes e interesantes de nuestros datos que pueden ser usados en casi todas las áreas del conocimiento.

Los métodos estadísticos pueden y deberían ser usados en todas las etapas de una investigación, desde el comienzo hasta el final. Existe el convencimiento de que la estadística trata con el ANÁLISIS DE DATOS (quizás porque esta es la contribución más visible de la estadística), pero este punto de vista excluye aspectos vitales relacionados con el DISEÑO DE LAS INVESTIGACIONES. Es importante tomar conciencia que la elección del método de análisis para un problema, se basa tanto en el tipo de datos disponibles como en la forma en que fueron recolectados.


Áreas de la estadística
Describiremos brevemente cada una de las áreas en que puede dividirse la estadística:

I. Diseño: Planeamiento y desarrollo de investigaciones.
II. Descripción: Resumen y exploración de datos.
III. Inferencia: Hacer predicciones o generalizaciones acerca de características de
una población en base a la información de una muestra de la población.

I. Diseño
Es una actividad crucial. Consiste en definir como se desarrollará la investigación para dar respuesta a las preguntas que motivaron la misma. La recolección de los datos requiere en general de un gran esfuerzo, por lo que, dedicar especial cuidado a la etapa de planificación de la investigación ahorra trabajo en las siguientes etapas. Un estudio bien diseñado resulta simple de analizar y las conclusiones suelen ser obvias.

Un experimento pobremente diseñado o con datos inapropiadamente recolectados o registrados puede ser
incapaz de dar respuesta a las preguntas que motivaron la investigación, más allá de lo sofisticado que sea el análisis estadístico.

Aún en los casos en que se estudian datos ya registrados, en que estamos restringidos a la información existente, los principios del buen diseño de experimentos, pueden ser útiles para ayudar a seleccionar un conjunto razonable de datos que esté relacionado con el problema de interés.

II. Descripción
Los métodos de la Estadística Descriptiva o Análisis Exploratorio de Datos ayudan a presentar los datos de modo tal que sobresalga su estructura. Hay varias formas simples e interesantes de organizar los datos en gráficos que permiten detectar tanto las características sobresalientes como las características inesperadas. El otro modo de describir los datos es resumirlos en uno o dos números que pretenden caracterizar el conjunto con la menor distorsión o perdida de información posible.

Explorar los datos, debe ser la primera etapa de todo análisis de datos. ¿Por qué no analizarlos directamente? En primer lugar porque las computadoras no son demasiado hábiles (sólo son rápidas), hacen aquello para lo que están programadas y actúan sobre los datos que les ofrecemos. Datos erróneos o inesperados serán procesados de modo inapropiado y ni usted, ni la computadora se darán cuenta a menos que realice previamente un análisis exploratorio de los datos.

III. Inferencia
Inferencia Estadística hace referencia a un conjunto de métodos que permiten hacer predicciones acerca de características de un fenómeno sobre la base de información parcial acerca del mismo. Los métodos de la inferencia nos permiten proponer el valor de una cantidad desconocida (estimación) o decidir entre dos teorías contrapuestas cuál de ellas explica mejor los datos observados (test de hipótesis).

El fin último de cualquier estudio es aprender sobre las poblaciones. Pero es usualmente necesario, y más práctico, estudiar solo una muestra de cada una de las poblaciones.

Definimos:
POBLACIÓN ⇒ total de sujetos o unidades de análisis de interés en el estudio
MUESTRA ⇒cualquier subconjunto de los sujetos o unidades de análisis de la población, en el cual se recolectarán los datos. Usamos una muestra para conocer o estimar características de la población, denominamos:

PARÁMETRO ⇒ una medida resumen calculada sobre la población
ESTADÍSTICO ⇒ una medida resumen calculada sobre la muestra

La calidad de la estimación puede ser muy variada, y generalmente las estimaciones estadísticas son erróneas, en el sentido que no son perfectamente exactas. La ventaja de los métodos estadísticos es que aplicados sobre datos obtenidos a partir de muestras aleatorias permiten cuantificar el error que podemos cometer en nuestra estimación o calcular la probabilidad de cometer un error al tomar una decisión en un test de hipótesis.

Finalmente, cuando existen datos para toda la población (CENSO) no hay necesidad de usar métodos de estadística inferencial, ya que es posible calcular exactamente los parámetros de interés. En el censo poblacional, por ejemplo, se registra el sexo de todas las personas censadas, que son prácticamente toda la población, así que es posible conocer exactamente la proporción de habitantes de los dos sexos.

BIOESTADÍSTICA
Es la disciplina que se encarga de generar y aplicar métodos estadísticos a información o datos provenientes de las áreas biológicas.

VARIABLE
Es una característica que interesa evaluar ya sea en un individuo o en un objeto, y que, como su nombre lo dice, varía o cambia de un individuo a otro. Si todos los individuos observados son homogéneos para la característica en cuestión, ya no se habla de una variable, sino de una constante. Otra definición más corta: variable es lo que está siendo observado o medido.

Las variables pueden ser clasificadas de diferentes maneras:

Cualitativas y Cuantitativas. Las variables cualitativas o atributos no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Las variables cuantitativas tienen valor numérico (edad, precio de un producto, ingresos anuales). Ejemplos:

Cuantitativas

  • Peso
  • Diámetro
  • Altura
  • Número de plantas

Cualitativas

  • Variedad o especie
  • Raza
  • Color
  • Tipo de suelo


Discretas y continuas. Esta es otra forma de clasificar las variables. Una variable es discreta si entre dos valores contiguos no existe ningún otro valor posible, es decir, hay “saltos” entre los valores que toma la variable; mientras que en una variable continua, entre cualquier para de valores observables siempre hay infinitos valores posibles de ser observados. A veces se toma como regla de clasificación que las variables discretas no pueden tomar valores que involucren cifras decimales, pero esto no siempre se cumple,
veamos un ejemplo:

Si en un examen definimos una variable como la relación de respuestas correctas respecto al total de preguntas formuladas, los valores posibles siempre serán fraccionarios: 1/5, 2/5, ...etcétera y a pesar de esto, la variable sería discreta.

No hay comentarios:

Publicar un comentario