lunes, 15 de abril de 2019

Intervalo de Confianza


Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población en particular produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje de los intervalos de confianza resultantes incluiría el parámetro de población desconocido.
En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea horizontal contienen el valor de la media de la población. El intervalo de confianza rojo que está completamente por debajo de la línea horizontal no lo contiene. Un intervalo de confianza de 95% indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de confianza que contendrán el parámetro de población.

Estimación de Parámetros


El campo de la inferencia estadística trata básicamente de predicciones y generalizaciones. Por ejemplo, se puede afirmar, basándose en opiniones recogidas por medio de una encuesta, que en las próximas elecciones presidenciales el candidato de gobierno obtendrá 60% de los votos. Para hacer esta afirmación fue necesario determinar el porcentaje de votos favorables en una muestra seleccionada de la población. Al porcentaje obtenido de esta forma se le llama “estadístico” o “esta-dígrafo”.
A partir de este valor se puede estimar el porcentaje real de votos que dicho candidato obtendrá el día de la elección. Este porcentaje real proviene del universo de votantes o población y se le llama parámetro. En general, cualquiera de las medidas de resumen -promedio, desviación estándar, porcentaje, tasa- se considera “estadístico” si proviene de la muestra, y “parámetro” si proviene del universo o población.
La inferencia estadística entrega las herramientas para realizar afirmaciones acerca de un parámetro de la población, basándose en el valor del respectivo estadístico proveniente de una muestra. Para realizar estas inferencias es necesario conocer, previamente, la distribución de probabilidad del estadístico. A la distribución de probabilidad de un estadístico se le llama “distribución muestral”.
Podemos tomar una muestra, calcular en ella un estadístico (promedio o porcentaje, por ejemplo) y luego hacer afirmaciones respecto del correspondiente parámetro. Esto se conoce con el nombre de estimación de parámetros, y se puede hacer de dos formas:

Estimación puntual: consiste en asumir que el parámetro tiene el mismo valor que el estadístico en la muestra.
Estimación por intervalos: se asigna al parámetro un conjunto de posibles valores que están comprendidos en un intervalo asociado a una cierta probabilidad de ocurrencia. También se llaman “intervalos de confianza” debido a que la probabilidad asociada a ellos es la confianza de los mismos. Así, diremos que un intervalo de 99% de confianza es más confiable que uno de 95%. También se define la confianza de la estimación como la probabilidad de acertar con el intervalo.

domingo, 3 de febrero de 2019

Características del Muestreo por Aceptación y Muestreo Sistemático

Muestreo por aceptación

El muestreo por aceptación involucra tomar muestras aleatorias de lotes de la población (tandas de materias primas o productos terminados) para que el inspector los evaluara contra los estándares predeterminados.

En este sentido se pretende enjuiciar sobre un lote.
Se tiene la alternativa de inspeccionarlo todo (100%), no inspeccionarlo, o realizar un muestreo de aceptación.

Características

  1. El Muestreo por Aceptación se emplea primordialmente como una herramienta o técnica para el control de calidad en una línea de producción o para la verificación de productos ya terminas en espera para el despacho.
  2. En el ámbito industrial, se puede resumir como un método de evaluación aleatoria que ayuda al inspector, supervisor, o encargado de calidad a decidir si el lote de mercancías o productos cumple con los estándares de la organización u empresa.
  3. Dicho de otra manera, es simplemente, una herramienta de ayuda al momento de decidir si la mercancía evaluada cumple o no con los estándares para la salida de fábrica.



Muestreo Sistemático

El muestreo aleatorio sistemático es una variación del tipo de muestreo aleatorio simple. Este 
procedimiento requiere de una lista que incluya a todos los miembros de la población general; pero no precisa la utilización de una tabla de números aleatorios.

Se parte de un número elegido al azar, y se incluye en la muestra cada enésimo miembro de la lista, por intervalos fijos.

Características

  1. Puede aplicarse en la mayoría de las situaciones, la única precaución que debe tenerse en cuenta es comprobar que la característica que estudiemos no tenga periodicidad que coincida con la del muestreo.
  2. Dentro de las industrias, el muestreo sistemático se define como la recolección de muestras de acuerdo con una distribución real o espacial homogénea, o un patrón o malla definidos.





Importancia de las Medidas de Posición, Centralización y Dispersión


Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando.  La descripción de un conjunto de datos, incluye como un elemento de importancia la ubicación de éstos dentro de un contexto de valores posible. Una vez definidos los conceptos básicos en el estudio de una distribución de frecuencias de una variable, estudiaremos las distintas formas de resumir dichas distribuciones mediante medidas de posición (o de centralización), teniendo presente el error cometido en el resumen mediante las correspondientes medidas de dispersión.

Pero estas medidas de posición de una distribución de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Toda síntesis de una distribución se considerará como operativa si intervienen en su determinación todos y cada uno de los valores de la distribución, siendo única para cada distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación, se describen las medidas de posición más comunes utilizadas en estadística, como lo son:
  • Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero, segundo y tercer cuartil.
  • Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).
  • Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero a los noventa y nueve percentiles).



Las medidas de centralización son empleadas para resumir a los conjuntos de datos que serán sometidos a un estudio estadístico, se les llama medidas de tendencia central porque general mente la acumulación más alta de datos se encuentra en los valores intermedios. Estas medidas son utilizadas con grandes frecuencias como medidas descriptivas de poblaciones o muestras.

Las más empleadas:
1. Moda - Es el valor con una mayor frecuencia en una distribución de datos.
2. Mediana – Representa el valor de la variable que deja por debajo de sí a la mitad de los datos en un conjunto ordenados de menor a mayor.
3. Media – Promedio o valor obtenido por la suma de todos los datos (valores) dividida entre el número de sumandos.



Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribución. Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda solo no revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad.

La dispersión es importante porque proporciona información adicional que permite juzgar la contabilidad de la medida de tendencia central. Si los datos se encuentran amplia-mente dispersos, la posición central es menos representativa de los datos ya que existen problemas característicos para datos amplia-mente  dispersos, debemos ser capaces de distinguir que representaban esa dispersión antes de abordar esos problemas.


domingo, 11 de noviembre de 2018

Intervalo de Confianza

Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un pará...