º CLASE NRO. 4.

 Carrera: Técnico Superior en Turismo ISFD Nº 173 . 

Prof.: Bartolucci.Angel 

Materia:  Estadística Aplicada al Turismo y la Hoteleria 

Nivel de medición interval. Variables cuantitativas

 Cuando tenemos que procesar variables cuantitativas, nivel de medición interval para obtener un cuadro donde se resuma la información o un gráfico la operación es más compleja que con las variables cualitativas, nivel de medición nominal o ordinal.

 La complejidad aparece cuando necesitamos generar los intervalos, ya que estos normalmente son el producto de una decisión del investigador (¿Cuantos grupo? ¿De que amplitud?) y requieren previamente que los datos se ordenen. El punto de partida, normalmente es la información en bruto, o desordenada y las operaciones que hay que realizar entonces son las siguientes: Ordenar la información, (es preferible en forma ascendente). Esto nos permite rápidamente obtener dos medidas muy útiles. La primera es el Recorrido que consiste en restarle al valor mas alto el valor mas bajo. Es una medida de dispersión. La otra es la Mediana que es un numero que, cuando la serie de números esta ordenada, tiene la misma cantidad de valores por encima que por debajo. Esta es una medida de tendencia central. Luego se hace necesario encarar la construcción del intervalo y esto consiste en dos decisiones a saber:

 A). Elección de la amplitud del intervalo.

 B). Determinar el numero de grupos.

 Las dos decisiones son interdependientes. P.Ej. Al elegir intervalos mas chicos estoy eligiendo un numero más grande de grupos. En A se debe buscar que los limites simplifiquen los cuadros y los cálculos. De esta manera se ahorra tiempo y energía. En especial es importante fijar los puntos medios representados en números enteros. B. Con respecto a la cantidad de grupos, en la actividad turística por convención, se toman entre 5 y 20 grupos, dependiendo del volumen de la información. Veamos la información del siguiente cuadro:

 Cuadro Nº 1 

Antigüedad de las agencias encuestadas, en años

   Antigüedad  de las agencias encuestadas, en años.

 

11

32

39

46

16

33

40

47

23

35

41

53

26

37

42

55

30

38

45

59

 

 En el ejemplo del cuadro 1 el volumen de la información es muy reducido, ya que solo se trata de 20 valores o frecuencias, por lo tanto, en este caso lo conveniente será adoptar el valor mínimo de cantidad de grupos o sea 5. Este criterio de la cantidad de grupos debemos combinarlo con el que establece Galtung (1) para lo que el llama "una buena muestra" y que consiste en tratar que en cada celda, haya como mínimo 10 (diez) frecuencias de promedio y 20 de máximo como deseable. (2) Esto significa que si la cantidad a encuestar esta entre 50 y 100 (n=50 o n=100) podemos trabajar con 5 grupos. En la practica trabajar con 5 grupos y 200 datos no nos traería ningún problema. Procedimiento para Iniciar la Agrupación de los Datos.

 (1). Hay que detectar en los datos originales cual es la cifra mayor y cual es la cifra menor. En el ejemplo anterior el gasto menor es 11 y el mayor es 59. Estas cifras se marcan en forma destacada. 

(2). La segunda operación es establecer el recorrido de los datos originales, en nuestro ejemplo: 59 - 11 = 48. 

(3). La tercera operación es dividir el recorrido (48) por el numero de grupos (5). El resultado de esta operación es 9.6 Para evitar el uso de un intervalo fraccionario, el procedimiento es disminuirle al dato menor el mismo valor que se le aumenta al mayor, para no desequilibrar la serie. Es fundamental que los puntos medios queden en números redondos. P ej. : 11 - 1 = 10 59 + 1 = 60 Estas dos nuevas cifras toman el nombre de limite inferior (Li; 10) y limite superior (Ls; 60) de la distribución de los datos agrupados.

(4). A la diferencia entre estos dos nuevos limites, se le llama intervalo o recorrido de los datos agrupados. La formula es: Rda= Ls - Li En donde Rda :Recorrido de datos agrupados; Ls :Limite superior; Li : Limite inferior reemplazando tenemos Rda= 60 - 10 Rda=50

 (5). Determinación del intervalo de clase. El Rda (recorrido de los datos agrupados) 50 es un múltiplo de 5 que es el numero de grupos que determinamos. De esta manera queda un intervalo cómodo para realizar los cálculos. El Rda dividido por el numero de grupos da el intervalo de clase. 

La formula es

            Intervalo de clase =  Recorrido de los datos agrupados  =  50    = 10

                                                    Numero de grupos                             5

           

 

 

 6). Determinación de los limites inferiores y superiores de cada grupo. Se suma al valor mas bajo de la serie (en este caso 10) el intervalo (en este caso también 10), quedando determinado el limite inferior y el limite superior de la primera clase o el 1er.grupo de clase. Al limite superior del primer grupo (en este caso 20) se le suma el intervalo de clase (en este caso 10) quedando constituido el limite inferior y limite superior del segundo grupo. Con este procedimiento se completan los restantes grupos. Los grupos quedan de la siguiente manera: 

Limite inferior

Limite Superior

10

20

20

30

30

40

40

50

50

60

 

 

(7). Adoptar un criterio con respecto a valores limites. Si observamos los datos originales vemos que hay valores que se encuentran justo en los limites del intervalo por ej. 30; 40 ¿Donde los ubicamos? ¿En que grupo? Por ejemplo el 30 en que grupo lo ubicamos en el 2do. 20-30 o en el 3ro. 30-40. ? Para superar este problema se acostumbra a agregarle al limite inferior una fracción de 0.1, lo que determina claramente donde puede ubicarse una cifra que tenga el mismo valor que el limite superior. Los grupos quedarían de la siguiente forma:

Limite Inferior

Limite superior

10,1

20

20,1

30

30,1

40

40,1

50

50,1

60

 

 Con respecto a la pregunta formulada, el valor 30 se incluye en el segundo grupo - de 20.1 a 30 - y el valor 40 se incluye en el tercer grupo de - 30,1 a 40.

 (8). La inclusión de cada uno de los valores de la distribución debe hacerse cifra por cifra, tachándola inmediatamente que se la ha incluido en el grupo correspondiente. Este sistema se denomina de señal y consiste en ir formando manojos por líneas verticales - hasta un máximo de 4 - cruzando el quinto valor con una línea oblicua. Estos manojos tienen la función de facilitar el control en forma rápida. Vamos a ver en un cuadro de trabajo como aparecen las frecuencias. Ver cuadro Nro.1 y 2.antigüedad, en años, de las agencias encuestadas.

   cuadro nro.2.

             Antigüedad de las agencias encuestadas, en años

 

Grupo

Intervalo de clase

Señal

en cifras

1

10,1 a 20

//

2

2

20,1 a 30

///

3

3

30,1 a 40

//// //

7

4

40,1 a 50

////

5

5

50,1 a 60

///

3

Total

 

 

20

 

 En el cuadro 3 se reemplazan las señales por los valores originales respectivos.

cuadro nro.3.

Antigüedad de las agencias encuestadas, en años

 

grupo

Intervalo de clase

VALORES NUMERICOS

En cifras

1

10,1 a 20

16,11

2

2

20,1 a 30

26,30,23

3

3

30,1 a 40

33,35,39,40,37,32,38

7

4

40,1 a 50

46,41,42,45,47

5

5

50,1 a 60

59,55,53

3

Total

 

 

20

 

 

 El paso siguiente consiste en elaborar la tabla de frecuencias 

(9).Tabla de frecuencias. La tabla de frecuencias esta integrada por siete columnas, que son las siguientes: 

1ra. Columna.Símbolo Li = Limite inferior de clase

 2da. Columna.Símbolo Ls = Limite superior de clase 

3ra. Columna.Símbolo Pm = Punto medio 

4ta. Columna.Símbolo f = frecuencias (absolutas)

 5ta. Columna.Símbolo Fa = frecuencias (absolutas acumuladas)

 6ta. Columna.Símbolo fr =frecuencias (relativas)

 7ma. Columna.Símbolo Fra =frecuencias (relativas acumuladas)

                                                                                                     

 Cuadro 4. Determinación de la tabla de frecuencias. 

PRIMERA

SEGUNDA

TERCERA

 

CUARTA

QUINTA

SEXTA

SEPTIMA

Limite Inferior

Limite Superior

Punto medio

Frecuencias

Frec.Absol

Acumuladas

Frecuencias rel

frecuencias  relativas acumuladas

Li

Ls

Pm

f

Fa

Fr

fra

10

20

15

2

2

0.10

0.10

20

30

25

3

5

0.15

0.25

30

40

35

7

12

0.35

0.60

40

50

45

5

17

0.25

0.85

50

60

55

3

20

0.15

1.00

TOTALES

 

 

20

 

1.00

 

 

 En la primera columna de este cuadro se puede observar que en los grupos se ha borrado la fracción .1 para evitar confusiones, ya que solo se habían colocado para facilitar la elaboración de cuadros. En la presentación de los resultados finales del estudio, los cinco grupos se presentan así: de 10 a 20; de 21 a 30; de 31 a 40; de 41 a 50; de 51 a 60. (10). 

Calculo de los Promedios Cuando se observa que en los datos existe una tendencia a concentrarse sobre un punto central, el promedio mas real es el aritmético. Para calcular este promedio sobre los datos no agrupados ú originales, se utiliza la formula:

                             Sumatoria Ti

               Mdo= -------------------------                       Donde Ti = Cada uno de los datos

                                    N                                                                 originales

                                   N  = Cantidad de datos

   Mdo = Media de datos originales.

            Si reemplazamos:

                                                   Sumatoria Ti= 33+59+26...+47 =748

                                                                                    748

Sumatoria Ti= -------=    37.40

                                                                                     20

 

 Para el calculo de la media con los datos agrupados tenemos dos procedimientos. Tomando como base la información del cuadro 3 se multiplica los Pm (puntos medios del intervalo) por las frecuencias relativas - fr -. La suma de este resultado da el promedio. 

Procedimiento Nº 1 para obtener la media aritmética se multiplica los puntos medios del intervalo por las frecuencias relativas. 

 

TERCERA       

 

SEXTA

TOTAL

Punto medio

Frecuencias rel

Pm x fr

Pm

fr

fr

15

0.10

1.5

25

0.15

3.75

35

0.35

12.25

45

0.25

11.25

55

0.15

8.25

 

1.00

37

 

 El otro procedimiento, consiste en multiplicar los Pm por las frecuencias absolutas (f) y dividiendo su suma por N se obtiene también el mismo resultado. Ver cuadro Nro. . 4

TERCERA

 

CUARTA

Total

Punto medio

Frecuencias

Pm x f

 

Pm

F

 

15

2

30

25

3

75

35

7

245

45

5

225

55

3

165

 

20

740

 

 Procedimiento nº 2 para obtener la media aritmética se multiplica los puntos medios (pm) del intervalo por las frecuencias absolutas (f) y se divide su suma por el total de los valores (N) 

.La Mediana Cuando se realizan investigaciones del mercado turístico se presentan en muchas ocasiones una gran variación en los datos. Esta desproporción se puede observar en el siguiente cuadro: 

            Cuadro Nro. 5

Total de habitaciones  en una localidad turística.

    

HOTEL

Nº DE HABITACIONES

A

1000

B

250

C

120

D

20

E

40

TOTAL

1430

 

 

Si en este caso recurrimos a la media aritmética y dividimos las 1430 habitaciones entre los 5 hoteles nos da un promedio de 286 habitaciones. Este promedio tomado como base, deja todas las estimaciones fuera de la realidad, por la heterogeneidad de la serie. Cuando existen valores extremos, el promedio mas adecuado es la mediana, que es aquel termino de la serie que divide los datos ordenados en forma creciente, en dos grupos del mismo numero de observaciones. Las cifras del cuadro anterior ordenadas de forma creciente serian: 20 40 120 250 1000 En este caso la mediana es 120 habitaciones, muy inferior a 286 que fue la media aritmética. Cuando la suma de los datos es impar, como en este caso, la mediana es el valor central y si son pares, la mediana es la semisuma de los dos valores centrales. Vamos a poner un ejemplo con una suma de datos impar. Cuadro Nro. 6 

Total de habitaciones en una localidad turística. 

Hotel Nº de habitaciones

 A                   1000

 B                      250 

C                     120

 D                     20

 E                     40

 F                     70

 TOTAL        1500 

Tomando los datos del cuadro anterior y ordenándolos en forma ascendente quedan:

 20 40 70 95 120 250 1000 

Cuando el numero de datos de la serie es par se toman los dos valores del centro (70 y 120) y su suma (190) se divide por 2,los que no da un resultado un resultado de 95 muy diferente al de 250, que es el promedio aritmético. 

(12). Procedimiento para facilitar la ubicación de la mediana

                                                                       n + 1 

Con este propósito se utiliza la formula   ------- 

                                                                        2

 que aplicada a los datos de los dos cuadros anteriores seria:

 5 + 1

 ---------- = 3

2

 

 Esto significa que el termino localizado en el tercer lugar es la mediana, o sea 120. 

                                                    6 + 1 

En el segundo caso seria   ---------- =  3.5 

                                                      2 

Esto significa que la mediana se encuentra localizada entre el tercero y cuarto termino, para lo cual se suma 70 y 120 y se divide el total por dos, es decir 95. Esto para datos originales. 

(13). Mediana para datos agrupados. La mediana para datos agrupados, se calcula determinando primero a la menor de las frecuencias acumuladas que sobrepasa a  la mitad del tamaño de la muestra 

                                     20

,(en nuestro caso -------------   ), 

                                       2

 una vez ubicada se la llama Faj 

y a la fila se la denomina "fila de orden j ".

 Se presentan dos casos: 1ro.Cuando la frecuencia acumulada anterior a la fila de orden j es menor al tamaño de la muestra sobre dos.

 En el 2do. caso la frecuencia acumulada anterior a la fila de orden es igual al tamaño de la muestra sobre dos. Para comprender el calculo de la mediana de datos agrupados, se toma la distribución de frecuencias del Cuadro Nro. 4 y se trasladan las primeras 5 columnas al cuadro Nro. 7.Con el fin de establecer la fila de orden j. 

Cuadro 7 Determinación de la fila de orden j para el calculo de la mediana en datos agrupados. 

PRIMERA

SEGUNDA

TERCERA

CUARTA

QUINTA

10

20

15

2

2

20

30

25

3

5         Faj-1

 

Li  j

30

 

Ls j

40

fila de orden j

pmj

35

 

fj

7

 

        Faj

12

40

50

45

5

17        Faj+1

50

60

55

3

20

 

Total

 

 

n= 20

 

 

 

 En el cuadro anterior la suma de las frecuencias es igual a 20, que es el tamaño de la muestra (n) n

                                                                              n

luego     ---------- =10.

                                                                               2

 

La menor frecuencia acumulada que sobrepasa a n/2 es 12 la cual toma la denominación de Faj, y toda la fila toma el nombre de "fila de orden jota ".

 La frecuencia acumulada anterior a Faj se llama Faj-1 y la posterior Faj+1,en este caso los números son 5 y 17 del cuadro anterior. En la fila de orden jota al 7 se le asigna la simbología de fj; al 35 Pmj; al 40 Lsj y finalmente al 30 Lij. O sea que solo es agregar al subíndice del símbolo que encabeza cada columna la letra jota.

 Cuando Faj-1 es menor que n/2,la mediana debe calcularse a través de la formula:

 

                                                                     n

                                                                      ---  -    Faj-1

                                                                      2

                                                   Me= Lij +---- ------------ x Ic

                                                                       fj

 

 

 Ic es el intervalo de clase sea 10.Aplicando la formula al ejemplo, se tiene:

 

                                                                       20  

                                                                        ---  - 5

                                                                         2

                                                 Me =  30  + ------------ x  10

                                                                         7

 

                                                                  50

                                                   Me=30 + ----

                                                                    7

 

 

                                                Me = 37.14 

Cuando Faj-1 es igual a n/2, la mediana se reduce a Lij así: Me=Lij 

La mediana también es importante, por cuanto con su auxilio se puede calcular en el caso de las series abiertas, porque esta no esta influida por los valores extremos, como en el caso de que el gasto turístico se presente así: 

                                   Menos de 10 dólares

                                  de 10 a 20     dólares

                                  de 20 a 30     dólares

                                  de 30 a 40     dólares

                                  de 40 a 50     dólares

                                  de 51 y más dólares.

 

 

 MODA

 Es otro estadígrafo de posición o promedio y se representa por Mo. A veces se le da otra denominación como modo promedio, valor típico y modo.

 Se define como el valor mas frecuente, o sea el valor que cumple con la condición de tener una frecuencia mayor que los valores inmediatamente inferior o superior. Si no se cumple esta regla no existe moda o sea que no se puede obtener.

 Fj es la frecuencia mayor y fj-1 la anterior y fj+1 la posterior.

 En el ejemplo de la antigüedad de las agencias, la aplicación es la del cuadro Nro. 8 . CUADRO Nro.8 

Determinación de la moda en datos agrupados.

PRIMERA

SEGUNDA

TERCERA

CUARTA

10

20

15

2

 

20

 

30

 

25

fj-1

3

 

Lija

30

 

Ls j

40

fila de orden j

pmj

35

 

fj

7

40

50

45

fj+1

5

50

60

55

3

Total

 

 

20

 

 

  La formula es: 

                                                 fj -(  fj-1)

Mo= Lij + -------------------------------   x  Ic

                 (fj-( fj-1)) + (fj-( fj+1))

                        Aplicando al ejemplo:

                                              7-3

Mo=30  + -------------------- x 10

                   (7-3)  + (7-5 )

 

                        Mo =  30 +  4     x10                Mo = 36,67

                                             6

 

 

 

 Cuando se le quiere dar mayor importancia al grupo que se destaca entre los demás, se debe utilizar la moda, como en el caso del mercado turístico interno y del desarrollo del turismo social.

 La moda también tiene la ventaja que se puede calcular en series abiertas y se puede representar también gráficamente a través del histograma de frecuencias. En una serie estadística puede existir mas de una moda. Cuando solo hay una moda la distribución es unimodal, si tiene dos ser bimodal y si hay varias plurimodal.

 Otra forma más sencilla de calcular la Moda consiste en tomar el valor del Pm de la frecuencia absoluta mayor 

En el ejemplo anterior tenemos que la frecuencia absoluta mayor es 7 y el Pm del intervalo que la contiene es 35 por lo tanto el modo es 35.

 Nuria Cortada de Kohan lo define como “El punto medio del intervalo de clase que tiene mayor frecuencia” (3)

----------------------------------------------------------------------------------------------------------------------------------------

La pagina del profesor:

http://espanol.geocities.com/angelbartolucci

..................................................................................................................................

1). Galtung, Johan "Teoría y métodos de la investigación social"

T. 1. pag.62.Editorial EUDEBA.1966.

2). “Celda” = Se refiere al lugar donde se encuentran, en un cuadro de doble entrada, dos variables. La celda  se forma por la intersección de una fila y una columna. Por ejemplo en el cuadro Nº 6,hay seis celdas  con datos numéricos a saber:

 

3). Nuria Cortada de Kohan. ”Diseño Estadístico “ Eudeba 1994. pag. 77.

presentacion psocialE.Pichon Rivierre

estadisticaQuetelet

metodologiaBourdeux Pirre correo  Podes mandarle un mensaje al profesor inicio Ir al inicio

 

        

1
Hosted by www.Geocities.ws