Estadística en Microcomputadores/Selección de datos

11.6 SELECCION DE DATOS

Esta opción permite establecer qué observaciones específicas de la memoria de trabajo se considerarán en los procesos subsiguientes, mediante la definición de una condición que deben cumplir sus valores para ser seleccionados. Para su ejecución se siguen los siguientes pasos, a partir de la elección del proceso en el Menú de Manejo de Datos:

a) Si no hay datos en la memoria de trabajo se sale de la opción. En caso contrario, se presentan en pantalla las variables contenidas en la memoria de trabajo. Si ya existe una condición de selección definida previamente se interroga sobre si se elimina o no. En caso afirmativo se la anula, se sacan las marcas de las observaciones que quedaban excluidas y se sale de la opción. En caso negativo se interroga si se desea o no modificar la condición. En caso de respuesta negativa a esta segunda interrogación se sale directamente de la opción.

b) Se ingresa la condición de selección a considerar. En el caso de que ya exista una condición previa, ésta puede ser modificada (editada) mediante las teclas de edición "Insert" y "Delete" usuales en los microcomputadores.

La condición se define mediante una expresión lógicomatemática que se construye utilizando la sintaxis del lenguaje BASIC y de la manera que en este lenguaje se establece una condición lógica. Las variables que se pueden utilizar en dicha expresión son las siguientes: V(j) representa el valor de la variable en la posición j de la memoria de trabajo, para cada observación. La variable debe tener datos incorporados en la memoria de trabajo.

I representa el número de orden de cada observación en la memoria de trabajo. Asimismo, se pueden usar todos los operadores y funciones definidos en el lenguaje BASIC. Ellos son:

Operadores y funciones matemáticas:

+ - * / INT() FIX() INT() LOG() MOD() SIN()

COS() SQR() TAN()

Operadores lógicos y de relación:

= < > <> <= >= OR AND


Por ejemplo, las siguientes expresiones son casos válidos de condiciones de selección:

V(3) > (3 * LN(V(4))) OR (V(5) + V(6)) < 3

I > 20 AND V(7) < (V(2) + V(3))

V(8) = 5 or (I > 10 and SQR(V(3)) > 2)


c) El computador coloca una marca en todas aquellas observaciones de la memoria de trabajo que no cumplen la condición de selección definida. Los procesos posteriores que se ejecuten no considerarán las observaciones de la memoria de trabajo que tengan dicha marca. Una vez realizado el proceso aparece en pantalla el mensaje "Selección terminada".

En el Cuadro 11.5 incluimos la ejecución de una selección siguiendo los pasos anteriores, que se realiza sobre los datos correspondientes a nacimientos en la ciudad de Buenos Aires (NATIVBA), que se encuentran cargados en la memoria de trabajo. Mediante ella se seleccionan los nacimientos cuya madre tiene entre 22 y 29 años de edad, y que trabaja.