[R-es] Muestreo de bases de datos.-

Freddy Omar López Quintero freddy.vate01 en gmail.com
Lun Mayo 4 20:15:33 CEST 2015


¡Hola!

Mi duda surge por la siguiente anécdota: un amigo (empleado de una enorme
consultora que tiene SAS) migró a R y ansioso me contó que iba a ejecutar
las rutinas que había traducido de SAS a R y luego de intentar ejecutarlas
nada le funcionó porque, ingenuamente, quería hacer cosas para las cuales R
no está diseñado (operaciones en la base de datos) y porque leyó TODOS los
datos de una consulta (millones de registros) e intentó correr algún
procedimiento (!). Me dijo que SAS corre todo lo que él necesita y pues
quedó tristemente decepcionado.

Yo le dije que es corriente tomar una muestra de los datos para calibrar
los modelos que se van a necesitar y que no es necesario utilizar los
millones de registros enteros. Esto me hizo pensar ¿existen normas o buenas
prácticas para el muestreo de las bases de datos?¿existen
normativas?¿lineamientos? Es claro que mi primera respuesta sería ocupar
los métodos ya desarrollados para encuestas, pero quién sabe.

Si existen: ¿tienen su contraparte en R?

Gracias y disculpen las molestias.

¡Salud!

-- 
«No soy aquellas sombras tutelares
que honré con versos que no olvida el tiempo.»

JL Borges

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es