¿Cuál es la estructura fundamental de un Dataframe en R?
Relaciona este concepto con la organización de una planilla de Excel.
Un Dataframe requiere que todas sus columnas tengan la misma longitud para mantener una estructura tabular.
Conceptualmente, un Dataframe funciona como una planilla de cálculo donde las variables son columnas y las observaciones son filas.
Los Dataframes son estructuras bidimensionales y pueden contener distintos tipos de datos como texto y números.
A diferencia de las matrices, los Dataframes permiten que cada columna tenga un tipo de dato diferente.
¿Qué operador se utiliza para extraer una columna específica de un Dataframe utilizando su nombre?
Es un símbolo comúnmente asociado con el dinero.
El signo de moneda permite referenciar directamente una variable por el nombre asignado en el encabezado.
En R, este símbolo se utiliza exclusivamente para escribir comentarios en el código.
Este símbolo se utiliza para objetos de clases más complejas (S4), no para Dataframes estándar.
Este es un operador lógico que representa la conjunción ‘Y’.
Si queremos ver únicamente los datos del tercer estudiante (Fila 3) con todas sus columnas, ¿cuál es la sintaxis correcta?
Sigue la regla sagrada de [Fila, Columna].
Esta sintaxis selecciona la tercera columna completa, no la tercera fila.
En la regla de los corchetes, el primer espacio corresponde a las filas; dejar el segundo espacio vacío selecciona todas las columnas.
Aunque en Dataframes esto puede seleccionar una columna, no es la forma estándar de indexar filas.
Los paréntesis se utilizan para funciones, mientras que los corchetes son para indexación de datos.
¿Qué sucede internamente si intentas crear un Dataframe con nombres de columna que contienen espacios?
Observa qué signo de puntuación suele aparecer en los nombres cuando hay errores de formato.
R intenta corregir el nombre automáticamente en lugar de detener la ejecución.
R no elimina los caracteres, sino que los sustituye por un separador estándar.
Por defecto, R no permite caracteres especiales en los nombres de variables y usa puntos para asegurar la compatibilidad técnica.
La normalización de nombres no afecta al uso de mayúsculas o minúsculas, solo a caracteres especiales.
¿Cuál es la función del argumento `check.names = FALSE` al crear un Dataframe?
Considera qué pasaría si quisieras mantener un nombre exactamente como lo escribiste originalmente.
Desactiva la validación automática, permitiendo nombres literales, aunque obligará al uso de comillas para referenciarlos después.
Este argumento solo afecta a los encabezados de las columnas, no al contenido de los datos.
La validación de duplicados se realiza con otras funciones específicas como unique() o duplicated().
La validación de nombres es un proceso gramatical de R, no una optimización de velocidad de procesamiento.
Si necesitas saber cuántas filas y cuántas columnas tiene un Dataframe simultáneamente, ¿qué función debes usar?
Busca una función cuya abreviatura signifique ‘dimensiones’.
Esta función solo devuelve el número de filas, omitiendo el número de columnas.
Esta función solo devuelve el número de columnas, omitiendo el número de filas.
La función devuelve un vector con las dimensiones de la tabla en el orden (filas, columnas).
En un Dataframe, length() devuelve el número de columnas (la longitud de la lista de variables).
¿Qué resultado obtendrás al intentar sumar un vector numérico que contiene un valor `NA` sin parámetros adicionales?
Piensa en qué ocurre cuando intentas sumar algo que ‘no está disponible’.
R no ignora los valores faltantes automáticamente; requiere una instrucción explícita para hacerlo.
R no asume que un valor faltante es equivalente a cero.
Si existe un dato desconocido, el resultado de cualquier operación aritmética también se considera desconocido (NA).
No es un error de tipo, sino una propagación lógica de la falta de información.
¿Cómo se le indica a R que ignore los valores faltantes al realizar un cálculo como `mean()` o `sum()`?
Busca una abreviatura de dos letras para la palabra ‘remove’.
Aunque el nombre es intuitivo, el parámetro correcto en R utiliza una abreviatura distinta.
Este no es un parámetro estándar en las funciones básicas de R.
El argumento ‘na.rm’ (NA remove) permite realizar el cálculo utilizando solo los datos existentes.
R no elimina los datos del objeto original, solo los omite temporalmente para el cálculo.
Al utilizar `rbind()` para unir dos tablas hacia abajo, ¿cuál es el requisito fundamental?
Para que los datos ‘encajen’ uno debajo del otro, los títulos deben coincidir.
La unión vertical agrega filas, por lo que el número inicial de estas no necesita coincidir.
R necesita emparejar los datos bajo los mismos encabezados; de lo contrario, la unión fallará.
Es posible unir tablas con cualquier tipo de dato, siempre que la estructura de columnas sea compatible.
El origen o el tiempo de creación de los objetos no afecta a la capacidad de unirlos.
¿Qué función permite visualizar la estructura técnica de un Dataframe, incluyendo el tipo de dato de cada columna?
Es una abreviatura de la palabra ‘Structure’.
Muestra el contenido de las primeras filas, pero no detalla necesariamente los tipos de datos técnicos de forma resumida.
Abre una pestaña visual, pero no ofrece un resumen técnico de la estructura en la consola.
Proporciona el ‘structure’ del objeto, indicando si las columnas son numéricas, caracteres, factores, etc.
Esta función solo devuelve los encabezados de las columnas sin más información adicional.
Para agregar una columna nueva llamada ‘beca’ a una tabla de 10 filas, ¿cuál de estos vectores causaría un error?
Considera la regla sobre la consistencia de las dimensiones en una tabla.
Si el largo coincide exactamente con el número de filas, la operación es válida.
R requiere que el nuevo vector tenga el mismo número de filas que la tabla original para poder asignarlo.
Si se provee un solo valor, R aplica el concepto de ‘reciclaje’ y lo repite en todas las filas.
Cualquier tipo de vector es válido siempre que cumpla con la restricción de longitud.
Si ejecutas `head(mi_tabla)`, ¿cuántas filas verás por defecto?
Es un número ligeramente superior a cinco.
Diez es un número común pero no es el valor predeterminado de esta función específica.
Cinco es el número de filas que muestra la función tail(), no la función head().
La función head() está configurada para mostrar las primeras 6 filas de cualquier objeto rectangular por defecto.
El propósito de head() es justamente evitar mostrar tablas demasiado grandes en la consola.
¿Cuál es el propósito principal de la función `cbind()`?
Piensa en el eje horizontal de una tabla.
cbind() no realiza limpieza de datos, solo unión de estructuras.
Su nombre proviene de ‘Column Bind’ (unir columnas) y expande la tabla horizontalmente.
Para cambiar nombres se utiliza la función names() o asignación directa.
La unión vertical hacia abajo se realiza con rbind(), no con cbind().
¿Cómo se accede a la nota de un estudiante específico situado en la Fila 5, Columna 2?
Aplica estrictamente el orden de las coordenadas de una matriz.
Este comando buscaría el dato en la fila 2 y la columna 5, invirtiendo el orden requerido.
Siguiendo la regla [Fila, Columna], el primer número indica la posición vertical (5) y el segundo la horizontal (2).
No se puede usar el signo $ con índices numéricos para las filas de esa manera.
Nuevamente, el uso de paréntesis es incorrecto para la indexación de elementos en R.
Si quieres ver las últimas filas de una tabla para verificar que un nuevo dato se agregó correctamente, ¿qué comando usas?
Piensa en la parte final de un animal.
Esta función no pertenece al paquete base de R para visualización de estructuras.
Esta función muestra el inicio de la tabla, no el final.
La función ‘cola’ (tail) muestra por defecto los últimos 5 registros del objeto.
Aunque intuitivo, ‘end’ se utiliza para series de tiempo, no para previsualizar filas de un Dataframe.
¿Qué ocurre si intentas usar `mi_tabla$nota` cuando el nombre real de la columna es `Nota` (con mayúscula)?
Recuerda que para R, ‘A’ y ‘a’ son caracteres completamente diferentes.
R es un lenguaje ‘case-sensitive’, lo que significa que distingue estrictamente entre mayúsculas y minúsculas.
Al no coincidir exactamente los caracteres, R no puede encontrar la referencia solicitada.
R no es un entorno interactivo de corrección ortográfica automática en la ejecución de scripts básicos.
Un error de referencia no compromete la integridad de los datos almacenados.
¿Cuál es la forma correcta de crear una tabla básica con dos vectores llamados `v1` y `v2`?
La función lleva el nombre del tipo de objeto que estás creando.
La función estándar en R para esta tarea no se llama así.
La función table() se usa para crear tablas de contingencia o frecuencias, no Dataframes.
Esta es la función constructora principal para crear estructuras de tipo Dataframe.
No existe una función con ese nombre en la sintaxis base de R.
Si necesitas extraer las notas de los primeros 3 estudiantes (filas 1 a 3) de la segunda columna, ¿qué comando es el adecuado?
Utiliza el operador de secuencia de dos puntos.
El signo ‘-‘ en R significa resta o exclusión de índices, no un rango de selección.
El operador ‘:’ define una secuencia de números enteros desde el inicio hasta el fin indicado.
Esta opción seleccionaría la fila 2 para las columnas 1, 2 y 3.
Las llaves se utilizan para bloques de código, no para indexación de datos.
¿Qué comando permite abrir el Dataframe en una ventana independiente con formato de cuadrícula (similar a Excel)?
Comienza con una letra mayúscula y significa ‘Ver’ en inglés.
Este no es un comando reconocido en R para visualización de datos.
Show() se usa para imprimir representaciones de objetos, pero no en una pestaña nueva.
La función View (con V mayúscula) invoca el visor de datos del entorno (como RStudio).
Aunque el formato se parece a Excel, R no usa ese nombre de función nativamente.
¿Cuál es la función del comando `names()` aplicado a un Dataframe?
Se refiere a los títulos que aparecen en la parte superior de cada columna.
names() no extrae el contenido de las filas, sino los metadatos de las columnas.
Devuelve un vector con los nombres de las variables que componen la tabla.
Para contar valores únicos se requeriría combinar funciones como unique() y length().
Esta función solo reporta o asigna nombres fijos definidos por el usuario o el sistema.