50 Machine Learning MCQs con respuestas y explicación breve. En Q2BSTUDIO somos una empresa de desarrollo de software a medida y aplicaciones a medida, especialistas en inteligencia artificial, ciberseguridad, servicios cloud AWS y Azure, servicios inteligencia de negocio y power BI. Diseñamos soluciones de ia para empresas con agentes IA que impulsan la eficiencia, la automatización y el crecimiento. Si quieres aplicar estas técnicas en tu organización, visita nuestra página de inteligencia artificial o potencia tus datos con Business Intelligence y Power BI.
P1. ¿Cuál de los siguientes es un ejemplo de aprendizaje supervisado?
a) Agrupar clientes según compras b) Predecir precios de viviendas con datos históricos c) Detectar anomalías en un conjunto de datos d) Reducción de dimensionalidad
Respuesta: b) Predecir precios de viviendas con datos históricos. El aprendizaje supervisado usa datos etiquetados.
P2. ¿Qué algoritmo se usa para problemas de clasificación?
a) K-means b) Regresión lineal c) Regresión logística d) PCA
Respuesta: c) Regresión logística. Predice categorías como sí o no.
P3. ¿Qué significa sobreajuste u overfitting en ML?
a) Buen desempeño en test y malo en entrenamiento b) Buen desempeño en entrenamiento y malo en test c) Igual en entrenamiento y test d) Modelo demasiado simple
Respuesta: b) Buen desempeño en entrenamiento y malo en test. Memoriza en lugar de generalizar.
P4. ¿Qué métrica es mejor para clasificación desbalanceada?
a) Exactitud b) Precisión y Recall c) R² d) Error cuadrático medio
Respuesta: b) Precisión y Recall. La exactitud puede ser engañosa con clases desbalanceadas.
P5. ¿Cuál es una técnica de reducción de dimensionalidad?
a) K-means b) PCA c) Árboles de decisión d) Naive Bayes
Respuesta: b) PCA. Analiza componentes principales para reducir variables.
P6. ¿Qué técnica de ML se usa en la detección de spam?
a) Clustering b) Clasificación c) Regresión d) Aprendizaje por refuerzo
Respuesta: b) Clasificación. Es un problema binario spam o no spam.
P7. En k-NN, ¿qué representa k?
a) Número de características b) Número de clusters c) Número de vecinos más cercanos d) Número de iteraciones
Respuesta: c) Número de vecinos más cercanos. Decide por mayoría entre k vecinos.
P8. ¿Qué enfoque aprende interactuando con un entorno y recibiendo recompensas?
a) Supervisado b) No supervisado c) Refuerzo d) Semisupervisado
Respuesta: c) Aprendizaje por refuerzo. Basado en recompensas y penalizaciones.
P9. ¿Para qué se usa el descenso de gradiente?
a) Selección de características b) Optimización c) Regularización d) Clustering
Respuesta: b) Optimización. Minimiza funciones de pérdida ajustando pesos.
P10. ¿Qué función de activación se usa comúnmente en capas ocultas?
a) Sigmoide b) ReLU c) Softmax d) Lineal
Respuesta: b) ReLU. Atenúa el problema del gradiente desapareciente.
P11. ¿Qué tipo de algoritmo es K-means?
a) Supervisado b) No supervisado c) Refuerzo d) Semisupervisado
Respuesta: b) No supervisado. Es un algoritmo de clustering.
P12. ¿Cuál es una técnica de aprendizaje en conjunto?
a) Árbol de decisión b) Random Forest c) Regresión logística d) PCA
Respuesta: b) Random Forest. Combina múltiples árboles mediante bagging.
P13. ¿Qué regularización añade penalización L1?
a) Ridge b) Lasso c) Elastic Net d) Regresión logística
Respuesta: b) Lasso. La penalización L1 puede llevar coeficientes a cero.
P14. ¿Qué concepto se usa para evitar el sobreajuste en redes neuronales?
a) Dropout b) Descenso de gradiente c) Backpropagation d) Normalización
Respuesta: a) Dropout. Desactiva aleatoriamente neuronas durante el entrenamiento.
P15. ¿Para qué se usa la curva ROC?
a) Evaluar clustering b) Evaluar clasificación c) Medir error en regresión d) Selección de características
Respuesta: b) Evaluar clasificación. Relaciona tasa de verdaderos positivos con falsos positivos.
P16. ¿Qué algoritmo es adecuado para análisis de sentimiento de texto?
a) K-means b) Naive Bayes c) PCA d) KNN
Respuesta: b) Naive Bayes. Eficaz en clasificación de texto.
P17. ¿Cuál es el propósito de la matriz de confusión?
a) Visualizar clustering b) Evaluar clasificación c) Revisar correlaciones d) Optimizar hiperparámetros
Respuesta: b) Evaluar clasificación. Muestra VP, FP, VN y FN.
P18. ¿Qué concepto se relaciona con el equilibrio sesgo-varianza?
a) Sobreajuste y subajuste b) Escalado de características c) Normalización d) Ajuste de hiperparámetros
Respuesta: a) Sobreajuste y subajuste. Equilibra complejidad y capacidad de generalización.
P19. ¿Qué significa TF-IDF en minería de texto?
a) Frecuencia de término inversa de frecuencia de documento b) Frecuencia total factor de datos inverso c) Factor de texto característica de documento de entrada d) Término característica importancia por documento
Respuesta: a) Frecuencia de término inversa de frecuencia de documento. Resalta palabras relevantes en documentos.
P20. ¿Cuál NO es un algoritmo supervisado?
a) Árbol de decisión b) SVM c) K-means d) Regresión lineal
Respuesta: c) K-means. Es no supervisado.
P21. En aprendizaje por refuerzo, el agente aprende mediante
a) Datos etiquetados b) Clustering c) Recompensas y penalizaciones d) Modelos de regresión
Respuesta: c) Recompensas y penalizaciones. Aprende por prueba y error.
P22. ¿Qué variante de descenso de gradiente actualiza tras cada ejemplo?
a) Batch b) Mini-batch c) Estocástico d) Regularizado
Respuesta: c) Estocástico. Actualiza pesos por cada muestra.
P23. ¿Qué algoritmo se usa para reducir dimensionalidad en imágenes?
a) PCA b) KNN c) Naive Bayes d) Árboles de decisión
Respuesta: a) PCA. Reduce eficazmente características de imagen.
P24. ¿Cuál es el propósito principal de la validación cruzada?
a) Selección de variables b) Ajuste de hiperparámetros c) Evaluación de modelo d) Limpieza de datos
Respuesta: c) Evaluación de modelo. Estima la capacidad de generalización.
P25. ¿Cuál es un método basado en kernel?
a) Regresión logística b) Árbol de decisión c) SVM d) Random Forest
Respuesta: c) SVM. Usa kernels para fronteras complejas.
P26. ¿Qué técnica convierte variables categóricas en numéricas?
a) Normalización b) Estandarización c) One-hot encoding d) PCA
Respuesta: c) One-hot encoding. Representa categorías como vectores binarios.
P27. ¿Cuál de los siguientes es un algoritmo de clustering?
a) Árbol de decisión b) Random Forest c) K-means d) Regresión logística
Respuesta: c) K-means. Agrupa datos en clusters.
P28. ¿Qué métrica se usa comúnmente en regresión?
a) Precisión b) Recall c) Error cuadrático medio MSE d) Exactitud
Respuesta: c) Error cuadrático medio MSE. Métrica estándar para regresión.
P29. Bagging y Boosting son tipos de
a) Reducción de dimensionalidad b) Aprendizaje en conjunto c) Selección de características d) Arquitecturas de redes
Respuesta: b) Aprendizaje en conjunto. Combina múltiples modelos para mejorar rendimiento.
P30. ¿Cuál NO es un método de escalado de características?
a) Min-Max b) Z-score c) One-hot encoding d) Robust Scaler
Respuesta: c) One-hot encoding. Es codificación categórica, no escalado.
P31. ¿Para qué se usa backpropagation en redes neuronales?
a) Escalado de características b) Optimización de pesos c) Evaluación del modelo d) Limpieza de datos
Respuesta: b) Optimización de pesos. Ajusta pesos mediante gradientes.
P32. ¿Qué función de activación produce valores entre 0 y 1?
a) ReLU b) Sigmoide c) Tanh d) Softmax
Respuesta: b) Sigmoide. Mapea al rango 0 a 1.
P33. ¿Qué algoritmo es mejor para market basket analysis?
a) Apriori b) K-means c) SVM d) Random Forest
Respuesta: a) Apriori. Minería de reglas de asociación.
P34. ¿Qué muestra una curva ROC?
a) Sensibilidad frente a especificidad b) Tasa de verdaderos positivos frente a falsos positivos c) Exactitud frente a precisión d) Pérdida frente a exactitud
Respuesta: b) Tasa de verdaderos positivos frente a falsos positivos. Útil para evaluar clasificadores.
P35. ¿Qué técnica es más adecuada para predicción de series temporales?
a) Regresión b) ARIMA c) PCA d) Clustering
Respuesta: b) ARIMA. Muy usada en forecasting temporal.
P36. ¿Qué es el problema del gradiente desapareciente?
a) El gradiente se hace muy grande b) El gradiente se hace demasiado pequeño para actualizar pesos c) El gradiente nunca cambia d) El gradiente oscila
Respuesta: b) El gradiente se hace demasiado pequeño. Dificulta el aprendizaje en redes profundas.
P37. ¿Qué técnica ayuda a evitar sobreajuste en árboles de decisión?
a) Bagging b) Poda c) Dropout d) Descenso de gradiente
Respuesta: b) Poda. Reduce ramas para disminuir complejidad.
P38. ¿Cuál es un algoritmo de detección de anomalías?
a) Isolation Forest b) Regresión logística c) PCA d) KNN
Respuesta: a) Isolation Forest. Especializado en outliers.
P39. ¿Cuál es el propósito del escalado de características?
a) Reducir sobreajuste b) Normalizar a una escala común c) Codificar datos categóricos d) Mejorar interpretabilidad
Respuesta: b) Normalizar a una escala común. Evita que una variable domine por magnitud.
P40. ¿Cuál es un problema no supervisado?
a) Predecir impago de préstamos b) Detección de fraude c) Segmentación de clientes d) Predicción de precios de acciones
Respuesta: c) Segmentación de clientes. Es clustering.
P41. ¿Qué se usa comúnmente en sistemas de recomendación?
a) Naive Bayes b) Filtrado colaborativo c) PCA d) Random Forest
Respuesta: b) Filtrado colaborativo. Popular en plataformas de streaming y ecommerce.
P42. ¿Qué optimizador es frecuente en deep learning?
a) Adam b) K-means c) Naive Bayes d) SVM
Respuesta: a) Adam. Eficiente y adaptable.
P43. ¿Para qué sirven las word embeddings en PLN?
a) Reducir stopwords b) Convertir palabras en vectores numéricos c) Mejorar gramática d) Tokenizar texto
Respuesta: b) Convertir palabras en vectores numéricos. Word2Vec y GloVe generan vectores densos.
P44. ¿Qué algoritmo es sensible al escalado de características?
a) Árboles de decisión b) Random Forest c) KNN d) Naive Bayes
Respuesta: c) KNN. Depende de distancias, por eso el escalado es clave.
P45. ¿Qué es la maldición de la dimensionalidad?
a) Muy pocas variables b) Demasiadas variables que provocan dispersión c) Demasiados modelos d) Exceso de ruido
Respuesta: b) Demasiadas variables causan dispersión. Altas dimensiones degradan el rendimiento.
P46. ¿Cuál NO es un tipo de aprendizaje automático?
a) Supervisado b) No supervisado c) Refuerzo d) Aproximación
Respuesta: d) Aproximación. No es una categoría de ML.
P47. ¿Qué concepto ayuda a elegir características relevantes?
a) PCA b) Ingeniería de características c) Selección de características d) Regularización
Respuesta: c) Selección de características. Elimina variables irrelevantes.
P48. ¿Diferencia principal entre Bagging y Boosting?
a) Bagging secuencial y Boosting en paralelo b) Bagging en paralelo y Boosting secuencial c) Ambos en paralelo d) Ambos secuenciales
Respuesta: b) Bagging en paralelo y Boosting secuencial. Boosting pondera errores previos.
P49. ¿Qué métrica evalúa clustering?
a) Índice Rand ajustado b) Precisión c) Recall d) Exactitud
Respuesta: a) Índice Rand ajustado. Mide la calidad del agrupamiento.
P50. ¿Qué framework es ampliamente usado en ML?
a) TensorFlow b) Django c) Angular d) Flask
Respuesta: a) TensorFlow. Framework popular para aprendizaje automático.
En Q2BSTUDIO integramos estas técnicas en soluciones reales de software a medida, automatización de procesos, agentes IA y analítica avanzada con power bi, priorizando ciberseguridad y despliegues robustos en servicios cloud aws y azure. Si buscas un partner para impulsar tu estrategia de datos e inteligencia artificial en tu empresa, habla con nuestros expertos y descubre cómo transformar tus operaciones con soluciones escalables y seguras.