50 Preguntas de Aprendizaje Automático con Respuestas

50 Machine Learning MCQs con respuestas y explicación breve. En Q2BSTUDIO somos una empresa de desarrollo de software a medida y aplicaciones a medida, especialistas en inteligencia artificial, ciberseguridad, servicios cloud AWS y Azure, servicios inteligencia de negocio y power BI. Diseñamos soluciones de ia para empresas con agentes IA que impulsan la eficiencia, la automatización y el crecimiento. Si quieres aplicar estas técnicas en tu organización, visita nuestra página de inteligencia artificial o potencia tus datos con Business Intelligence y Power BI.

P1. ¿Cuál de los siguientes es un ejemplo de aprendizaje supervisado?

a) Agrupar clientes según compras b) Predecir precios de viviendas con datos históricos c) Detectar anomalías en un conjunto de datos d) Reducción de dimensionalidad

Respuesta: b) Predecir precios de viviendas con datos históricos. El aprendizaje supervisado usa datos etiquetados.

P2. ¿Qué algoritmo se usa para problemas de clasificación?

a) K-means b) Regresión lineal c) Regresión logística d) PCA

Respuesta: c) Regresión logística. Predice categorías como sí o no.

P3. ¿Qué significa sobreajuste u overfitting en ML?

a) Buen desempeño en test y malo en entrenamiento b) Buen desempeño en entrenamiento y malo en test c) Igual en entrenamiento y test d) Modelo demasiado simple

Respuesta: b) Buen desempeño en entrenamiento y malo en test. Memoriza en lugar de generalizar.

P4. ¿Qué métrica es mejor para clasificación desbalanceada?

a) Exactitud b) Precisión y Recall c) R² d) Error cuadrático medio

Respuesta: b) Precisión y Recall. La exactitud puede ser engañosa con clases desbalanceadas.

P5. ¿Cuál es una técnica de reducción de dimensionalidad?

a) K-means b) PCA c) Árboles de decisión d) Naive Bayes

Respuesta: b) PCA. Analiza componentes principales para reducir variables.

P6. ¿Qué técnica de ML se usa en la detección de spam?

a) Clustering b) Clasificación c) Regresión d) Aprendizaje por refuerzo

Respuesta: b) Clasificación. Es un problema binario spam o no spam.

P7. En k-NN, ¿qué representa k?

a) Número de características b) Número de clusters c) Número de vecinos más cercanos d) Número de iteraciones

Respuesta: c) Número de vecinos más cercanos. Decide por mayoría entre k vecinos.

P8. ¿Qué enfoque aprende interactuando con un entorno y recibiendo recompensas?

a) Supervisado b) No supervisado c) Refuerzo d) Semisupervisado

Respuesta: c) Aprendizaje por refuerzo. Basado en recompensas y penalizaciones.

P9. ¿Para qué se usa el descenso de gradiente?

a) Selección de características b) Optimización c) Regularización d) Clustering

Respuesta: b) Optimización. Minimiza funciones de pérdida ajustando pesos.

P10. ¿Qué función de activación se usa comúnmente en capas ocultas?

a) Sigmoide b) ReLU c) Softmax d) Lineal

Respuesta: b) ReLU. Atenúa el problema del gradiente desapareciente.

P11. ¿Qué tipo de algoritmo es K-means?

a) Supervisado b) No supervisado c) Refuerzo d) Semisupervisado

Respuesta: b) No supervisado. Es un algoritmo de clustering.

P12. ¿Cuál es una técnica de aprendizaje en conjunto?

a) Árbol de decisión b) Random Forest c) Regresión logística d) PCA

Respuesta: b) Random Forest. Combina múltiples árboles mediante bagging.

P13. ¿Qué regularización añade penalización L1?

a) Ridge b) Lasso c) Elastic Net d) Regresión logística

Respuesta: b) Lasso. La penalización L1 puede llevar coeficientes a cero.

P14. ¿Qué concepto se usa para evitar el sobreajuste en redes neuronales?

a) Dropout b) Descenso de gradiente c) Backpropagation d) Normalización

Respuesta: a) Dropout. Desactiva aleatoriamente neuronas durante el entrenamiento.

P15. ¿Para qué se usa la curva ROC?

a) Evaluar clustering b) Evaluar clasificación c) Medir error en regresión d) Selección de características

Respuesta: b) Evaluar clasificación. Relaciona tasa de verdaderos positivos con falsos positivos.

P16. ¿Qué algoritmo es adecuado para análisis de sentimiento de texto?

a) K-means b) Naive Bayes c) PCA d) KNN

Respuesta: b) Naive Bayes. Eficaz en clasificación de texto.

P17. ¿Cuál es el propósito de la matriz de confusión?

a) Visualizar clustering b) Evaluar clasificación c) Revisar correlaciones d) Optimizar hiperparámetros

Respuesta: b) Evaluar clasificación. Muestra VP, FP, VN y FN.

P18. ¿Qué concepto se relaciona con el equilibrio sesgo-varianza?

a) Sobreajuste y subajuste b) Escalado de características c) Normalización d) Ajuste de hiperparámetros

Respuesta: a) Sobreajuste y subajuste. Equilibra complejidad y capacidad de generalización.

P19. ¿Qué significa TF-IDF en minería de texto?

a) Frecuencia de término inversa de frecuencia de documento b) Frecuencia total factor de datos inverso c) Factor de texto característica de documento de entrada d) Término característica importancia por documento

Respuesta: a) Frecuencia de término inversa de frecuencia de documento. Resalta palabras relevantes en documentos.

P20. ¿Cuál NO es un algoritmo supervisado?

a) Árbol de decisión b) SVM c) K-means d) Regresión lineal

Respuesta: c) K-means. Es no supervisado.

P21. En aprendizaje por refuerzo, el agente aprende mediante

a) Datos etiquetados b) Clustering c) Recompensas y penalizaciones d) Modelos de regresión

Respuesta: c) Recompensas y penalizaciones. Aprende por prueba y error.

P22. ¿Qué variante de descenso de gradiente actualiza tras cada ejemplo?

a) Batch b) Mini-batch c) Estocástico d) Regularizado

Respuesta: c) Estocástico. Actualiza pesos por cada muestra.

P23. ¿Qué algoritmo se usa para reducir dimensionalidad en imágenes?

a) PCA b) KNN c) Naive Bayes d) Árboles de decisión

Respuesta: a) PCA. Reduce eficazmente características de imagen.

P24. ¿Cuál es el propósito principal de la validación cruzada?

a) Selección de variables b) Ajuste de hiperparámetros c) Evaluación de modelo d) Limpieza de datos

Respuesta: c) Evaluación de modelo. Estima la capacidad de generalización.

P25. ¿Cuál es un método basado en kernel?

a) Regresión logística b) Árbol de decisión c) SVM d) Random Forest

Respuesta: c) SVM. Usa kernels para fronteras complejas.

P26. ¿Qué técnica convierte variables categóricas en numéricas?

a) Normalización b) Estandarización c) One-hot encoding d) PCA

Respuesta: c) One-hot encoding. Representa categorías como vectores binarios.

P27. ¿Cuál de los siguientes es un algoritmo de clustering?

a) Árbol de decisión b) Random Forest c) K-means d) Regresión logística

Respuesta: c) K-means. Agrupa datos en clusters.

P28. ¿Qué métrica se usa comúnmente en regresión?

a) Precisión b) Recall c) Error cuadrático medio MSE d) Exactitud

Respuesta: c) Error cuadrático medio MSE. Métrica estándar para regresión.

P29. Bagging y Boosting son tipos de

a) Reducción de dimensionalidad b) Aprendizaje en conjunto c) Selección de características d) Arquitecturas de redes

Respuesta: b) Aprendizaje en conjunto. Combina múltiples modelos para mejorar rendimiento.

P30. ¿Cuál NO es un método de escalado de características?

a) Min-Max b) Z-score c) One-hot encoding d) Robust Scaler

Respuesta: c) One-hot encoding. Es codificación categórica, no escalado.

P31. ¿Para qué se usa backpropagation en redes neuronales?

a) Escalado de características b) Optimización de pesos c) Evaluación del modelo d) Limpieza de datos

Respuesta: b) Optimización de pesos. Ajusta pesos mediante gradientes.

P32. ¿Qué función de activación produce valores entre 0 y 1?

a) ReLU b) Sigmoide c) Tanh d) Softmax

Respuesta: b) Sigmoide. Mapea al rango 0 a 1.

P33. ¿Qué algoritmo es mejor para market basket analysis?

a) Apriori b) K-means c) SVM d) Random Forest

Respuesta: a) Apriori. Minería de reglas de asociación.

P34. ¿Qué muestra una curva ROC?

a) Sensibilidad frente a especificidad b) Tasa de verdaderos positivos frente a falsos positivos c) Exactitud frente a precisión d) Pérdida frente a exactitud

Respuesta: b) Tasa de verdaderos positivos frente a falsos positivos. Útil para evaluar clasificadores.

P35. ¿Qué técnica es más adecuada para predicción de series temporales?

a) Regresión b) ARIMA c) PCA d) Clustering

Respuesta: b) ARIMA. Muy usada en forecasting temporal.

P36. ¿Qué es el problema del gradiente desapareciente?

a) El gradiente se hace muy grande b) El gradiente se hace demasiado pequeño para actualizar pesos c) El gradiente nunca cambia d) El gradiente oscila

Respuesta: b) El gradiente se hace demasiado pequeño. Dificulta el aprendizaje en redes profundas.

P37. ¿Qué técnica ayuda a evitar sobreajuste en árboles de decisión?

a) Bagging b) Poda c) Dropout d) Descenso de gradiente

Respuesta: b) Poda. Reduce ramas para disminuir complejidad.

P38. ¿Cuál es un algoritmo de detección de anomalías?

a) Isolation Forest b) Regresión logística c) PCA d) KNN

Respuesta: a) Isolation Forest. Especializado en outliers.

P39. ¿Cuál es el propósito del escalado de características?

a) Reducir sobreajuste b) Normalizar a una escala común c) Codificar datos categóricos d) Mejorar interpretabilidad

Respuesta: b) Normalizar a una escala común. Evita que una variable domine por magnitud.

P40. ¿Cuál es un problema no supervisado?

a) Predecir impago de préstamos b) Detección de fraude c) Segmentación de clientes d) Predicción de precios de acciones

Respuesta: c) Segmentación de clientes. Es clustering.

P41. ¿Qué se usa comúnmente en sistemas de recomendación?

a) Naive Bayes b) Filtrado colaborativo c) PCA d) Random Forest

Respuesta: b) Filtrado colaborativo. Popular en plataformas de streaming y ecommerce.

P42. ¿Qué optimizador es frecuente en deep learning?

a) Adam b) K-means c) Naive Bayes d) SVM

Respuesta: a) Adam. Eficiente y adaptable.

P43. ¿Para qué sirven las word embeddings en PLN?

a) Reducir stopwords b) Convertir palabras en vectores numéricos c) Mejorar gramática d) Tokenizar texto

Respuesta: b) Convertir palabras en vectores numéricos. Word2Vec y GloVe generan vectores densos.

P44. ¿Qué algoritmo es sensible al escalado de características?

a) Árboles de decisión b) Random Forest c) KNN d) Naive Bayes

Respuesta: c) KNN. Depende de distancias, por eso el escalado es clave.

P45. ¿Qué es la maldición de la dimensionalidad?

a) Muy pocas variables b) Demasiadas variables que provocan dispersión c) Demasiados modelos d) Exceso de ruido

Respuesta: b) Demasiadas variables causan dispersión. Altas dimensiones degradan el rendimiento.

P46. ¿Cuál NO es un tipo de aprendizaje automático?

a) Supervisado b) No supervisado c) Refuerzo d) Aproximación

Respuesta: d) Aproximación. No es una categoría de ML.

P47. ¿Qué concepto ayuda a elegir características relevantes?

a) PCA b) Ingeniería de características c) Selección de características d) Regularización

Respuesta: c) Selección de características. Elimina variables irrelevantes.

P48. ¿Diferencia principal entre Bagging y Boosting?

a) Bagging secuencial y Boosting en paralelo b) Bagging en paralelo y Boosting secuencial c) Ambos en paralelo d) Ambos secuenciales

Respuesta: b) Bagging en paralelo y Boosting secuencial. Boosting pondera errores previos.

P49. ¿Qué métrica evalúa clustering?

a) Índice Rand ajustado b) Precisión c) Recall d) Exactitud

Respuesta: a) Índice Rand ajustado. Mide la calidad del agrupamiento.

P50. ¿Qué framework es ampliamente usado en ML?

a) TensorFlow b) Django c) Angular d) Flask

Respuesta: a) TensorFlow. Framework popular para aprendizaje automático.

En Q2BSTUDIO integramos estas técnicas en soluciones reales de software a medida, automatización de procesos, agentes IA y analítica avanzada con power bi, priorizando ciberseguridad y despliegues robustos en servicios cloud aws y azure. Si buscas un partner para impulsar tu estrategia de datos e inteligencia artificial en tu empresa, habla con nuestros expertos y descubre cómo transformar tus operaciones con soluciones escalables y seguras.

50 Preguntas de Aprendizaje Automático con Respuestas

Juega un momento antes de irte

Cómo podemos ayudarte

Inteligencia artificial

Desarrollo de software

Servicios cloud

Ciberseguridad y pentesting

Business Intelligence

Automatización de procesos

Formación para empresas

Auditoría de código

Generación de imágenes con IA

Generación de vídeos con IA

Avatares conversacionales con IA

Marketing Online e IA

¿Tienes un proyecto en mente?

50 Preguntas de Aprendizaje Automático con Respuestas

Juega un momento antes de irte

Cómo podemos ayudarte

Inteligencia artificial

Desarrollo de software

Servicios cloud

Ciberseguridad y pentesting

Business Intelligence

Automatización de procesos

Formación para empresas

Auditoría de código

Generación de imágenes con IA

Generación de vídeos con IA

Avatares conversacionales con IA

Marketing Online e IA

Artículos relacionados

Top 15 Empresas para cómo automatizar el seguimiento de envíos en Zaragoza

Top 100 Empresas para cómo automatizar el seguimiento de envíos en Vitoria

Las 100 mejores empresas para automatizar el seguimiento de envíos en Zaragoza

Mejores 3 empresas para cómo automatizar el seguimiento de envíos en Zaragoza

¿Tienes un proyecto en mente?