Aprendizaje no supervisado
|
Aprendizaje no supervisado. Proceso de modelado que se lleva a cabo sobre un conjunto de datos formado tan sólo por entradas al sistema sin tener información de salida sobre las categorías de los mismos. Los datos de entrada se trantan como un conjunto de variables aleatorias, siendo construido un modelo de densidad para el conjunto de datos.
Características
El aprendizaje no supervisado se puede emplear para aumentar el conocimiento estructural de los datos:
- Dando una agrupación a los datos según su similaridad (clustering).
- Simplificando la estructura de los mismos (reducción de la dimensionalidad).
- Extrayendo la estructura interna con la que se distribuyen los datos (aprendizaje topológico).
Algoritmos
El aprendizaje no supervisado incluye dos categorías principales de algoritmos:
- Agrupamiento (clustering): el objetivo de la agrupación es encontrar diferentes grupos dentro de los elementos de los datos. Algunos algoritmos de esta son:
- K-Medias
- Clusterización Jerárquica
- Density Based Scan Clustering (DBSCAN)
- Modelo de Agrupamiento Gaussiano
- Reducción de dimensionalidad: son algoritmos que se usan para reducir el número de variables de nuestro conjunto de datos. Entre los más comunes están:
Aplicaciones
Las principales aplicaciones en las que se pueden utilizar este proceso de aprendizaje son, entre otras: segmentación de conjuntos de datos por atributos compartidos, detección de anomalías que no encajan en ningún grupo y dimplificación de conjuntos de datos.