Aprendizaje supervisado en Apache Mahout



El aprendizaje supervisado es una técnica de aprendizaje automático, en la que se infiere una función a partir de los ejemplos etiquetados de datos de entrenamiento.

El aprendizaje supervisado es el método, en el que los datos de entrenamiento incluyen tanto la entrada como los resultados deseados. Entrenar el sistema con ejemplos se denomina aprendizaje supervisado. O bien, entrenar el algoritmo con un profesor también puede tratarse como aprendizaje supervisado. Después de entrenar el algoritmo con todos los datos de muestra o datos etiquetados, que tiene ambos predictores en la variable objetivo, se puede entrenar el algoritmo y usar el ejemplo invisible para una clasificación adicional.





Estas son algunas de las características importantes del aprendizaje supervisado en Mahout:

  • La construcción de un conjunto adecuado de entrenamiento, validación y prueba (Bok) es crucial.
  • Estos métodos suelen ser rápidos y precisos.
  • Los métodos de aprendizaje supervisado deben poder generalizarse.
  • Dan resultados correctos, cuando se dan nuevos datos en la entrada sin conocer unprioriobjetivo.
  • En algunos casos, los resultados correctos (objetivos) se conocen y se dan como entrada al modelo durante el proceso de aprendizaje.

Ejemplo de aprendizaje supervisado

En caso de que desee entrenar una misión y se le proporcionen dos grupos diferentes de imágenes junto con los datos etiquetados, p. en la imagen de arriba, un grupo tiene las imágenes de un elefante y el otro las de un león. Los datos etiquetados implican que cada conjunto de datos tiene un valor objetivo. En el ejemplo anterior, el conjunto de datos son imágenes de elefante, mientras que la etiqueta que se le asigna, es decir, 'Elefante' es el valor objetivo del conjunto de datos. Dicho conjunto de datos etiquetados se utiliza para el proceso de entrenamiento, de modo que el algoritmo de entrenamiento pueda aprovechar este conjunto de datos y construir algún modelo, que se puede usar más para clasificar los ejemplos invisibles sin los datos etiquetados o la variable objetivo.



tipos de conjuntos en java

Identifiquemos las características que ayudan a identificar un objeto como un elefante o un león:

Las características podría ser tamaño, color, altura, tamaño de la oreja, tronco, colmillo

A esto se le puede llamar un conjunto de características, que se utilizará con el propósito de entrenamiento. Este conjunto de características afectará la variable objetivo final. Estas variables se conocen como variables predictoras , porque nos ayudan a determinar el variable objetivo final . La variable final también se puede llamar etiqueta. La variable final aquí está Elefante / León.



table-word

En este ejemplo, cada uno de los registros en las categorías, tamaño, color, altura, tamaño de la oreja, tronco y colmillo es una variable de predicción, mientras que Elefante y León son las variables objetivo. Estas variables se pueden tratar como ejemplos de entrenamiento y conjuntos de datos de entrenamiento, respectivamente.

Por lo tanto, el Aprendizaje Supervisado es una forma, a través de la cual se entrena junto con las etiquetas, en la que le pide al algoritmo que extraiga ciertas características de él, y en base a eso, cada vez que vea un ejemplo invisible, el algoritmo podrá clasificarlo. en la clase correcta.

Tienes una pregunta para nosotros? Menciónalos en la sección de comentarios y nos pondremos en contacto contigo.

Artículos Relacionados: