Técnicas de modelado en Business Analytics con R



El blog ofrece una breve introducción a las técnicas de modelado en Business Analytics con R.

Diferentes técnicas de modelado:

Podemos dividir cualquier problema en procesos más pequeños:





Clasificación - es, donde clasificamos los datos. P.ej. enfermedades todas las enfermedades exhiben cierto comportamiento, y podemos clasificarlas más.

Por ejemplo: enfermedades que reducen la inmunidad, enfermedades que dan dolor de cabeza, etc.



Regresión - implica averiguar la relación entre múltiples variables.

Por ejemplo: cómo se relaciona el peso de un ser humano con su altura.

AnomalíaDetección - es básicamente una fluctuación.



Por ejemplo: en el caso de alta tensión o baja tensión.

Otro ejemplo podría incluir el comportamiento regulado que implica conducir en el lado derecho o izquierdo según el país. La anomalía aquí es que alguien conduce desde el lado opuesto.

tutoriales de visual studio para principiantes

Otro ejemplo podría ser la intrusión en la red. Aquí, un usuario autenticado inicia sesión en el sitio web de su empresa y, luego, si alguien no autenticado inicia sesión, es unAn0moly.

Importancia del atributo - Básicamente da múltiples atributos, como altura, peso, temperatura, latido del corazón. Un punto a tener en cuenta es que todos estos atributos son importantes para una tarea.

programa de la serie fibonacci en java

Por ejemplo: Alguien está tratando de predecir a qué hora llegará al cargo. Cada atributo juega un papel importante, pero no todos los atributos son importantes.

Reglas de asociación - En términos más simples, se trata de analizar o predecir el próximo comportamiento, donde gira en torno al motor de recomendación.

Por ejemplo: una persona que compra pan también puede comprar leche. Si analizamos los comportamientos de compra pasados, todos los artículos de la cesta tienen una relación. En este caso, podría haber una probabilidad de que la persona que compra el pan también compre leche.

Agrupación - Es una de las técnicas más antiguas de la estadística. De hecho, siempre se puede modelar cualquier problema, ya sea de clasificación o agrupamiento, lo que significa agrupar entidades similares.

Por ejemplo:

1) Coge una canasta de manzanas y naranjas, en la que podamos separar las manzanas de las naranjas.

2) Un caso de uso importante para la agrupación en clústeres es la atención médica. Casi todas las estadísticas y análisis comenzaron con casos de uso de atención médica. Para profundizar, existe un término de agrupación denominado cohortes (personas con enfermedades similares), de modo que se puedan estudiar por separado de los clientes existentes. Por ejemplo, si 10 personas tienen fiebre y otras 10 personas con dolor de cabeza, encontraremos lo que tienen en común y generaremos la medicina.

Extracción de características - En la extracción de características, la precisión, la validez y la falla son bastante relevantes. En otras palabras, la extracción de características puede denominarse reconocimiento de patrones.

Por ejemplo:

En la búsqueda de Google, cuando un usuario ingresa un término, obtiene resultados. Ahora, una pregunta importante que debe hacerse es ¿cómo supo qué página es relevante y no relevante para el término? Esto se puede responder con la extracción de características y el reconocimiento de patrones, donde agrega características destacadas. Digamos que se da una foto, ciertas cámaras detectan rostros, resaltan el rostro para dar bellas imágenes, lo que también utiliza el reconocimiento de características.

Aprendizaje supervisado frente a aprendizaje no supervisado

a) Categoría de predicción - Las técnicas incluyen regresión, logística, redes neuronales y árboles de decisión. Algunos ejemplos incluyen la detección de fraude (donde una computadora aprende y predice el próximo fraude del historial anterior de fraude). En el aprendizaje no supervisado, no se puede predecir con ejemplos ya que no hay datos históricos.

b) Categoría de clasificación - Tomando un ejemplo, ya sea que la transacción sea fraudulenta o no, entra en la categoría de clasificación. Aquí, tomamos datos históricos y los clasificamos con árboles de decisión o, en caso de que no tomamos ningún dato histórico, comenzamos directamente con los datos e intentamos explotar las funciones por nuestra cuenta. Por ejemplo, si necesitamos conocer a los empleados, que es probable que dejen la organización o que se queden. En caso de que se trate de una organización nueva, donde no podemos utilizar datos históricos, siempre podemos utilizar la agrupación en clústeres para la extracción de datos.

c) Categoría de exploración - Este es un método sencillo, con lo que significa big data. En el aprendizaje no supervisado, se denomina componentes principales y agrupación.

re) Categoría de afinidad - aquí están involucrados múltiples elementos, como venta cruzada / venta al alza, análisis de la cesta de mercado. En el análisis de la canasta, no hay aprendizaje supervisado ya que no hay datos históricos. Así que tomamos datos directamente y encontramos asociaciones, secuenciación y análisis factorial.

diferencias entre html y xml

Tienes una pregunta para nosotros? Menciónalos en la sección de comentarios y nos pondremos en contacto contigo.

Artículos Relacionados: