Proceso de análisis predictivo en Business Analytics con R



El blog da una breve idea sobre el proceso de análisis predictivo en Business Analytics con R

Proceso de modelado típico:

En un proceso de modelado típico, es importante comenzar a dibujar una hipótesis. Se recibe una RFP (Solicitud de propuesta) y luego se elabora una hipótesis.





cómo crear un paquete
  1. Determine la fuente de datos correcta - Aquí, el cliente puede dar fuente de datos, si no, tenemos que buscar una fuente de datos. Ante un escenario, donde intentamos evaluar quién ganaría las elecciones, se realiza un análisis público de datos con fuentes que incluyen redes sociales, canales de noticias u opinión pública. También necesitamos comprender la cantidad de datos necesarios para analizar el problema. En este caso, normalmente buscamos muestras grandes, ya que se trata de un caso electoral. Por otro lado, si el análisis se realiza en Salud, es difícil apostar por una población numerosa porque existe la posibilidad de no conseguir suficientes personas para validar la hipótesis. Además, la calidad de los datos es muy importante.
  2. Extraer datos - Por ejemplo, si tomamos una muestra de población, podemos mirar atributos, como altos ingresos, bajos ingresos, edad, población activa (fuera del sitio / en el sitio), residentes, NRI, cobertura de hospitales, etc., para iniciar el estudio. . Aquí, es posible que no necesitemos tantos atributos para la hipótesis. Entendemos que los atributos, como los ingresos altos y bajos, pueden no ser los factores que contribuyan a determinar quién ganará las elecciones. Pero la edad puede marcar la diferencia, ya que dará un recuento directo de cuántas personas van a votar. Muchas veces podemos excluir atributos menos usados ​​o incluir atributos que son útiles. Podría salir mal en ambos casos. Esa es la razón por la que la analítica es un desafío.
  3. Masajee los datos para que se ajusten a la herramienta - Esto se debe a que no todas las herramientas pueden aceptar todos los datos. Algunas herramientas solo aceptan datos CSV o datos de Excel. La falta de herramientas es un desafío.
  4. Ejecute el análisis - Esta operación se puede realizar utilizando muchas técnicas de análisis.
  5. Sacar conclusiones - El análisis da cifras para ser precisos. Pero le corresponde al usuario sacar conclusiones de estos números. Por ejemplo, si dice 10% o 20%, ¿debemos entender qué significa? ¿Deriva correlación entre el atributo A y el atributo B?
  6. Implementar resultados - Es importante implementar conclusiones para ver resultados en los negocios. Por ejemplo, se puede concluir que 'La gente compra paraguas en la temporada de lluvias' lo que puede resultar en más negocios. Aquí, tenemos que implementar la conclusión donde hacemos paraguas, disponible en tiendas, pero luego puede tener problemas de gestión. En el momento en que las estadísticas dan resultados, la implementación puede salir mal.
  7. Monitorear el progreso - El último paso aquí, el seguimiento juega un papel importante. El monitoreo puede salir mal porque no muchas organizaciones quieren monitorear el progreso y se considera un paso insignificante. Pero el seguimiento es importante, ya que podemos entender si nuestra investigación y nuestras conclusiones van en la dirección correcta.

Consulte también este artículoLa correlación no significa causalidadlo que da una idea de cómo los analistas pueden equivocarse. Un punto importante a tener en cuenta en este gráfico es que Ejecutar análisis es el único paso en el que la máquina es responsable y más allá de eso depende de un ser humano que finalmente determinará cómo se realiza la investigación.

Tienes una pregunta para nosotros? Menciónalos en la sección de comentarios y nos pondremos en contacto contigo.



pasando argumentos de línea de comando en java

Artículos Relacionados: