Tutorial de R: una guía para principiantes para aprender a programar en R



Este blog sobre R Tutorial le presenta la herramienta R y le ayuda a comprender los diversos fundamentos de la programación R en detalle con ejemplos.

R es la herramienta de análisis de datos más popular, ya que es de código abierto, flexible, ofrece múltiples paquetes y tiene una gran comunidad. Está diseñado para programadores de software, estadísticos y mineros de datos, por igual y, por lo tanto, ha dado lugar a la popularidad de .En este blog del tutorial de R, te daré una visión completa de R con ejemplos.

A continuación se muestran los temas de este blog de tutoriales de R que discutiré en la siguiente secuencia:





  1. ¿Por qué necesitamos Analytics? ?
  2. ¿Qué es Business Analytics? ?
  3. Por qué R y quién usa R ?
  4. Instalación de R
  5. Operadores de datos
  6. Tipos de datos
  7. Control de flujo

Tutorial de R: ¿Por qué necesitamos análisis?

Antes de responder la pregunta, permítame informarle algunos de los problemas y sus soluciones en R en múltiples dominios.



banca - R Tutorial - Edureka

Bancario :

Todos los días se genera una gran cantidad de datos de clientes en los bancos. WA pesar de tratar con millones de clientes de forma regular, resulta difícil rastrear sus hipotecas.



Solución :

R construye un modelo personalizado que mantiene los préstamos otorgados a cada cliente individual, lo que nos ayuda a decidir el monto a pagar por el cliente a lo largo del tiempo.

Seguro :

El seguro depende en gran medida de la previsión. Es difícildecidir qué política aceptar o rechazar.

Solución:

Al utilizar el informe crediticio continuo como entrada, podemos crear un modelo en R que no solo evaluará el apetito por el riesgo, sino que también hará un pronóstico predictivo.

Cuidado de la salud:

Cada año, millones de personas ingresan en el hospital y se gastan miles de millones anualmente solo en el proceso de admisión.

Solución :

Dado el historial del paciente y el historial médico, se puede construir un modelo predictivo para identificar quién está en riesgo de hospitalización y en qué medida se debe escalar el equipo médico.

Ahora sabemos cómo el análisis de datos ayuda a las organizaciones a aprovechar sus datos y utilizarlos para identificar nuevas oportunidades. Si hablamos de la necesidad de la analítica en una organización, debes encontrarte con estos 4 aspectos:

A continuación, avancemos en el blog de tutoriales de R, donde primero entenderemos qué es exactamente la analítica empresarial.

Tutorial de R: ¿Qué es Business Analytics?

La analítica empresarial es un proceso que consiste en examinar grandes conjuntos de datos y lograr patrones ocultos, correlaciones y otros conocimientos. Básicamente, le ayuda a comprender todos los datos que ha recopilado, ya sean datos de la organización, datos de investigación de productos o de mercado o cualquier otro tipo de datos. Le resultará fácil tomar mejores decisiones, mejores productos, mejores estrategias de marketing, etc. Consulte la imagen a continuación para comprender mejor:

Si observa la figura anterior, sus datos en la primera imagen están dispersos. Ahora, si desea algo específico, como un registro particular en una base de datos, se vuelve engorroso. Para simplificar esto, necesita un análisis. Con el análisis, resulta fácil establecer una correlación entre los datos. Una vez que haya establecido qué hacer, le resultará bastante fácil tomar decisiones como, por ejemplo, qué camino desea seguir o, en términos de análisis de negocios, qué camino conducirá a la mejora de su organización.

Pero no puede esperar que las personas de la cadena anterior comprendan siempre los datos sin procesar que les proporciona después de la analítica. Entonces, para superar esta brecha, tenemos un concepto de Visualización de datos .

Visualización de datos : La visualización de datos es un acceso visual a grandes cantidades de datos que ha generado después del análisis. La mente humana procesa las imágenes visuales y los gráficos visuales son mejores que compararlos con los datos sin procesar. Siempre es fácil para nosotros entender un gráfico circular o un gráfico de barras en comparación con números brutos. Ahora puede que se pregunte cómo puede lograr esta visualización de datos a partir de los datos que ya ha analizado.
Hay varias herramientas disponibles en el mercado de visualización de datos:

Todos deben estar preguntándose que ya existen tantas herramientas que lo ayudan a lograr la visualización de datos y cierta cantidad de análisis, ¿por qué optar por R?

Así que mi próximo tema en el blog tutorial de R trata sobre 'por qué R' y 'quién usa R'.

Tutorial de R: ¿Por qué R y quién usa R?

¿Por qué R?

R es un lenguaje de programación y estadístico.

R se utiliza para análisis y visualización de datos.

R es simple y fácil de aprender, leer y escribir.

R es un ejemplo de un FLOSS (software libre y de código abierto) en el que se pueden distribuir copias de este software, leer su código fuente, modificarlo, etc.

¿Quién usa R?

  • La Oficina de Protección Financiera del Consumidor usa R para el análisis de datos
  • Los estadísticos de John Deere utilizan R para el modelado de series de tiempo y el análisis geoespacial de una manera confiable y reproducible.
  • Bank of America usa R para informar.
  • R es parte de la pila de tecnología detrás del famoso motor de recomendaciones de Foursquare.
  • ANZ, el cuarto banco más grande de Australia, utiliza R para el análisis de riesgo crediticio.
  • Google usa R para predecir la actividad económica.
  • Mozilla, la fundación responsable del navegador web Firefox, usa R para visualizar la actividad web.

A continuación se muestran algunos de los dominios en los que se usa R:

Ahora, avancemos en el blog tutorial de R e instalemos R.

Tutorial de R: Instalación de R

Permítame guiarlo a través del proceso de instalación de R en su sistema. Simplemente siga los pasos a continuación:

Paso 1 : Vaya al enlace: https://cran.r-project.org/

Paso 2 : Descargue e instale R 3.3.3 en su sistema.

Consulte la captura de pantalla a continuación para comprender mejor.

es-una relación en java

Siguiendo los pasos anteriores, habrá terminado con la parte de instalación de R. Ahora, puede comenzar a codificar directamente en R descargando RStudio IDE. Para descargar esto, siga los pasos a continuación:

Paso 1 : Vaya al enlace- https://www.rstudio.com/

Paso 2 : Descargue e instale Rstudio en su sistema.

Después de instalar todo, ¡ya está listo para codificar!

Tutorial de R para principiantes | Tutorial de programación de R | Edureka

A continuación, avancemos en el blog Tutorial de R y entendamos qué son los operadores de datos en R.

Tutorial de R: Operadores de datos en R

Existen principalmente 5 tipos diferentes de operadores, que se enumeran a continuación:

  1. Operadores aritméticos : Realiza operaciones aritméticas como suma, resta, multiplicación, división, etc.
  2. Operadores de Asignación :Los operadores de asignación se utilizan para asignar valores. Por ejemplo:
  • Operador de asignación =
    Sintaxis:
    nombre de variable = valor
>x=5 >x 
Resultado: [1] 5
  • Operador de asignación<-
    Sintaxis:
    nombre de la variable<- value

    >x<- 15 >x
    Resultado: [1] 15
  • Operador de asignación<<-
    Sintaxis:
    nombre de la variable<<- value
>x<<- 2 >x
Resultado: [1] 2
  • Operador de asignación ->
    Sintaxis:
    valor -> nombre de la variable

    >25 -> x >x 
    Resultado: [1] 25

3. Operador relacional : Define una relación entre dos entidades. Por ejemplo: ,<=,!= etc.

>xx!=2
Salida:[1] VERDADERO

4. Operadores lógicos : Estos operadores comparan las dos entidades y se utilizan normalmente con valores booleanos (lógicos) como &, | y!.

> x2 y 3
Salida:[1] VERDADERO

5. Operadores especiales : Estos operadores se utilizan para fines específicos, no para cálculos lógicos. Por ejemplo:

  • Crea la serie de números en secuencia para un vector.

    >xx
    Salida: [1] 2 3 4 5 6 7 8
  • % in% Este operador se utiliza para identificar si un elemento pertenece a un vector.
    Ejemplo

    > xyy% en% x
    Resultado: [1] VERDADERO

Tutorial de R: tipos de datos

Los tipos de datos se utilizan para almacenar información. En R, no necesitamos declarar una variable como algún tipo de datos. Las variables se asignan con R-Objects y el tipo de datos del objeto R se convierte en el tipo de datos de la variable.Hay principalmente seis tipos de datos presentes en R:

Entremos en más detalle sobre cada uno de ellos:

Vector : Un vector es una secuencia de elementos de datos del mismo tipo básico. Ejemplo:

vtr = (1, 3, 5, 7 9)

o

vtr<- (1, 3, 5 ,7 9)

Hay 5 vectores atómicos, también denominados cinco clases de vectores.

Lista : Las listas son los objetos R que contienen elementos de diferentes tipos como & menos números, cadenas, vectores y otra lista dentro.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = lista (n, s, VERDADERO) >x

Salida

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] VERDADERO

Matrices : Las matrices son los objetos de datos R que pueden almacenar datos en más de dos dimensiones. Toma vectores como entrada y usa los valores del parámetro dim para crear una matriz.

vector1<- c(5,9,3) vector2<- c(10,11,12,13,14,15) resultado<- array(c(vector1,vector2),dim = c(3,3,2))

Salida

, , 1 [,1] [,2] [,3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 , , 2 [,1] [,2] [,3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Matrices : Las matrices son los objetos R en los que los elementos están dispuestos en un diseño rectangular bidimensional. Una matriz se crea utilizando la función matrix (). Ejemplo: matriz (datos, nrow, ncol, byrow, dimnames) dónde,

datos es el vector de entrada que se convierte en los elementos de datos de la matriz.

nrow es el número de filas que se crearán.

ncol es el número de columnas que se crearán.

byrow es una pista lógica. Si es TRUE, los elementos del vector de entrada se organizan por filas.

dimname son los nombres asignados a las filas y columnas.

> Alfombra<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Alfombra
Salida :
[,1] [,2] [,3] [,4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Factores : Los factores son los objetos de datos que se utilizan para categorizar los datos y almacenarlos como niveles. Pueden almacenar tanto cadenas como enteros. Son útiles en el análisis de datos para el modelado estadístico.

> datos<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data

Salida :

[1] Este Oeste Este Noreste Noreste Oeste Oeste Este Niveles: Este Noroeste

Marcos de datos : Un marco de datos es una tabla o una estructura bidimensional similar a una matriz en la que cada columna contiene valores de una variable y cada fila contiene un conjunto de valores de cada columna.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > marcas = c (623.3,515.2,611.0,729.0,843.25) >std.data<- data.frame(std_id, std_name, marks) >std.data

Salida :

std_id std_name marcas 1 1 Rick 623.30 2 2 y 515.20 3 3 Michelle 611.00 4 4 Ryan 729.00 5 5 Gary 843.25

Con esto, llegamos al final de diferentes tipos de datos en R. A continuación, avancemos en el blog R Tutorial y entendamos otro concepto clave: declaraciones de control de flujo.

Tutorial de R: instrucciones de control de flujo

Las sentencias de control de flujo juegan un papel muy importante ya que le permiten controlar el flujo de ejecución de un script dentro de una función. Las declaraciones de control de flujo más utilizadas se representan en la siguiente imagen:

Ahora, analicemos cada uno de ellos con ejemplos.

Tutorial de R: sentencias de selector

  • Si declaración de control : Esta declaración de control evalúa una sola condición. Es bastante fácil ya que solo tiene una sola palabra clave 'si' seguida de la condición y luego cierto conjunto de declaraciones que deben ejecutarse en caso de que sea cierto. Consulte el diagrama de flujo a continuación para comprender mejor:

En este diagrama de flujo, el código responderá de la siguiente manera:

  1. En primer lugar, ingresará al bucle donde verifica la condición.
  2. Si la condición es verdadera, se ejecutará el código condicional o las declaraciones escritas.
  3. Si la condición es falsa, las declaraciones se ignoran.

A continuación se muestra un ejemplo de Si instrucción de control en R. Intente ejecutar este ejemplo en R Studio.

x = 2 repetir {x = x ^ 2 imprimir (x) si (x> 100) {descanso}

Salida:

[1] 4 [1] 16 [1] 256
  • Declaración de control If Else :Examens tipo de declaración de controlevalúa un grupo de condiciones y selecciona las declaraciones. Consulte el diagrama de flujo a continuación para comprender mejor:

En este diagrama de flujo, el código responderá de la siguiente manera:

  1. En primer lugar, ingresará al bucle donde verifica la condición.
  2. Si la condición es verdadera, se ejecutarán las primeras declaraciones 'si'.
  3. Si la condición es falsa, entonces pasa a la condición 'else if' y si es verdadera, se ejecutará el código 'else if'.
  4. Finalmente, si el código 'else if' también es falso, entonces irá al código 'else' y se ejecutará. Esto significa que si ninguna de estas condiciones es verdadera, entonces se ejecuta la instrucción 'else'.

A continuación se muestra un ejemplo de si mas instrucción de control en R. Intente ejecutar este ejemplo en R Studio.

x5) {print ('x es mayor que 5')} elseif (x == 5) {print ('x es igual a 5')} else {print ('x no es mayor que 5')}

Salida:

[1] 'x es igual a 5'
  • Cambiar declaraciones : Estas declaraciones de control se utilizan básicamente para comparar una determinada expresión con un valor conocido. Consulte el diagrama de flujo a continuación para comprender mejor:

En este diagrama de flujo de caso de Switch, el código responderá en los siguientes pasos:

  1. En primer lugar, entrará en el caso del interruptor que tiene una expresión.
  2. Luego pasará a la condición del Caso 1, verifica el valor pasado a la condición. Si es cierto, se ejecutará el bloque Statement. Después de eso, saldrá de esa caja del interruptor.
  3. En caso de que sea falso, cambiará al siguiente caso. Si la condición del Caso 2 es verdadera, ejecutará la declaración y saldrá de ese caso, de lo contrario, saltará nuevamente al siguiente caso.
  4. Ahora digamos que no ha especificado ningún caso o hay alguna entrada incorrecta del usuario, luego irá al caso predeterminado donde imprimirá su declaración predeterminada.

A continuación se muestra un ejemplo de la instrucción switch en R. Intente ejecutar este ejemplo en R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Salida:

[1] 275

Tutorial de R: declaraciones de bucle

Los bucles te ayudan a repetir cierto conjunto de acciones para que no tengas que realizarlas repetidamente. Imagina que necesitas realizar una operación 10 veces, si empiezas a escribir el código para cada vez, la duración del programa aumenta y te será difícil entenderlo más tarde. Pero al mismo tiempo, al usar un bucle, si escribo la misma declaración dentro de un bucle, se ahorra tiempo y se facilita la legibilidad del código. También se optimiza más con respecto a la eficiencia del código.

En la imagen de arriba, ' repetir' y ' mientras 'Las declaraciones le ayudan a ejecutar un cierto conjunto de reglas hasta que la condición es verdadera pero' para' es una declaración de bucle que se utiliza cuando sabe cuántas veces desea repetir un bloque de declaración. Ahora, si sabe que quiere repetirlo 10 veces, entonces usará la declaración 'for' pero si no está seguro de cuántas veces desea que se repita el código, irá con 'repetir' o bucle 'while'.

Analicemos cada uno de ellos con ejemplos.

  • Repetir : El ciclo de repetición ayuda a ejecutar el mismo conjunto de código una y otra vez hasta que se cumple una condición de parada. Consulte el diagrama de flujo a continuación para comprender mejor:

En el diagrama de flujo anterior, el código responderá en los siguientes pasos:

  1. En primer lugar, ingresará y ejecutará un conjunto de código.
  2. A continuación, verificará la condición, si es verdadera, volverá y ejecutará el mismo conjunto de código nuevamente hasta que esté destinado a ser falso.
  3. Si se encuentra que es falso, saldrá directamente del bucle.
  • Mientras : La instrucción while también ayuda a ejecutar el mismo conjunto de código una y otra vez hasta que se cumple una condición de detención. Consulte el diagrama de flujo a continuación para comprender mejor:

En el diagrama de flujo anterior, el código responderá en los siguientes pasos:

  1. En primer lugar, comprobará el estado.
  2. Si se determina que es cierto, ejecutará el conjunto de código.
  3. A continuación, vuelve a comprobar la condición, si es verdadera ejecutará el mismo código de nuevo. Tan pronto como se determina que la condición es falsa, sale inmediatamente del bucle.

A continuación se muestra un ejemplo de la instrucción while en R. Intente ejecutar este ejemplo en R Studio.

x = 2 mientras (x<1000) { x=x^2 print(x) } 

Salida:

4 16 256 65536

Entonces, debe preguntarse en qué se diferencian estas dos declaraciones. ¡Déjame aclarar tu duda!
Aquí, la principal diferencia entre la declaración repeat y while es que cambia con respecto a su condición. Mientras bucle básicamente define cuándo va a ingresar al bucle para ejecutar las declaraciones y repetir bucle define cuándo sale del bucle después de la ejecución de las declaraciones. Entonces, estas dos declaraciones se conocen como bucle de control de entrada y bucle de control de salida. Así es como las declaraciones while y repeat son diferentes.

  • En bucle: Los bucles for se utilizan cuando es necesario ejecutar un bloque de código varias veces. Consulte el diagrama de flujo a continuación para comprender mejor:

En el diagrama de flujo anterior, el código responderá en los siguientes pasos:

  1. En primer lugar, está la inicialización en la que especifica cuántas veces desea que se repita el ciclo.
  2. A continuación, comprueba la condición. Si la condición es verdadera, ejecutará el conjunto de código el número de veces especificado.
  3. Tan pronto como se determina que la condición es falsa, sale inmediatamente del bucle.

A continuación se muestra un ejemplo de la instrucción for en R. Intente ejecutar este ejemplo en R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Salida:

7 19 25 65 45

A continuación, pasemos a nuestro último conjunto de declaraciones en el blog R Tutorial, es decir, declaraciones de salto.

Tutorial de R: sentencias de salto

Declaración de ruptura : Las sentencias de ruptura ayudan a terminar el programa y reanuda el control a la siguiente sentencia que sigue al ciclo. Estas declaraciones también se utilizan en caso de cambio. Consulte el diagrama de flujo a continuación para comprender mejor:

En el diagrama de flujo anterior, el código responderá en los siguientes pasos:

  1. En primer lugar, ingresará al bucle donde verifica la condición.
  2. Si la condición del bucle es falsa, sale directamente del bucle.
  3. Si la condición es verdadera, comprobará la condición de rotura.
  4. Si la condición de ruptura es verdadera, existe en el bucle.
  5. Si la condición de interrupción es falsa, ejecutará las declaraciones que quedan en el ciclo y luego repetirá los mismos pasos.

A continuación se muestra un ejemplo de declaración de salto en R. Intente ejecutar este ejemplo en R Studio.

x<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Salida:

[1] 1 [1] 2

Declaración siguiente : Se utiliza una siguiente declaración cuando desea omitir la iteración actual del ciclo sin terminarlo. La siguiente declaración es bastante similar a 'continuar' en otro lenguaje de programación. Consulte el diagrama de flujo a continuación para comprender mejor:

En el diagrama de flujo anterior, el código responderá en los siguientes pasos:

  1. En primer lugar, ingresará al bucle donde verifica la condición.

  2. Si la condición del bucle es falsa, sale directamente del bucle.

  3. Si la condición del ciclo es verdadera, ejecutará las declaraciones del bloque 1.

  4. Después de eso, buscará la declaración 'siguiente'. Si está presente, las declaraciones posteriores no se ejecutarán en la misma iteración del ciclo.

  5. Si la declaración 'siguiente' no está presente, se ejecutarán todas las declaraciones posteriores.

A continuación se muestra un ejemplo de la siguiente declaración en R. Intente ejecutar este ejemplo en R Studio.

para (i en 1:15) {if ((i %% 2) == 0) {siguiente} print (i)}

Salida:

1 3 5 7 9 11 13 15

Este es el final del blog del tutorial de R. Espero que tengan claro todos y cada uno de los conceptos que he comentado anteriormente. Estén atentos, mi próximo blog será sobre entrenamiento de R donde explicaré algunos conceptos más de R en detalle con examplio.

Ahora que ha entendido los conceptos básicos de R, consulte la por Edureka, una empresa de aprendizaje en línea de confianza con una red de más de 250.000 alumnos satisfechos repartidos por todo el mundo. La capacitación de Edureka en análisis de datos con R lo ayudará a adquirir experiencia en programación R, manipulación de datos, análisis exploratorio de datos, visualización de datos, minería de datos, regresión, análisis de sentimientos y uso de R Studio para estudios de casos de la vida real en el comercio minorista y las redes sociales.

Tienes una pregunta para nosotros? Por favor, menciónelo en la sección de comentarios de este blog “R Tutorial” y nos comunicaremos con usted lo antes posible.