Programación R - Guía para principiantes del lenguaje de programación R



Este blog sobre programación en R le presenta R y lo ayuda a comprender los diversos conceptos fundamentales de la programación en R en detalle con ejemplos.

R es una de las herramientas de análisis más populares. Pero además de usarse para análisis, R también es un lenguaje de programación.Con su crecimiento en la industria de TI, existe una demanda en auge de personal calificado o con una comprensión de R como una herramienta de análisis de datos y un lenguaje de programación.En este blog, lo ayudaré a comprender los diversos fundamentos de la programación en R. En nuestro pags retrógrado blog ,hemos discutido por qué necesitamos análisis, qué es análisis de negocios, por qué y quién usa R.

En este blog, comprenderemos los siguientes conceptos básicos de la programación en R en la siguiente secuencia:





  1. Variables
  2. Tipos de datos
  3. Operadores de datos
  4. Sentencia condicional
  5. Bucles
  6. Funciones

Puede pasar por la grabación del seminario web de R Programming Language donde nuestro instructor ha explicado los temas de manera detallada con ejemplos que le ayudarán a comprender mejor la R Programming.

Programación R para principiantes | Tutorial del lenguaje de programación R | Edureka



Así que avancemos y veamos el primer concepto de programación en R: variables.

Programación R: Variables

Las variables no son más que un nombre para una ubicación de memoria que contiene un valor. Una variable en R puede almacenar valores numéricos, valores complejos, palabras, matrices e incluso una tabla. Sorprendente, ¿verdad?

Variable - Programación R - Edureka

Higo: Creaciónde variables



La imagen de arriba nos muestra cómo se crean las variables y cómo se almacenan en diferentes bloques de memoria. En R, no tenemos que declarar una variable antes de usarla, a diferencia de otros lenguajes de programación como Java, C, C ++, etc.

Avancemos e intentemos comprender qué es un tipo de datos y los distintos tipos de datos admitidos en R.

Programación R: tipos de datos

En R, una variable en sí no se declara de ningún tipo de datos, sino que obtiene el tipo de datos del objeto R que se le asigna. Entonces, R se denomina lenguaje de tipado dinámico, lo que significa que podemos cambiar un tipo de datos de la misma variable una y otra vez cuando lo usamos en un programa.

Tipos de datos especifica qué tipo de valor tiene una variable y qué tipo de operaciones matemáticas, relacionales o lógicas se le pueden aplicar sin causar un error. Hay muchos tipos de datos en R, sin embargo, a continuación se muestran los que se utilizan con más frecuencia:

Analicemos ahora cada uno de estos tipos de datos individualmente, comenzando por los vectores.

Vectores

Los vectores son los objetos de datos R más básicos y existen seis tipos de vectores atómicos. A continuación se muestran los seis vectores atómicos:

Lógico : Se utiliza para almacenar valores lógicos como CIERTO o FALSO .

Numérico : Se utiliza para almacenar números positivos y negativos, incluido el número real.

Por ejemplo: 25, 7.1145, 96547

Entero : Contiene todos los valores enteros, es decir, todos los números enteros positivos y negativos.

Por ejemplo: 45.479, -856.479, 0

Complejo : Estos son de la forma x + yi, donde xey son numéricos e i representa la raíz cuadrada de -1.

Por ejemplo: 4 + 3i

Personaje : Se utiliza para almacenar un solo carácter, un grupo de caracteres (palabras) o un grupo de palabras juntas. Los caracteres se pueden definir entre comillas simples o dobles.

Por ejemplo: 'Edureka', 'R es divertido de aprender'.

En general, un vector se define e inicializa de la siguiente manera:

Vtr = c (2, 5, 11, 24) O Vtr<- c(2, 5, 11 , 24)

Avancemos y entendamos otros tipos de datos en R.

Lista

Las listas son bastante similares a los vectores, pero las listas son los objetos R que pueden contener elementos de diferentes tipos como números y menos, cadenas, vectores y otra lista dentro de ellos.

P.ej:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Salida:

[[1]] [1] 'Hola' 'Hola' 'Cómo estás haciendo '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] VERDADERO

Matriz

Matrix es el objeto R en el que los elementos están dispuestos en un diseño rectangular bidimensional.

que son chef y marioneta

La sintaxis básica para crear una matriz en R es & menos

 matriz (datos, nrow, ncol, byrow, dimnames) 

Dónde:

  • datos es el vector de entrada que se convierte en los elementos de datos de la matriz.
  • nrow es el número de filas que se crearán.
  • ncol es el número de columnas que se crearán.
  • byrow es una pista lógica. Si es TRUE, los elementos del vector de entrada están ordenados por filas.
  • dimname son los nombres asignados a las filas y columnas.

Ejemplo:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Salida:

[,1] [,2] [,3] [,4] [,5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4,] 16 17 18 19 20 [5,] 21 22 23 24 25

FORMACIÓN

Las matrices en R son objetos de datos que se pueden usar para almacenar datos en más de dos dimensiones. Toma vectores como entrada y usa los valores en el No parámetro para crear una matriz.

La sintaxis básica para crear una matriz en R es & menos

 matriz (datos, dim, dimnames) 

Dónde:

  • datos es el vector de entrada que se convierte en los elementos de datos de la matriz.
  • No es la dimensión de la matriz, donde se pasa el número de filas, columna y el número de matrices a crear por las dimensiones mencionadas.
  • dimname son los nombres asignados a las filas y columnas.

Ejemplo:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Salida:

, , 1 [,1] [,2] [,3] [,4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 , , 2 [,1] [,2] [,3] [,4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Marco de datos

Un marco de datos es una tabla o una estructura bidimensional similar a una matriz en la que cada columna contiene valores de una variable y cada fila contiene un conjunto de valores.paracada columna. A continuación se muestran algunas de las características de un marco de datos que deben tenerse en cuenta cada vez que trabajamos con ellos:

  • Los nombres de las columnas no deben estar vacíos.
  • Cada columna debe contener la misma cantidad de elementos de datos.
  • Los datos almacenados en un marco de datos pueden ser de tipo numérico, factorial o de carácter.
  • Los nombres de las filas deben ser únicos.

Ejemplo:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Ventas', 'Finanzas', 'Marketing', 'RRHH ',' I + D ') datos emp.<- data.frame(emp_id, emp_name, dept) emp.data 

Salida:

emp_id emp_name departamento 1100 John Sales 211 Henry Finanzas 3102 Adam Marketing 4 103 Ron HR 5104 Gary I + D

Entonces, ahora que hemos entendido los tipos de datos básicos de R, es hora de profundizar en R al comprender los conceptos de Operadores de datos.

Programación R: Operadores de datos

Hay principalmente 4 operadores de datos en R, que se muestran a continuación:

Operadores aritméticos : Estos operadores nos ayudan a realizar las operaciones aritméticas básicas como suma, resta, multiplicación, etc.

Considere el siguiente ejemplo:

num1 = 15 num2 = 20 num3 = 0 # adición num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponente num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #división de piso num3 = num1% /% num2 num3

Salida:

[1] 35 [1] -5 [1] 300 [1] 0.75 [1] 15 [1] 125 [1] 1

Operadores relacionales : Estos operadores nos ayudan a realizar operaciones relacionales como verificar si una variable es mayor, menor o igual que otra variable. La salida de una operación relacional es siempre un valor lógico.

Considere los siguientes ejemplos:

num1 = 15 num2 = 20 # igual a num3 = (num1 == num2) num3 #no es igual a num3 = (num1! = num2) num3 #menos que num3 = (num1 num2) num3 #menos que igual a num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Salida:

[1] FALSO [1] VERDADERO [1] VERDADERO [1] FALSO [1] VERDADERO [1] FALSO

Operadores de Asignación: Estos operadores se utilizan para asignar valores a las variables en R. La asignación se puede realizar utilizando el operador de asignación(<-) o operador igual (=). El valor de la variable se puede asignar de dos formas, asignación a la izquierda y asignación a la derecha.

LógicoOperadores: Estos operadores comparan las dos entidades y se utilizan normalmente con valores booleanos (lógicos) como 'y', 'o'y'no'.


Programación R: Declaraciones condicionales

  1. Si declaración: La instrucción If le ayuda a evaluar una sola expresión como parte del flujo. Para realizar esta evaluación, solo necesita escribir la palabra clave If seguida de la expresión a evaluar. El siguiente diagrama de flujo le dará una idea de cómo la instrucción If controla el flujo de un código: Considere el siguiente ejemplo:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Salida:

[1] 'Num1 es menor o igual que Num2'
  • Otra declaración si: La instrucción Else if le ayuda a extender las ramas al flujo creado por la instrucción If y le da la oportunidad de evaluar múltiples condiciones creando nuevas ramas de flujo. El siguiente flujo le dará una idea de cómo la instrucción else if ramifica el flujo del código:

    Considere el siguiente ejemplo:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 es menor que Num1')} else if ('Num1 == Num2) {print (' Num1 y Num2 son iguales ')}

    Salida:

    [1] 'Num1 es menor que Num2'

  • Otra declaración: La instrucción else se usa cuando todas las demás expresiones se verifican y se encuentran inválidas. Esta será la última instrucción que se ejecute como parte de la rama If - Else if. El siguiente flujo le dará una mejor idea de cómo Else altera el flujo del código:

Considere el siguiente ejemplo:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 es menor que Num1')} else print ('Num1 y Num2 son iguales')}

Salida:

[1] 'Num1 y Num2 son iguales'

Programación R: Bucles

Una declaración de bucle nos permite ejecutar una declaración o grupo de declaraciones varias veces. Hay principalmente 3 tipos de bucles en R:

tutoriales de ms sql para principiantes
  1. repetir bucle : Repite una declaración o un grupo de declaraciones mientras una condición dada es VERDADERA. El ciclo de repetición es el mejor ejemplo de un ciclo controlado de salida donde el código se ejecuta primero y luego se verifica la condición para determinar si el control debe estar dentro del ciclo o salir de él. A continuación se muestra el flujo de control en un ciclo de repetición:
    Veamos el siguiente ejemplo para entender cómo podemos usar el ciclo de repetición para sumar n números hasta que la suma supere los 100:

    x = 2 repetir {x = x ^ 2 imprimir (x) si (x> 100) {descanso}

    Salida:

    [1] 4 [1] 16 [1] 256
  2. while Loop : yoAyuda a repetir una declaración o un grupo de declaraciones mientras una condición dada es VERDADERA. Si bien el bucle, en comparación con el bucle de repetición, es ligeramente diferente, es un ejemplo de un bucle controlado por entrada donde la condición se verifica primero y solo si se encuentra que la condición es verdadera, el control se entrega dentro del bucle para ejecutar el código. . A continuación se muestra el flujo de control en un ciclo while:
    Veamos el siguiente ejemplo para sumar la suma de cuadrados de los primeros 10 números y entender cómo funciona mejor el ciclo while:

    num = 1 sumn = 0 mientras (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Salida:

    [1] 1 [1] 5 [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. en bucle : Se utiliza para repetir una declaración o grupo de un número fijo de veces. A diferencia de repeat y while, el bucle for se utiliza en situaciones en las que sabemos la cantidad de veces que el código debe ejecutarse de antemano. Es similar al ciclo while en el que primero se verifica la condición y luego solo se ejecuta el código escrito dentro. Veamos ahora el flujo de control del bucle for:

Veamos ahora un ejemplo en el que usaremos el ciclo for para imprimir los primeros 10 números:

para (x en 1:10) {imprimir (x)}

Salida:

[1] 1 [1] 2 [1] 3 [1] 4 [1] 5 [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

Programación R: Funciones

Una función es un bloque de código organizado y reutilizable que se utiliza para realizar una única acción relacionada. Hay principalmente dos tipos de funciones en R:

Funciones predefinidas : Son funciones integradas que el usuario puede utilizar para hacer su trabajo facilr. Por ejemplo: meanorte( x) , stumetro( x) , sqrt ( x ), toupper( x ), etc.

Usuario definido Funciones: Estas funciones son creadas por el usuario para cumplir con un requisito específico del usuario. La siguiente es la sintaxis para crear una función enR:

 func  nombre_cion  <– función (arg_1, arg_2 y hellip){ // Cuerpo de la función }

Considere el siguiente ejemplo de una función simple para generar la suma de los cuadradosde2 números:

suma_de_cuadrado<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Resultado: [1] 25

Espero que hayas disfrutado leyendo este blog de programación R. Hemos cubierto todos los conceptos básicos de R en este tutorial, por lo que puede comenzar a practicar ahora. Después de este blog de programación de R, crearé más blogs sobre R for Analytics, así que estad atentos.

Ahora que ha entendido los conceptos básicos de R, consulte la por Edureka, una empresa de aprendizaje en línea de confianza con una red de más de 250.000 alumnos satisfechos repartidos por todo el mundo. La capacitación de Edureka en análisis de datos con R lo ayudará a adquirir experiencia en programación R, manipulación de datos, análisis exploratorio de datos, visualización de datos, minería de datos, regresión, análisis de sentimientos y uso de RStudio para estudios de casos de la vida real en minoristas y redes sociales.

Tienes una pregunta para nosotros? Menciónelo en la sección de comentarios de este blog de “Programación en R” y nos comunicaremos con usted lo antes posible.