SQL para ciencia de datos: solución integral para principiantes



Esta publicación de blog sobre SQL para ciencia de datos lo ayudará a comprender cómo se puede usar SQL para almacenar, acceder y recuperar datos para realizar análisis de datos.

Desde el momento en que Data Science se ubicó en el número 1 por ser el trabajo más prometedor de la era, todos estamos tratando de unirnos a la carrera de . Esta publicación de blog sobre SQL para ciencia de datos lo ayudará a comprender cómo se puede usar SQL para almacenar, acceder y recuperar datos para realizar análisis de datos.

Aquí hay una lista de temas que serán cubierto en este blog:





    1. ¿Por qué se necesita SQL para la ciencia de datos?
    2. ¿Qué es SQL?
    3. Conceptos básicos de SQL
    4. Instalación de MySQL
    5. Las manos en

¿Por qué se necesita SQL para la ciencia de datos?

¿Sabías que generamos más de 2,5 trillones de bytes de datos al día? Este ritmo de generación de datos es la razón detrás de la popularidad de tecnologías de alta gama como Ciencia de los datos , , y así.

La obtención de información útil a partir de los datos es lo que se denomina ciencia de datos. La ciencia de datos implica extraer, procesar y analizar toneladas de datos. En la actualidad lo que necesitamos son que se puede utilizar para almacenar y administrar esta gran cantidad de datos.



¿Qué es la ciencia de datos? - Edureka

Aquí es donde Entra SQL.

SQL se puede utilizar para almacenar, acceder y extraer cantidades masivas de datos con el fin de llevar a cabo todo el proceso de Data Science con mayor fluidez.



¿Qué es SQL?

SQL que significa Structured Query Language es un lenguaje de consulta destinado a administrar bases de datos relacionales.

Pero, ¿qué es exactamente una base de datos relacional?

Una base de datos relacional es un grupo de tablas bien definidas desde las cuales se puede acceder a los datos, editarlos, actualizarlos, etc., sin tener que alterar las tablas de la base de datos. SQL es el estándar (API) para bases de datos relacionales.

Volviendo a SQL, la programación de SQL se puede utilizar para realizar múltiples acciones en datos, como consultar, insertar, actualizar y eliminar registros de bases de datos. Los ejemplos de bases de datos relacionales que utilizan SQL incluyen MySQL Database, Oracle, etc.

Para obtener más información sobre SQL, puede consultar el siguientes blogs:

  1. Comprensión de los tipos de datos SQL: todo lo que necesita saber sobre los tipos de datos SQL
  2. CREAR TABLA en SQL: todo lo que necesita saber sobre la creación de tablas en SQL

Antes de comenzar con una demostración de SQL, familiaricémonos con los comandos básicos de SQL.

Conceptos básicos de SQL

SQL proporciona un conjunto de comandos simples para modificar tablas de datos, veamos algunos de los comandos básicos de SQL:

  • CREAR BASE DE DATOS - crea una nueva base de datos
  • CREAR MESA - crea una nueva tabla
  • INSERTAR EN - inserta nuevos datos en una base de datos
  • SELECCIONE - extrae datos de una base de datos
  • ACTUALIZAR - actualiza datos en una base de datos
  • ELIMINAR - elimina datos de una base de datos
  • ALTERAR BASE DE DATOS - modifica una base de datos
  • ALTER TABLE - modifica una tabla
  • MESA PLEGABLE - elimina una tabla
  • CREAR ÍNDICE - crea un índice para buscar un elemento
  • ÍNDICE DE GOTA - elimina un índice

Para comprender mejor SQL, instalemos MySQL y veamos cómo puede jugar con los datos.

Instalación de MySQL

Instalar MySQL es una tarea sencilla. Aquí está un guía paso por paso que le ayudará a instalar MySQL en su sistema.

Una vez que hayas terminado de instalar MySQL, siga la sección a continuación para ver una demostración simple que le mostrará cómo puede insertar, manipular y modificar datos.

SQL para ciencia de datos: demostración de MySQL

En esta demostración, veremos cómo crear bases de datos y procesarlas. Esta es una demostración de nivel principiante para comenzar con el análisis de datos en SQL.

¡Entonces empecemos!

Paso 1: crear una base de datos SQL

Una base de datos SQL es un almacén de almacenamiento donde los datos se pueden almacenar en un formato estructurado. Ahora creemos una base de datos usando MySQL :

CREAR BASE DE DATOS edureka UTILIZAR edureka

En el código anterior, hay dos comandos SQL:

Nota : Los comandos SQL se definen en mayúsculas y se usa un punto y coma para terminar un comando SQL.

  1. CREAR BASE DE DATOS: este comando crea una base de datos llamada 'edureka'

  2. USO: Este comando se usa para activar la base de datos. Aquí estamos activando la base de datos 'edureka'.

Paso 2: crea una tabla con las características de datos requeridas

Crear una tabla es tan simple como crear una base de datos. Solo tienes que definir las variables o las características de la tabla con sus respectivos tipos de datos. Veamos cómo se puede hacer esto:

CREAR juguetes TABLE (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Cant. INTEGER)

En el fragmento de código anterior ocurren las siguientes cosas:

  1. Utilice el comando 'CREAR MESA' para crear una tabla llamada juguetes.
  2. La tabla de juguetes contiene 4 características, a saber, TID (ID de transacción), Item_name, Precio y Cantidad.
  3. Cada variable se define con sus respectivos tipos de datos.
  4. La variable TID se declara como clave principal. Una clave primaria básicamente denota una variable que puede almacenar un valor único.

Puede verificar más los detalles de la tabla definida usando el siguiente comando:

DESCRIBIR juguetes

Paso 3: insertar datos en la tabla

Ahora que hemos creado una tabla, completémosla con algunos valores. Anteriormente en este blog, mencioné cómo puede agregar datos a una tabla con solo usar un solo comando, es decir, INSERT INTO.

Veamos cómo se hace esto:

java system.exit (1)
INSERTAR EN juguetes VALORES (NULL, 'Train', 550, 88) INSERTAR EN juguetes VALUES (NULL, 'Hotwheels_car', 350, 80) INSERTAR EN juguetes VALORES (NULL, 'Magic_Pencil', 70, 100) INSERTAR EN juguetes VALORES ( NULL, 'Dog_house', 120, 54) INSERT INTO toys VALUES (NULL, 'Skateboard', 700, 42) INSERT INTO toys VALUES (NULL, 'GI Joe', 300, 120)

En el fragmento de código anterior, simplemente insertamos 6 observaciones en nuestra tabla de 'juguetes' mediante el comando INSERT INTO. Para cada observación, dentro de los corchetes, he especificado el valor de cada variable o característica que se definió al crear la tabla.

La variable TID se establece en NULL ya que se incrementa automáticamente desde 1.

Ahora mostremos todos los datos presentes en nuestra tabla. Esto se puede hacer usando el siguiente comando:

SELECCIONAR * DE juguetes


Paso 4: modificar las entradas de datos

Supongamos que decidió aumentar el precio del G.I. Joe, ya que te está consiguiendo muchos clientes. ¿Cómo actualizaría el precio de la variable en una base de datos?

Es simple, solo use el siguiente comando:

ACTUALIZAR juguetes SET Precio = 350 DONDE TID = 6

El comando ACTUALIZAR le permite modificar cualquier valor / variable almacenado en la tabla. El parámetro SET le permite seleccionar una característica en particular y el parámetro WHERE se usa para identificar la variable / valor que desea cambiar. En el comando anterior, he actualizado el precio de la entrada de datos cuyo TID es 6 (G.I. Joe).

Ahora veamos la tabla actualizada:

SELECCIONAR * DE juguetes

También puede modificar lo que desea que se muestre con solo consultar las columnas que desea ver. Por ejemplo, el siguiente comando mostrará solo el nombre del juguete y su precio respectivo:

SELECT Item_name, Price FROM toys

Paso 5: recuperar datos

Entonces, después de insertar los datos y modificarlos, finalmente es el momento de extraer y recuperar los datos de acuerdo con los requisitos comerciales. Aquí es donde se pueden recuperar los datos para su posterior análisis y modelado de datos.

Tenga en cuenta que es un ejemplo simple para comenzar con SQL; sin embargo, en escenarios del mundo real, los datos son mucho más complicados y de gran tamaño. A pesar de esto, los comandos SQL siguen siendo los mismos y eso es lo que hace que SQL sea tan simple y comprensible. Puede procesar conjuntos de datos complejos con un conjunto de comandos SQL simples.

Ahora recuperemos datos con un par de modificaciones. Consulte el código a continuación e intente comprender lo que hace sin mirar el resultado:

SELECCIONAR * DE juguetes LÍMITE 2

¡Lo adivinaste! Muestra las dos primeras observaciones presentes en mi tabla.

Intentemos algo más interesante.

SELECCIONAR * DE juguetes ORDENAR POR Precio ASC

Como se muestra en la figura, los valores están ordenados en orden ascendente de la variable de precio. Si quieres buscar los tres artículos que se compran con más frecuencia, ¿qué harías?

¡Realmente es bastante simple!

SELECCIONAR * DE juguetes PEDIR POR Cantidad DESC LÍMITE 3

Intentemos uno más.

SELECCIONAR * DE juguetes DONDE Precio> 400 PEDIR POR Precio ASC


Esta consulta extrae los detalles de los juguetes cuyo precio es superior a 400 y ordena la salida en orden ascendente de precio.

Así es como puede procesar datos mediante SQL. Ahora que conoce los conceptos básicos de SQL para la ciencia de datos, estoy seguro de que tiene curiosidad por saber más. Aquí hay un par de blogs para comenzar:

  1. ¿Qué es la ciencia de datos? Una guía para principiantes sobre ciencia de datos
  2. Tutorial de MySQL: una guía para principiantes para aprender MySQL

Si desea inscribirse en un curso completo sobre Inteligencia Artificial y Aprendizaje Automático, Edureka cuenta con un que le permitirá dominar técnicas como el aprendizaje supervisado, el aprendizaje no supervisado y el procesamiento del lenguaje natural. Incluye capacitación sobre los últimos avances y enfoques técnicos en Inteligencia Artificial y Aprendizaje Automático, como Aprendizaje Profundo, Modelos Gráficos y Aprendizaje por Refuerzo.