Pandas Concatenate Data Frames [2022]
Publicado: 2021-01-06Imagine que tiene dos conjuntos de datos que debe combinar para realizar el análisis. Al usar SQL, los registros de dos o más tablas en una base de datos se pueden combinar mediante uniones SQL. De manera similar, también hay opciones en Python para concatenar marcos de datos. Entonces, ¿qué es un marco de datos? Un marco de datos en Python tiene varias filas y columnas. Es similar a una tabla en SQL. Tienes la librería de software pandas para el análisis de datos en Python. Los marcos de datos concatenados de pandas nos ayudan a combinar marcos de datos en función de una determinada lógica.
Las diferentes formas de combinar tramas de datos:
- Unión interna: la unión interna es bastante similar a la intersección de dos conjuntos. En el caso de una combinación interna, se devuelve un marco de datos que contiene solo aquellas filas que tienen propiedades comunes. Por lo tanto, cada fila en los dos marcos de datos combinados debe tener valores de columna coincidentes.
- Unión izquierda: una unión izquierda devuelve todas las filas del marco de datos izquierdo y solo las filas coincidentes del marco de datos derecho.
- Combinación derecha: una combinación derecha devuelve todas las filas del marco de datos derecho y solo las filas coincidentes del marco de datos izquierdo.
- Combinación completa o externa: una combinación completa conserva todas las filas tanto del marco de datos izquierdo como del marco de datos derecho.
Fuente
Veamos ahora las funciones presentes en Pandas para combinar marcos de datos o series.
Tabla de contenido
Funciones en Pandas
1. Función de unión
Como hemos leído, Python tiene muchas funciones similares a SQL disponibles para combinar datos. Los marcos de datos tienen un índice que actúa como una dirección. Por lo general, los índices de las filas se denominan índices, mientras que las columnas se identifican con los nombres de las columnas. La operación Unir le permite fusionar todas las columnas de dos marcos de datos. Puede cambiar el nombre de la columna izquierda y derecha actualizando los parámetros "lsuffix" y "rsuffix". Tiene la opción de elegir la forma de fusión actualizando el parámetro "cómo".
2. Función de fusión
La función de fusión es bastante similar a la operación de unión. Sin embargo, obtiene un control flexible al combinar todas las columnas de dos marcos de datos. Puede usar on = Nombre de columna para fusionar marcos de datos en la columna común. Puede actualizar left_on = Nombre de columna o right_on = Nombre de columna para alinear tablas usando columnas del marco de datos izquierdo o derecho como claves. Si elige left_index = True o right_index = True, podrá utilizar las etiquetas de fila del marco de datos izquierdo o del marco de datos derecho como claves de combinación.
Sintaxis:
DataFrame.merge( self , right , how='left' , on=Ninguno , left_on=Ninguno ,
right_on=Ninguno , left_index=False , right_index=False , sort=False , sufijos=('_x' , '_y') , copy=Verdadero , indicador=Falso , validar=Ninguno )
Leer: Preguntas de la entrevista de pandas
3. Función de combinación
Usando la función Concat, puede combinar datos en columnas o filas según su elección. Puede establecer la lógica de unión (izquierda/derecha/interior/completo) en cualquiera de los dos ejes. También obtiene una opción para verificar si el nuevo eje concatenado tiene valores duplicados presentes usando verificar_integridad. Si no se especifica ningún valor de índice en el eje de concatenación, el eje resultante se etiquetará como 0,1,… n-1. El parámetro de claves le permite formar una indexación jerárquica utilizando las claves pasadas.

Sintaxis
pandas.concat( objs , axis=0 , join='left' , join_axes=Ninguno ,
ignore_index=Falso , claves=Ninguno , niveles=Ninguno , nombres=Ninguno ,
verificar_integridad=Falso , ordenar=Ninguno , copiar=Verdadero )
Leer: Algoritmo de estructura de datos en Python
Terminando
Como hemos visto en pandas. Las funciones DataFrame, fusionar y unir se utilizan para combinar marcos de datos que trabajan en columnas. También hay una opción para cambiar el nombre de las columnas según el sufijo proporcionado. La función de combinación ofrece más flexibilidad en el caso de la alineación por filas. Por el contrario, la función Concat de pandas puede operar tanto en filas como en columnas.
No se cambia el nombre de las columnas mientras se usa la función Concat. Los marcos de datos concatenados de Pandas son una característica esencial cuando tenemos que combinar dos marcos de datos. Combinar dos marcos de datos usando ciertas condiciones lo ayuda a preparar los datos necesarios para el análisis y otras tareas. Por lo tanto, para la biblioteca de software pandas concatenar marcos de datos es una función integral.
¿Está interesado en obtener más información sobre las diversas funciones disponibles en pandas y profundizar en el análisis de datos? Puede consultar el Diploma PG en ciencia de datos ofrecido por upGrad. Los cursos están a cargo de expertos de la industria y lo ayudarán a obtener más información sobre el análisis exploratorio de datos, diversas técnicas de visualización de datos y algoritmos sobre aprendizaje automático. Inicie su carrera en el campo del análisis de datos y el aprendizaje automático con upGrad.
¿Cuáles son los diferentes tipos de articulaciones en Pandas?
La biblioteca de Pandas proporciona cuatro tipos de uniones diferentes para combinar marcos de datos. Estas combinaciones son las siguientes: la combinación interna es la combinación más básica para combinar marcos de datos. La combinación interna devuelve un marco de datos que contiene solo aquellas filas que tienen propiedades comunes. Por lo tanto, ambos marcos de datos combinados deben tener valores comunes. La unión completa o externa devuelve todas las filas de los marcos de datos izquierdo y derecho. En otras palabras, proporciona la unión de ambos marcos de datos. La combinación izquierda devuelve todas las filas del marco de datos izquierdo junto con las filas coincidentes del marco de datos derecho. La combinación derecha es exactamente lo contrario de la combinación izquierda. Devuelve todas las filas del marco de datos derecho junto con las filas coincidentes del marco de datos izquierdo.
¿Cuáles son las diferentes formas de concatenar filas o columnas?
Las filas o columnas de dos marcos de datos se pueden concatenar de las siguientes maneras: 1. Concatenar DataFrame usando .concat(): esta es la forma más sencilla de concatenar dos filas o columnas donde usamos la función “.concat()”. 2. Concatenación de DataFrame configurando la lógica en los ejes: en este método, definimos diferentes lógicas en los ejes. Las siguientes son las formas de establecer ejes: tomar la unión (unir = exterior), tomar la intersección (unir = interior), usar un índice específico. 3. Concatenar DataFrame usando .append() - la función “.append()” se usa justo antes de la función “.concat()” y se concatena a lo largo del eje = 0. 4. Concatenar DataFrame ignorando índices - En este método , ignoramos los índices sin sentido y agregamos el marco de datos. Usamos ignore_index como argumento para ignorar los índices superpuestos.
¿Qué sabes sobre la función de combinación?
La función de combinación se opera en dos marcos de datos para combinar las filas o columnas. Es una operación de combinación de memoria alta y se parece a las bases de datos relacionales. Puede usar on = Nombre de columna para fusionar marcos de datos en la columna común.
Puede actualizar left_on = Nombre de columna o right_on = Nombre de columna para alinear tablas usando columnas del marco de datos izquierdo o derecho como claves. Si elige left_index = True o right_index = True, podrá utilizar las etiquetas de fila del marco de datos izquierdo o del marco de datos derecho como claves de combinación.