Cómo usar Pandas para manipular y analizar datos en Python

Pandas es una de las bibliotecas más poderosas de Python para el manejo y análisis de datos. En este artículo, te explicamos cómo usarla paso a paso, desde la instalación hasta ejemplos prácticos.

Instalación de Pandas

Para empezar, instala Pandas usando pip. Asegúrate de tener Python 3.8 o superior.

pip install pandas

Si usas un entorno virtual (recomendado):

python -m venv mi_entorno
source mi_entorno/bin/activate  # En Linux/Mac
# o mi_entorno\Scripts\activate en Windows
pip install pandas

Importación y creación de DataFrames

El objeto principal de Pandas es el DataFrame, similar a una tabla de Excel.

import pandas as pd

# Crear un DataFrame desde un diccionario
data = {
    'Nombre': ['Ana', 'Bob', 'Carlos'],
    'Edad': [25, 30, 35],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia']
}
df = pd.DataFrame(data)
print(df)

Carga de datos desde archivos

# Ejemplo con CSV
df = pd.read_csv('datos.csv')
print(df.head())  # Muestra las primeras 5 filas

Manipulación básica de datos

# Filtrar y estadísticas
mayores_30 = df[df['Edad'] > 30]
print(mayores_30)
print(df.describe())

Agrupación y agregación

Usa groupby() para operaciones por grupos.

# Suponiendo más datos con 'Salario'
df_group = df.groupby('Ciudad')['Edad'].mean()
print(df_group)

Visualización con Matplotlib

Instala pip install matplotlib para gráficos.

import matplotlib.pyplot as plt

df['Edad'].hist()
plt.title('Distribución de edades')
plt.show()

Consejos finales

¡Practica con datasets reales de Kaggle para dominar Pandas!

Cómo usar Pandas para manipular y analizar datos en Python

Instalación de Pandas

Importación y creación de DataFrames

Carga de datos desde archivos

Manipulación básica de datos

Agrupación y agregación

Visualización con Matplotlib

Consejos finales

Comentarios

¿Quieres comentar?

Comentarios (0)

Más en python

Todas las Categorías