Pandas es una de las bibliotecas más poderosas de Python para el manejo y análisis de datos. En este artículo, te explicamos cómo usarla paso a paso, desde la instalación hasta ejemplos prácticos.
Instalación de Pandas
Para empezar, instala Pandas usando pip. Asegúrate de tener Python 3.8 o superior.
pip install pandas
Si usas un entorno virtual (recomendado):
python -m venv mi_entorno
source mi_entorno/bin/activate # En Linux/Mac
# o mi_entorno\Scripts\activate en Windows
pip install pandas
Importación y creación de DataFrames
El objeto principal de Pandas es el DataFrame, similar a una tabla de Excel.
import pandas as pd
# Crear un DataFrame desde un diccionario
data = {
'Nombre': ['Ana', 'Bob', 'Carlos'],
'Edad': [25, 30, 35],
'Ciudad': ['Madrid', 'Barcelona', 'Valencia']
}
df = pd.DataFrame(data)
print(df)
Carga de datos desde archivos
# Ejemplo con CSV
df = pd.read_csv('datos.csv')
print(df.head()) # Muestra las primeras 5 filas
Manipulación básica de datos
# Filtrar y estadísticas
mayores_30 = df[df['Edad'] > 30]
print(mayores_30)
print(df.describe())
Agrupación y agregación
Usa groupby() para operaciones por grupos.
# Suponiendo más datos con 'Salario'
df_group = df.groupby('Ciudad')['Edad'].mean()
print(df_group)
Visualización con Matplotlib
Instala pip install matplotlib para gráficos.
import matplotlib.pyplot as plt
df['Edad'].hist()
plt.title('Distribución de edades')
plt.show()
Consejos finales
¡Practica con datasets reales de Kaggle para dominar Pandas!
¿Quieres comentar?
Inicia sesión con Telegram para participar en la conversación