Cómo usar Pandas para manipular y analizar datos en Python

python Cómo usar Pandas para manipular y analizar datos en Python

Pandas es una de las bibliotecas más poderosas de Python para el manejo y análisis de datos. En este artículo, te explicamos cómo usarla paso a paso, desde la instalación hasta ejemplos prácticos.

Instalación de Pandas

Para empezar, instala Pandas usando pip. Asegúrate de tener Python 3.8 o superior.

pip install pandas

Si usas un entorno virtual (recomendado):

python -m venv mi_entorno
source mi_entorno/bin/activate  # En Linux/Mac
# o mi_entorno\Scripts\activate en Windows
pip install pandas

Importación y creación de DataFrames

El objeto principal de Pandas es el DataFrame, similar a una tabla de Excel.

import pandas as pd

# Crear un DataFrame desde un diccionario
data = {
    'Nombre': ['Ana', 'Bob', 'Carlos'],
    'Edad': [25, 30, 35],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia']
}
df = pd.DataFrame(data)
print(df)

Carga de datos desde archivos


# Ejemplo con CSV
df = pd.read_csv('datos.csv')
print(df.head())  # Muestra las primeras 5 filas

Manipulación básica de datos


# Filtrar y estadísticas
mayores_30 = df[df['Edad'] > 30]
print(mayores_30)
print(df.describe())

Agrupación y agregación

Usa groupby() para operaciones por grupos.

# Suponiendo más datos con 'Salario'
df_group = df.groupby('Ciudad')['Edad'].mean()
print(df_group)

Visualización con Matplotlib

Instala pip install matplotlib para gráficos.

import matplotlib.pyplot as plt

df['Edad'].hist()
plt.title('Distribución de edades')
plt.show()

Consejos finales


¡Practica con datasets reales de Kaggle para dominar Pandas!

Comentarios
¿Quieres comentar?

Inicia sesión con Telegram para participar en la conversación


Comentarios (0)

Aún no hay comentarios. ¡Sé el primero en comentar!

Iniciar Sesión