Introducción
El manejo de datos es una habilidad fundamental en la programación moderna. En este tutorial, exploraremos un ejemplo práctico utilizando una estructura de datos simple. Nos centraremos en un conjunto de datos que incluye productos, cantidades y precios.
Estructura de datos inicial
Comenzaremos con la siguiente estructura de datos:
data = {
'id': [1, 2, 3, 4, 5],
'producto': ['producto a', 'producto b', None, 'producto d', 'producto e'],
'cantidad': [10, 20, 30, None, 50],
'precio': [100, 200, 300, 400, None]
}
Esta estructura define cuatro claves: ‘id’, ‘producto’, ‘cantidad’ y ‘precio’. Cada una representa una lista de valores relacionados.
¿Cómo contar los valores nulos?
Ahora que ya tienes el objeto df creado correctamente, para contar los valores nulos (NaN o None) por cada columna, Pandas tiene un método muy potente llamado .isnull() (o .isna()) combinado con .sum().
import pandas as pd
data = {
'ID': [1, 2, 3, 4, 5],
'Producto': ['Producto A', 'Producto B', None, 'Producto D', 'Producto E'],
'Cantidad': [10, 20, 30, None, 50],
'Precio': [100, 200, 300, 400, None]
}
# Escribe un código en Python usando Pandas para contar los valores nulos por columnas.
df = pd.DataFrame(data)
cantidad_nulos_por_columna = df.isnull().sum()
print(df)
print("Cantidad de nulos por columna:", cantidad_nulos_por_columna)
Esta sería la respuesta del código
Cantidad de nulos por columna: ID 0 Producto 1 Cantidad 1 Precio 1 dtype: int64