Estructuras de datos intrusivas y punteros dobles en C

Tabla de contenido

Cuando diseñas estructuras de datos en C, el mayor reto no es la lógica de los algoritmos, sino la gestión de la memoria y la abstracción de los punteros. Para implementar listas o árboles de forma profesional, necesitas dominar dos técnicas fundamentales: el uso de punteros dobles (**) para manipular la cadena de enlaces sin lógica condicional redundante, y las listas intrusivas, un patrón de diseño donde el nodo de la lista no es un contenedor de datos, sino un miembro dentro de la estructura de datos misma.

El uso de punteros dobles permite tratar de forma uniforme cualquier dirección de un puntero. Si quieres modificar un puntero en una función, no puedes pasarle el puntero por valor; debes pasarle su dirección. Esto es crítico al insertar o eliminar elementos: en lugar de preguntar constantemente si estamos modificando el head de la lista o el campo next de un nodo intermedio, operamos directamente sobre la dirección de memoria que contiene el enlace. Esto simplifica enormemente el código y reduce los saltos condicionales.

Por otro lado, las listas intrusivas (muy utilizadas en el kernel de Linux) invierten la jerarquía tradicional. En una lista estándar, el nodo contiene el dato; en una intrusiva, el dato contiene el nodo. Esto ofrece ventajas de rendimiento masivas: mejora la localidad de caché al mantener el nodo y el dato contiguos en memoria y permite que un mismo objeto sea parte de múltiples listas simultáneamente sin realizar asignaciones adicionales de memoria por cada nodo. Para recuperar el puntero a la estructura original desde un puntero al nodo, utilizamos una técnica de aritmética de punteros basada en la macro offsetof [definida en stddef.h].

El mayor peligro surge cuando intentamos manipular la memoria de forma manual. Si calculas mal el desplazamiento (offset) o si intentas liberar la memoria de un nodo en lugar de la estructura contenedora en una lista intrusiva, corromperás el heap o provocarás un fallo de segmentación.

#include <stdio.h>
#include <stdlib.h>
#include <stddef.h>

/* Macro fundamental para listas intrusivas:
   Calcula la dirección del inicio de la estructura padre 
   dada la dirección de uno de sus miembros. */
#define container_of(ptr, type, member) \
	((type *)((char *)(ptr) - offsetof(type, member)))

/* Representación del nodo de la lista (doblemente enlazada) */
struct list_head {
	struct list_head *next;
	struct list_head *prev;
};

/* Estructura de datos de usuario que "contiene" la lista */
typedef struct {
	int id;
	char nombre[32];
	struct list_head list; /* El nodo está embebido aquí */
} usuario_t;

/* Inicialización de la lista raíz */
void list_init(struct list_head *head) {
	head->next = head;
	head->prev = head;
}

/* Inserción al final (O(1) si tenemos el head) */
void list_add_tail(struct list_head *new, struct list_head *head) {
	struct list_head *prev = head->prev;
	new->next = head;
	new->prev = prev;
	prev->next = new;
	head->prev = new;
}

/* Eliminación de un nodo */
void list_del(struct list_head *entry) {
	entry->next->prev = entry->prev;
	entry->prev->next = entry->next;
}

int main(void) {
	struct list_head cabecera;
	list_init(&cabecera);

	/* Ejemplo de asignación y uso */
	for (int i = 0; i < 3; i++) {
		usuario_t *u = malloc(sizeof(usuario_t));
		if (!u) return EXIT_FAILURE;

		u->id = i;
		snprintf(u->nombre, sizeof(u->nombre), "Usuario %d", i);

		/* Insertamos el miembro 'list' dentro de la estructura 'u' */
		list_add_tail(&u->list, &cabecera);
	}

	/* Iteración sobre la lista intrusiva */
	struct list_head *curr;
	printf("Lista de usuarios:\n");
	for (curr = cabecera.next; curr != &cabecera; curr = curr->next) {
		/* La magia: recuperamos el puntero al usuario original */
		usuario_t *u = container_of(curr, usuario_t, list);
		printf("ID: %d | Nombre: %s\n", u->id, u->nombre);
	}

	/* Limpieza de memoria: recorremos y liberamos la estructura padre */
	curr = cabecera.next;
	while (curr != &cabecera) {
		struct list_head *siguiente = curr->next;
		usuario_t *u = container_of(curr, usuario_t, list);
		list_del(curr);
		free(u); // Liberamos el objeto completo, no solo el nodo
		curr = siguiente;
	}

	return EXIT_SUCCESS;
}

Análisis detallado

En el ejemplo anterior, la macro container_of es el núcleo de la abstracción. Cuando iteramos con curr, el puntero apunta a un miembro de tipo struct list_head, pero nosotros necesitamos acceder a u->id. La macro toma la dirección de curr, le resta el offsetof (la distancia en bytes desde el inicio de usuario_t hasta el campo list) y nos devuelve la dirección base de la estructura completa.

La función list_add_tail utiliza los punteros next y prev para reajustar los enlaces. Al usar una lista doblemente enlazada con una cabecera dummy (la cabecera inicializada en el main), evitamos tener que manejar casos especiales como “lista vacía” o “insertar en la cabeza”, ya que la cabecera siempre actúa como un nodo centinela válido.

En cuanto a la gestión de memoria, nota que la función free(u) es crucial. Como hemos diseñado una lista intrusiva, curr es una dirección dentro del bloque de memoria asignado a u. Si intentáramos free(curr), estaríamos liberando solo una parte del bloque (el offset donde reside la lista), lo que provocaría una corrupción inmediata del heap.

El error frecuente

Un error clásico al trabajar con listas intrusivas es intentar liberar el nodo directamente durante la iteración o después de haber roto los enlaces de la lista.

/* ERROR CRÍTICO */
for (curr = cabecera.next; curr != &cabecera; curr = curr->next) {
    usuario_t *u = container_of(curr, usuario_t, list);
    list_del(curr);
    free(curr); // ERROR: curr es una dirección intermedia, no el inicio del bloque
}

Este error es sutil porque el compilador no te lo advertirá, pero free() requiere la dirección exacta devuelta por malloc. Al pasarle un puntero desplazado, el gestor de memoria (glibc o similar) no encontrará los metadatos de control del bloque y el programa terminará con un SIGABRT (detectable con AddressSanitizer). Siempre debes recuperar el puntero base con container_of antes de llamar a free.

N° 129

Análisis detallado

El error frecuente

Entradas relacionadas

Dejar un comentario Cancelar respuesta