Interaktive Analyse von VRAM-Bedarf, Inferenz-Durchsatz und Total-Cost-of-Ownership zwischen Unified-Memory-Systemen und klassischen GPU-Workstations. Modellgewichte mit katalogisierter Quantisierung + TurboQuant KV-Cache.