LIBRISTO
LIBROAMANTO
задължително
Станете част от общност от любители на книгите от цял свят и получавате много предимства. Създай на безплатен акаунт
0
Безплатна доставка със Еконт над 69.99 €
Куриер Speedy 3.49 Пункт на Speedy 3.49 ЕКОНТ 3.99 Еконтомат/Офис на Еконт 3.99 Ekont Box 3.99 Sameday 3.99 Sameday box 3.99 Box Now 3.99

Над 4 милиона заглавия на английски и други езици! Открийте новата си история още днес! Безплатна доставка за поръчки над 69.99€

HPC Observability

Production Monitoring, Profiling, and Site Reliability for Linux Clusters, GPUs, and Parallel Storage at Scale

Език Английски езикАнглийски език
Книга С меки корици
Книга HPC Observability M. Edwards
Код Либристо: 52747456
Издателство Independently published, май 2026
HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance... Цялото описание
? points 52 b Нови Нови
21.43
41.92  лв
Очаква се зареждане Издание 02. 06. 2026

30 дни за връщане на стоката

HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance computing systems running reliably at scale. It brings together the operational knowledge scattered across vendor documentation, conference papers, and forum threads into a practical framework for turning HPC telemetry into actionable insight.

Modern HPC environments - Slurm clusters, GPU-dense AI systems, Lustre and GPFS storage, InfiniBand and Slingshot fabrics - generate more data than any team can manually interpret. The result is wasted node-hours, failed simulations, hidden storage bottlenecks, fabric congestion, and GPU failures that surface only after days of runtime.

This book provides a complete operational approach to HPC observability through a five-layer model covering hardware, operating systems, schedulers, applications, storage, and networks. Readers learn how to build metrics pipelines for clusters from hundreds to tens of thousands of nodes; monitor GPUs with DCGM; profile MPI and OpenMP applications with PAPI and Score-P; diagnose storage and network slowdowns; create useful dashboards and alerts; and run effective incident response and post-mortems.

Drawing on peer-reviewed research and real production experience, the book includes original diagrams, practical workflows, reference material, Prometheus alert examples, and a step-by-step lab environment for learning on a laptop.

Written in the voice of a senior HPC engineer rather than an academic text, HPC Observability assumes readers already understand the fundamentals and focuses instead on the operational realities of running large-scale Linux, AI, and research-computing infrastructure.

Героиня & Полиглот
EWA KASP за
Пусни видеото
Ewa Kasp
В Libristo има най-богатия избор от чуждоезична литература. Затова купувам книгите си тук.

Информация за книгата

Пълно заглавие HPC Observability
Автор M. Edwards
Език Английски език
Корици Книга - С меки корици
Дата на издаване 2026
Брой страници 164
Баркод 9798198765443
Код Либристо 52747456
Издателство Independently published
Тегло 397
Размери 216 x 280 x 9
Подарете тази книга днес
Лесно е
1 Добавете книгата в количката си и изберете Доставка като подарък 2 В замяна ще ви изпратим ваучер 3 Книгата ще пристигне на адреса на получателя

Вход

Влезте в акаунта си. Още нямате акаунт за Libristo? Създайте го сега!

 
задължително
задължително

Нямате акаунт? Използвайте предимствата на акаунта за Libristo!

Благодарение на акаунта за Libristo държите всичко под контрол.

Създаване на акаунт за Libristo
Книжен съветник Libroamiko
Здравейте, аз съм Libroamiko, мога ли да помогна?