دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: 1
نویسندگان: Thomas Herault. Yves Robert (eds.)
سری: Computer Communications and Networks
ISBN (شابک) : 9783319209425, 9783319209432
ناشر: Springer International Publishing
سال نشر: 2015
تعداد صفحات: 325
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 9 مگابایت
کلمات کلیدی مربوط به کتاب تکنیک های خطای تحمل برای محاسبات با کارایی بالا: عملکرد و ارزیابی سیستم، عملکرد و قابلیت اطمینان، محاسبات عددی
در صورت تبدیل فایل کتاب Fault-Tolerance Techniques for High-Performance Computing به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب تکنیک های خطای تحمل برای محاسبات با کارایی بالا نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
این متن به موقع یک مرور کلی از تکنیک های تحمل خطا برای محاسبات با کارایی بالا (HPC) ارائه می دهد. متن با مقدمهای مفصل بر مفاهیم پروتکلهای ایست بازرسی و الگوریتمهای زمانبندی، پیشبینی، تکرار، تشخیص و تصحیح خطای خاموش، همراه با برخی تکنیکهای خاص برنامه مانند ABFT باز میشود. تاکید بر مدل های عملکرد تحلیلی است. سپس مروری بر تکنیکهای همهمنظوره، از جمله چندین پروتکل بازیابی و پست بازرسی انجام میشود. سناریوهای اجرایی مربوطه نیز از طریق مدلهای کمی ارزیابی و مقایسه میشوند. ویژگی ها: بررسی روش های تاب آوری و مدل های عملکرد را ارائه می دهد. منابع مختلف خطاها و خطاها را در سیستمهای مقیاس بزرگ بررسی میکند. طیف تکنیک هایی را که می توان برای طراحی یک MPI مقاوم در برابر خطا به کار برد، بررسی می کند. رویکردهای مختلف برای تکرار را بررسی می کند. چالش مصرف انرژی روشهای تحمل خطا در سیستمهای در مقیاس شدید را مورد بحث قرار میدهد.
This timely text presents a comprehensive overview of fault tolerance techniques for high-performance computing (HPC). The text opens with a detailed introduction to the concepts of checkpoint protocols and scheduling algorithms, prediction, replication, silent error detection and correction, together with some application-specific techniques such as ABFT. Emphasis is placed on analytical performance models. This is then followed by a review of general-purpose techniques, including several checkpoint and rollback recovery protocols. Relevant execution scenarios are also evaluated and compared through quantitative models. Features: provides a survey of resilience methods and performance models; examines the various sources for errors and faults in large-scale systems; reviews the spectrum of techniques that can be applied to design a fault-tolerant MPI; investigates different approaches to replication; discusses the challenge of energy consumption of fault-tolerance methods in extreme-scale systems.
Front Matter....Pages i-ix
Front Matter....Pages 1-1
Fault Tolerance Techniques for High-Performance Computing....Pages 3-85
Front Matter....Pages 87-87
Errors and Faults....Pages 89-144
Fault-Tolerant MPI....Pages 145-228
Using Replication for Resilience on Exascale Systems....Pages 229-278
Energy-Aware Checkpointing Strategies....Pages 279-317
Back Matter....Pages 319-320