دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: نویسندگان: Боресков А.В., Харламов А.А. سری: ISBN (شابک) : 9785940745785 ناشر: ДМК-Пресс سال نشر: 2010 تعداد صفحات: 232 [234] زبان: Russian فرمت فایل : DJVU (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 6 Mb
در صورت تبدیل فایل کتاب Основы работы с технологией CUDA به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب اصول کار با فناوری CUDA نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
Глава 1. Существующие многоядерные системы. Эволюция GPU. GPGPU 1.1. Многоядерные системы 1.1.1. Intel Core 2 Duo и Intel Core i7 1.1.2. Архитектура SMP 1.1.3. BlueGene/L 1.1.4. Архитектура GPU 1.2. Эволюция GPU Глава 2. Модель программирования в CUDA. Программно-аппаратный стек CUDA 2.1. Основные понятия 2.2. Расширения языка C 2.2.1. Спецификаторы функций и переменных 2.2.2. Добавленные типы 2.2.3. Добавленные переменные 2.2.4. Директива вызова ядра 2.2.5. Добавленные функции 2.3. Основы CUDA host API 2.3.1. CUDA driver API 2.3.2. CUDA runtime API 2.3.3. Основы работы с CUDA runtime API 2.3.4. Получение информации об имеющихся GPU и их возможностях 2.4. Установка CUDA на компьютер 2.5. Компиляция программ на CUDA 2.6. Замеры времени на GPU CUDA events 2.7. Атомарные операции в CUDA 2.7.1. Атомарные арифметические операции 2.7.2. Атомарные побитовые операции 2.7.3. Проверка статуса нитей warp’а Глава 3. Иерархия памяти в CUDA. Работа с глобальной памятью 3.1. Типы памяти в CUDA 3.2. Работа с константной памятью 3.3. Работа с глобальной памятью 3.3.1. Пример: построение таблицы значений функции с заданным шагом 3.3.2. Пример: транспонирование матрицы 3.3.3. Пример: перемножение двух матриц 3.4. Оптимизация работы с глобальной памятью 3.4.1. Задача об N;телах Глава 4. Разделяемая память в CUDA и ее эффективное использование 4.1. Работа с разделяемой памятью 4.1.1. Оптимизация задачи об N телах 4.1.2. Пример: перемножение матриц 4.2. Паттерны доступа к разделяемой памяти 4.2.1. Пример: умножение матрицы на транспонированную Глава 5. Реализация на CUDA базовых операций над массивами – reduce scan построения гистограмм и сортировки 5.1. Параллельная редукция 5.2. Нахождение префиксной суммы (scan) 5.2.1. Реализация нахождения префиксной суммы на CUDA 5.2.2. Использование библиотеки CUDPP для нахождения префиксной суммы 5.3. Построение гистограммы 5.4. Сортировка 5.4.1. Битоническая сортировка 5.4.2. Поразрядная сортировка 5.4.3. Использование библиотеки CUDPP Глава 6. Архитектура GPU основы PTX 6.1. Архитектура GPU Tesla 8 и Tesla 10 6.2. Введение в PTX 6.2.1. Типы данных 6.2.2. Переменные 6.2.3. Основные команды Глава 7. Иерархия памяти в CUDA. Работа с текстурной памятью 7.1. Текстурная память в CUDA 7.2. Обработка цифровых сигналов 7.2.1. Простые преобразования цвета 7.2.2. Фильтрация. Свертка 7.2.3. Обнаружение границ 7.2.4. Масштабирование изображений Глава 8. Взаимодействие с OpenGL 8.1. Cоздание буферного объекта в OpenGL 8.2. Использование классов 8.3. Пример шума Перлина 8.3.1. Применение Глава 9. Оптимизации 9.1. PTX;ассемблер 9.1.1. Занятость мультипроцессора 9.1.2. Анализ PTX;ассемблера 9.2. Использование CUDA;профайлера Приложение 1. Искусственные нейронные сети П1.1. Введение П1.1.1. Задачи классификации (Classification) П1.1.2. Задачи кластеризации (Clustering) П1.1.3. Задачи регрессии и прогнозирования П1.2. Модель нейрона П1.3. Архитектуры нейронных сетей П1.4. Многослойный персептрон П1.4.1. Работа с многослойным персептроном П1.4.2. Алгоритм обратного распространения ошибки П1.4.3. Предобработка данных П1.4.4. Адекватность данных П1.4.5. Разбиение на наборы П1.4.6. Порядок действий при работе с многослойным персептроном П1.5. Персептроны и CUDA П1.5.1. Пример задачи реального мира П1.6. Литература Приложение 2. Моделирование распространения волн цунами на GPU П2.1. Введение П2.2. Математическая постановка задачи П2.3. Программная модель П2.4. Адаптация алгоритма под GPU П2.5. Заключение П2.6. Литература Приложение 3. Применение технологии NVIDIA CUDA для решения задач гидродинамики П3.1. Введение П3.2. Сеточные методы П3.2.1. Геометрический многосеточный метод П3.2.2. Алгебраический многосеточный метод П3.2.3. Метод редукции П3.2.4. Оценка эффективности П3.3. Метод частиц П3.4. Статистическая обработка результатов П3.5. Обсуждение П3.6. Литература Приложение 4. Использование технологии CUDA при моделировании динамики пучков в ускорителях заряженных частиц П4.1. Введение П4.2. Особенности задачи П4.3. Использование многоядерных процессоров П4.4. Реализация на графических процессорах П4.5. Результаты П4.6. Литература Приложение 5. Трассировка лучей П5.1. Обратная трассировка лучей П5.1.1. Поиск пересечений П5.1.2. Проблемы трассировки лучей на GPU П5.1.3. Ускорение поиска пересечений П5.2. Оптимизация трассировки лучей для GPU П5.2.1. Экономия регистров П5.2.2. Удаление динамической индексации П5.3. Литература