NVIDIA CUDA 4.0 и CUDA-GDB

Состоялся релиз NVIDIA CUDA 4.0. Также можно отметить релиз CUDA-GDB. Далее - текст из официальной русскоязычной новости.

Набор инструментов NVIDIA CUDA 4.0 был создан, чтобы упростить параллельное программирование и позволить еще более широкому кругу разработчиков портировать свои приложения на GPU. Основные возможности новой архитектуры:

  • Технология NVIDIA GPUDirect™ 2.0 обеспечивает равноправную связь между GPU в рамках одного сервера или рабочей станции, что упрощает и ускоряет мультипроцессорное программирование и работу приложений.
  • Унифицированная виртуальная адресация (UVA) организует единое адресное пространство для основной системной памяти и памяти GPU, что делает параллельное программирование еще быстрее и проще.
  • Библиотеки примитивов Thrust C++ - набор алгоритмов C++ с открытым кодом для параллельных расчетов и структур данных, которые упрощают программирование для разработчиков на C++. Thrust ускоряет стандартные операции, такие как параллельное хранение, в 5-100 раз по сравнению с библиотеками Standard Template Library (STL) и Threading Building Blocks (TBB).

Другие функции и возможности:

  • MPI интеграция с приложениями CUDA – Модификация MPI, такая как OpenMPI, автоматически пересылает данные из и в память GPU по Infiniband, когда приложение посылает или получает запрос с MPI.
  • Многопоточность и GPU – Многочисленные потоки с CPU хоста могут обмениваться контекстом на одном GPU, что упрощает совместное использование GPU многопоточными приложениями.
  • Использование нескольких GPU одним потоком с CPU – Один поток с CPU хоста может иметь доступ ко всем GPU в системе. Разработчики могут легко распределить работу между несколькими GPU для таких задач, как обмен «ореолами» в приложениях.
  • Новая библиотека NPP для обработки изображений и компьютерного видения – Большой набор операций по трансформации изображения, которые позволяют быстро разрабатывать приложения обработки изображений и компьютерного зрения.

Новые и улучшенные возможности:

  • Автоматический анализ производительности в Visual Profiler
  • Новые функции в cuda-gdb и поддержка MacOS
  • Поддержка функций C++, таких как новый/удалить и виртуальные функции
  • Новый бинарный дизассемлер на GPU

Подробности о новых возможностях можно узнать на странице с русскоязычной новостью. В ней не сказано о том, что состоялся релиз, потому что в тот день существовал ещё только кандидат в релизы. Англоязычная новость, в свою очередь, объявляет релиз, гораздо короче (просто список терминов без разъяснений) и подробнее.

>>> Русскоязычная новость

©  Linux.org.ru