NVIDIA 开发者社区
免费培训课程

CUDA 基础---矩阵乘法以及共享内存

课程介绍:

CUDA编程方法是目前广泛使用的并行化程序编程方法。在深度学习,计算机视觉,生物医疗,环境科学,气象预报,石油勘探等领域具有大量的使用场景。通过这堂课,您将学会:

  • 利用CUDA编程模型实现矩阵乘法
  • 共享内存基础
  • 利用共享内存加速矩阵乘法

受众目标:针对GPU平台程序有开发需求的开发者

时长:1小时

CUDA 优化---共享内存以及常量内存

课程介绍:

本次课程将深入的介绍如何利用共享内存和常量内存来加速GPU程序,通过本次课程,您将学会:

  • 深层次的共享内存的知识
  • 常量内存的概念
  • 利用常量内存和共享内存加速GPU程序

受众目标:针对有GPU平台开发需求的开发者

时长:1小时

CUDA 优化---多流执行

活动日期:2019年7月9日,晚8点-9点半

课程介绍:

多流执行是CUDA编程模型中的重要加速手段,本次课程将深入的介绍如何利用多流执行来加速GPU程序,通过本次课程,您将学会:

  • GPU流的基本概念
  • 多流执行的应用
  • GPU程序的性能分析

受众目标:针对有GPU平台开发需求的开发者

时长:1小时

CUDA 优化---cuBLAS 的使用

活动日期:2019年7月30日,晚8点-9点半

课程介绍:

NVIDIA cuBLAS库是标准基本线性代数子程序( Basic Linear Algebra Subroutines)的GPU加速库. 使用cuBLAS API,您可以通过将密集型计算部署到单个GPU来加速应用程序,或者有效地扩展和分配到多GPU配置的服务器上,通过本次课程,您将学到:

  • cuBLAS基础介绍
  • cuBLAS的应用
  • cuBLAS的实例展示

受众目标:针对有GPU平台开发需求的开发者

时长:1小时

CUDA 并行计算编程基础

课程介绍:CUDA编程方法是目前广泛使用的并行化程序编程方法。在深度学习,计算机视觉,生物医疗,环境科学,气象预报,石油勘探等领域具有大量的使用场景。通过这堂课,您将学会:

  • GPU基本架构
  • CUDA编程模型---包括CUDA的线程层次,如何更加高效的调用线程来执行程序命令
  • CUDA访存处理---包括多种存储类型的调用,以及如何利用不同类型的存储加速CUDA程序
  • CUDA多流执行---包括创建多流执行的CUDA程序,以及利用多流执行加速CUDA程序的方法

在本次课程中,还会以实际程序为例子,详细展示如何在实际应用中利用GPU加速我们的应用程序

目标受众:针对有GPU平台程序开发需求的开发人员

时长:1小时

使用 NVIDIA 免费工具 TensorRT 加速推理实践 - YOLO 目标检测

课程介绍:

此课程将会介绍如何利用 TensorRT 加速 YOLO 目标检测,课程将会着重介绍编程方法。本次课程还会涉及到 TensorRT 中数据类型,流处理,多精度推理等细节的展示:

  • TensorRT 简介
  • TensorRT 优化 YOLO 的实战编程
  • TensorRT 实例展示

目标受众:对于 TensorRT 有一定基础的开发人员

时长:1个小时

利用 NVIDIA 开源免费工具 DIGITS 实现生成对抗网络(GAN)

课程介绍:

此课程将协助用户开发出定制免编程 GAN 训练工具,会详细介绍如何利用NVIDIA 免费开源工具 DIGITS 实现对抗生成网络(GAN)的训练,如何安装自定义组建,如何测试训练效果等内容:

  • NVIDIA DIGITS 简介
  • 数据集的处理
  • DIGITS 组件的安装
  • GAN 的调试
  • 测试

目标受众:针对有图像处理和机器视觉知识背景的开发者

时长:1个小时

人工智能课程:使用 TensorRT 加速推理结果计算 ,配合 Deepstream

课程介绍:

此课程将会介绍 TensorRT 的基本信息,包括:

  • TensorRT 的性能特点
  • TensorRT 的优化原理
  • TensorRT 的开发方法细节
  • TensorRT 和 TensorFlow 的集成开发方法
  • Deepstream 的性能特点以及开发使用

目标受众: 针对有模型训练知识背景的技术人员

时长:1小时

GPU人工智能服务器的搭建

课程介绍:

在这门课中,您将学会如何从头开始配置一台GPU AI 服务器,我们会结合硬件系统和软件系统介绍完整的解决方案。内容包括:

  • 硬件平台系统的搭建
  • GPU 的性能特点
  • 当前已经成熟的解决方案
  • 软件系统的安装配置
  • CUDA,cuDNN 以及 NVIDIA DeepLearning SDK 的介绍

完成上述实验,您可以自己根据不同的需求,配置一台包含软件和硬件的成熟系统。

目标受众: 针对有GPU平台程序开发需求的技术人员

时长:1小时

NVIDIA 交互式 GPU 训练平台: DIGITS - 开源免费的深度学习管理工具

课程介绍:

  • DIGITS 诞生背景及功能简介
  • DIGITS 的训练数据集导入
  • DIGITS 的基本模型训练操作:图片分类
  • DIGITS 用于目标检测
  • DIGITS 用于图像分割
  • DIGITS 迁移学习的使用
  • DIGITS Plugin 的使用

目标受众: 针对有图像处理和机器视觉知识背景的人员

时长:1.5小时

Style-Gan 的架构与实现

课程介绍:

A Style-Based Generator Architecture for Generative Adversarial Networks 是NVIDIA在2018年发布的一个新的生成对抗网络方法。StyleGAN是一步一步地生成人工的图像,从非常低的分辨率开始,一直到高分辨率(1024×1024)。通过分别地修改网络中每个级别的输入,它可以控制在该级别中所表示的视觉特征,从粗糙的特征(姿势、面部形状)到精细的细节(头发颜色),而不会影响其它的级别。此课程将会介绍 Style-Gan 的基本框架和原理,并具体介绍模型的训练,以及训练好模型的应用,包括:

  • StyleGan 介绍、架构特点,以及与传统的 Gan 之间的区别
  • StyleGan 效果和应用
  • StyleGan 模型训练以及实际代码中,利用 StyleGan 模型生成图片

目标受众:针对有模型训练知识背景的技术人员

时长:1小时

课程咨询及开课时间请微信添加社区小助手了解

qr-developer

NVIDIA 深度学习学院

深度学习和加速计算应用开发培训
全配置云端GPU实验资源