CUDA 示例程序
github.com/drkennetz/cuda_examples
可以作为 CUDA C++开发的实用入门资料。具体分了几个类别:
SetupAndInitExamples - CUDA 程序开始时发生的事情(这不是安装)。
MemoryAndStructureExmaples -与如何分配内存、启动内核或编写有利于使用 CUDA 的结构代码相关的示例。这些示例将利用代码/内核样本,但其主题将更多地围绕“编写 CUDA 程序的良好方法”或“注意事项”。
KernelAndLibExamples - 内核、核心库、thrust 等。只是关于如何在 GPU 上实际加载数据和处理数据的一般示例。
ProfilingExamples - 用于分析或基准测试 CUDA 代码的示例。
PerformanceChecklist - 涵盖标准 CUDA 性能检查清单的示例。
TensorParallelFromScratch - 跟随我的博客系列( ),从零开始实现 CUDA 中的张量并行!