win7(X64)系统下cuda7.5和VS2013的配置

2022-11-01 12:56:57

&1 安装

cuda7.5文件：链接：http://pan.baidu.com/s/1bU2zIQ 密码：nvyw

&2 环境变量

注意：CUDA_PATH是安装好cuda7.5之后会默认创建的，ProgramData是隐藏目录，要修改其属性，使其可见。

CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5

CUDA_LIB_PATH = %CUDA_PATH%\lib\x64

CUDA_BIN_PATH = %CUDA_PATH%\bin

CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\x64

CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

然后，在系统的path变量之后追加下面一行：

;%CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_LIB_PATH%;%CUDA_SDK_BIN_PATH%;

&3 VS中的配置

新建一个空的项目，右边解决方案资源管理器，源文件上右键单击->添加新建项->CUDA C/C++ file

项目上右键单击->生成依赖项->生成自定义，选择CUDA7.5

项目上右键单击->属性->配置属性->VC++目录->包含目录

　　　　C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5\include
　　　　C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\common\inc

项目上右键单击->属性->配置属性->VC++目录->库目录

　　　　C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5\lib\x64
　　　　C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\common\lib\x64

项目上右键单击->属性->配置属性->链接器->常规->附加库目录

　　　　$(CUDA_PATH_V7_5)\lib\$(Platform)

项目上右键单击->属性->配置属性->链接器->输入->附加依赖项

　　　　cublas.lib
　　　　cublas_device.lib
　　　　cuda.lib
　　　　cudadevrt.lib
　　　　cudart.lib
　　　　cudart_static.lib
　　　　cufft.lib
　　　　cufftw.lib
　　　　curand.lib
　　　　cusolver.lib
　　　　cusparse.lib
　　　　nppc.lib
　　　　nppi.lib
　　　　npps.lib
　　　　nvblas.lib
　　　　nvcuvid.lib
　　　　nvrtc.lib
　　　　OpenCL.lib

　　就是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5\lib\x64目录下的库。

单击菜单栏中的生成->配置管理器

　　　　将平台改为X64

&4 测试

 // CUDA runtime 库 + CUBLAS 库

 #include "cuda_runtime.h"

 #include "cublas_v2.h"

 #include <time.h>

 #include <iostream>

 using namespace std;

 // 定义测试矩阵的维度

 int const M = ;

 int const N = ;

 int main()

 {

 // 定义状态变量

 cublasStatus_t status;

 // 在 内存 中为将要计算的矩阵开辟空间

 float *h_A = (float*)malloc(N*M*sizeof(float));

 float *h_B = (float*)malloc(N*M*sizeof(float));

 // 在 内存 中为将要存放运算结果的矩阵开辟空间

 float *h_C = (float*)malloc(M*M*sizeof(float));

 // 为待运算矩阵的元素赋予 0-10 范围内的随机数

 for (int i = ; i<N*M; i++) {

 h_A[i] = (float)(rand() %  + );

 h_B[i] = (float)(rand() %  + );

 }

 // 打印待测试的矩阵

 cout << "矩阵 A :" << endl;

 for (int i = ; i<N*M; i++){

 cout << h_A[i] << " ";

 if ((i + ) % N == ) cout << endl;

 }

 cout << endl;

 cout << "矩阵 B :" << endl;

 for (int i = ; i<N*M; i++){

 cout << h_B[i] << " ";

 if ((i + ) % M == ) cout << endl;

 }

 cout << endl;

 /*

 ** GPU 计算矩阵相乘

 */

 // 创建并初始化 CUBLAS 库对象

 cublasHandle_t handle;

 status = cublasCreate(&handle);

 if (status != CUBLAS_STATUS_SUCCESS)

 {

 if (status == CUBLAS_STATUS_NOT_INITIALIZED) {

 cout << "CUBLAS 对象实例化出错" << endl;

 }

 getchar();

 return EXIT_FAILURE;

 }

 float *d_A, *d_B, *d_C;

 // 在 显存 中为将要计算的矩阵开辟空间

 cudaMalloc(

 (void**)&d_A, // 指向开辟的空间的指针

 N*M * sizeof(float) //　需要开辟空间的字节数

 );

 cudaMalloc(

 (void**)&d_B,

 N*M * sizeof(float)

 );

 // 在 显存 中为将要存放运算结果的矩阵开辟空间

 cudaMalloc(

 (void**)&d_C,

 M*M * sizeof(float)

 );

 // 将矩阵数据传递进 显存 中已经开辟好了的空间

 cublasSetVector(

 N*M, // 要存入显存的元素个数

 sizeof(float), // 每个元素大小

 h_A, // 主机端起始地址

 , // 连续元素之间的存储间隔

 d_A, // GPU 端起始地址

  // 连续元素之间的存储间隔

 );

 cublasSetVector(

 N*M,

 sizeof(float),

 h_B,

 ,

 d_B,

 );

 // 同步函数

 cudaThreadSynchronize();

 // 传递进矩阵相乘函数中的参数，具体含义请参考函数手册。

 float a = ; float b = ;

 // 矩阵相乘。该函数必然将数组解析成列优先数组

 cublasSgemm(

 handle, // blas 库对象

 CUBLAS_OP_T, // 矩阵 A 属性参数

 CUBLAS_OP_T, // 矩阵 B 属性参数

 M, // A, C 的行数

 M, // B, C 的列数

 N, // A 的列数和 B 的行数

 &a, // 运算式的 α 值

 d_A, // A 在显存中的地址

 N, // lda

 d_B, // B 在显存中的地址

 M, // ldb

 &b, // 运算式的 β 值

 d_C, // C 在显存中的地址(结果矩阵)

 M // ldc

 );

 // 同步函数

 cudaThreadSynchronize();

 // 从 显存 中取出运算结果至 内存中去

 cublasGetVector(

 M*M, // 要取出元素的个数

 sizeof(float), // 每个元素大小

 d_C, // GPU 端起始地址

 , // 连续元素之间的存储间隔

 h_C, // 主机端起始地址

  // 连续元素之间的存储间隔

 );

 // 打印运算结果

 cout << "计算结果的转置 ( (A*B)的转置 )：" << endl;

 for (int i = ; i<M*M; i++){

 cout << h_C[i] << " ";

 if ((i + ) % M == ) cout << endl;

 }

 // 清理掉使用过的内存

 free(h_A);

 free(h_B);

 free(h_C);

 cudaFree(d_A);

 cudaFree(d_B);

 cudaFree(d_C);

 // 释放 CUBLAS 库对象

 cublasDestroy(handle);

 getchar();

 return ;

 }

cuda7.5测试

码农公寓

&1 安装

&2 环境变量

&3 VS中的配置

相关文章