使用Python写CUDA程序的方法


Posted in Python onMarch 27, 2017

使用Python写CUDA程序有两种方式:

* Numba
* PyCUDA

numbapro现在已经不推荐使用了,功能被拆分并分别被集成到accelerate和Numba了。

例子

numba

Numba通过及时编译机制(JIT)优化Python代码,Numba可以针对本机的硬件环境进行优化,同时支持CPU和GPU的优化,并且可以和Numpy集成,使Python代码可以在GPU上运行,只需在函数上方加上相关的指令标记,

如下所示:

import numpy as np 
from timeit import default_timer as timer
from numba import vectorize

@vectorize(["float32(float32, float32)"], target='cuda')
def vectorAdd(a, b):
  return a + b

def main():
  N = 320000000

  A = np.ones(N, dtype=np.float32 )
  B = np.ones(N, dtype=np.float32 )
  C = np.zeros(N, dtype=np.float32 )

  start = timer()
  C = vectorAdd(A, B)
  vectorAdd_time = timer() - start

  print("c[:5] = " + str(C[:5]))
  print("c[-5:] = " + str(C[-5:]))

  print("vectorAdd took %f seconds " % vectorAdd_time)

if __name__ == '__main__':
  main()

PyCUDA

PyCUDA的内核函数(kernel)其实就是使用C/C++编写的,通过动态编译为GPU微码,Python代码与GPU代码进行交互,如下所示:

import pycuda.autoinit
import pycuda.driver as drv
import numpy as np
from timeit import default_timer as timer

from pycuda.compiler import SourceModule
mod = SourceModule("""
__global__ void func(float *a, float *b, size_t N)
{
 const int i = blockIdx.x * blockDim.x + threadIdx.x;
 if (i >= N)
 {
  return;
 }
 float temp_a = a[i];
 float temp_b = b[i];
 a[i] = (temp_a * 10 + 2 ) * ((temp_b + 2) * 10 - 5 ) * 5;
 // a[i] = a[i] + b[i];
}
""")

func = mod.get_function("func")  

def test(N):
  # N = 1024 * 1024 * 90  # float: 4M = 1024 * 1024

  print("N = %d" % N)

  N = np.int32(N)

  a = np.random.randn(N).astype(np.float32)
  b = np.random.randn(N).astype(np.float32)  
  # copy a to aa
  aa = np.empty_like(a)
  aa[:] = a
  # GPU run
  nTheads = 256
  nBlocks = int( ( N + nTheads - 1 ) / nTheads )
  start = timer()
  func(
      drv.InOut(a), drv.In(b), N,
      block=( nTheads, 1, 1 ), grid=( nBlocks, 1 ) )
  run_time = timer() - start 
  print("gpu run time %f seconds " % run_time)  
  # cpu run
  start = timer()
  aa = (aa * 10 + 2 ) * ((b + 2) * 10 - 5 ) * 5
  run_time = timer() - start 

  print("cpu run time %f seconds " % run_time) 

  # check result
  r = a - aa
  print( min(r), max(r) )

def main():
 for n in range(1, 10):
  N = 1024 * 1024 * (n * 10)
  print("------------%d---------------" % n)
  test(N)

if __name__ == '__main__':
  main()

对比

numba使用一些指令标记某些函数进行加速(也可以使用Python编写内核函数),这一点类似于OpenACC,而PyCUDA需要自己写kernel,在运行时进行编译,底层是基于C/C++实现的。通过测试,这两种方式的加速比基本差不多。但是,numba更像是一个黑盒,不知道内部到底做了什么,而PyCUDA就显得很直观。因此,这两种方式具有不同的应用:

* 如果只是为了加速自己的算法而不关心CUDA编程,那么直接使用numba会更好。

* 如果为了学习、研究CUDA编程或者实验某一个算法在CUDA下的可行性,那么使用PyCUDA。

* 如果写的程序将来要移植到C/C++,那么就一定要使用PyCUDA了,因为使用PyCUDA写的kernel本身就是用CUDA C/C++写的。

以上这篇使用Python写CUDA程序的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python的Django框架下使用django-tagging的教程
May 30 Python
使用pandas read_table读取csv文件的方法
Jul 04 Python
Python绘制KS曲线的实现方法
Aug 13 Python
解决pycharm运行出错,代码正确结果不显示的问题
Nov 30 Python
Django实现一对多表模型的跨表查询方法
Dec 18 Python
Python Web版语音合成实例详解
Jul 16 Python
python super函数使用方法详解
Feb 14 Python
windows下的pycharm安装及其设置中文菜单
Apr 23 Python
通过实例了解Python异常处理机制底层实现
Jul 23 Python
关于django python manage.py startapp 应用名出错异常原因解析
Dec 15 Python
Python基本数据类型之字符串str
Jul 21 Python
Python 阶乘详解
Oct 05 Python
pyenv命令管理多个Python版本
Mar 26 #Python
Django实现自定义404,500页面教程
Mar 26 #Python
Python 多线程实例详解
Mar 25 #Python
解决python3 urllib中urlopen报错的问题
Mar 25 #Python
Python制作Windows系统服务
Mar 25 #Python
Python 类的继承实例详解
Mar 25 #Python
python利用拉链法实现字典方法示例
Mar 25 #Python
You might like
thinkphp3.2.0 setInc方法 源码全面解析
2018/01/29 PHP
PHP设计模式之适配器模式原理与用法分析
2018/04/25 PHP
php如何比较两个浮点数是否相等详解
2019/02/12 PHP
Windows上php5.6操作mongodb数据库示例【配置、连接、获取实例】
2019/02/13 PHP
phpStorm+XDebug+chrome 配置详解
2019/04/01 PHP
laravel csrf排除路由,禁止,关闭指定路由的例子
2019/10/21 PHP
实例解析jQuery工具函数
2016/12/01 Javascript
jQuery学习笔记之入门
2016/12/14 Javascript
js addDqmForPP给标签内属性值加上双引号的函数
2016/12/24 Javascript
微信小程序开发之相册选择和拍照详解及实例代码
2017/02/22 Javascript
纯JS实现弹性导航条效果
2017/03/06 Javascript
JavaScript定义函数_动力节点Java学院整理
2017/06/27 Javascript
详解从买域名到使用pm2部署node.js项目全过程
2018/03/07 Javascript
ES6基础之数组和对象的拓展实例详解
2019/08/22 Javascript
Emberjs 通过 axios 下载文件的方法
2019/09/03 Javascript
微信小程序登录时如何获取input框中的内容
2019/12/04 Javascript
javascript异常处理实现原理详解
2020/02/17 Javascript
JS Html转义和反转义(html编码和解码)的实现与使用方法总结
2020/03/10 Javascript
python结合shell查询google关键词排名的实现代码
2016/02/27 Python
python中判断文件编码的chardet(实例讲解)
2017/12/21 Python
对python创建及引用动态变量名的示例讲解
2018/11/10 Python
Pytorch模型转onnx模型实例
2020/01/15 Python
tensorflow 实现数据类型转换
2020/02/17 Python
快速创建python 虚拟环境
2020/11/28 Python
美国最大的团购网站:Groupon
2016/07/23 全球购物
英国最大的在线运动补充剂商店:Discount Supplements
2017/06/03 全球购物
英国DIY汽车维修配件网站:DIY Car Service Parts
2019/08/30 全球购物
信访工作者先进事迹
2014/01/17 职场文书
对公司合理化的建议书
2014/03/12 职场文书
国庆节活动总结
2014/08/26 职场文书
时尚女魔头观后感
2015/06/04 职场文书
亮剑观后感600字
2015/06/05 职场文书
小学体育教学随笔
2015/08/14 职场文书
2016年暑假家长对孩子评语
2015/12/01 职场文书
《卖火柴的小女孩》教学反思
2016/02/19 职场文书
MySQL索引失效的典型案例
2021/06/05 MySQL