使用Python写CUDA程序的方法


Posted in Python onMarch 27, 2017

使用Python写CUDA程序有两种方式:

* Numba
* PyCUDA

numbapro现在已经不推荐使用了,功能被拆分并分别被集成到accelerate和Numba了。

例子

numba

Numba通过及时编译机制(JIT)优化Python代码,Numba可以针对本机的硬件环境进行优化,同时支持CPU和GPU的优化,并且可以和Numpy集成,使Python代码可以在GPU上运行,只需在函数上方加上相关的指令标记,

如下所示:

import numpy as np 
from timeit import default_timer as timer
from numba import vectorize

@vectorize(["float32(float32, float32)"], target='cuda')
def vectorAdd(a, b):
  return a + b

def main():
  N = 320000000

  A = np.ones(N, dtype=np.float32 )
  B = np.ones(N, dtype=np.float32 )
  C = np.zeros(N, dtype=np.float32 )

  start = timer()
  C = vectorAdd(A, B)
  vectorAdd_time = timer() - start

  print("c[:5] = " + str(C[:5]))
  print("c[-5:] = " + str(C[-5:]))

  print("vectorAdd took %f seconds " % vectorAdd_time)

if __name__ == '__main__':
  main()

PyCUDA

PyCUDA的内核函数(kernel)其实就是使用C/C++编写的,通过动态编译为GPU微码,Python代码与GPU代码进行交互,如下所示:

import pycuda.autoinit
import pycuda.driver as drv
import numpy as np
from timeit import default_timer as timer

from pycuda.compiler import SourceModule
mod = SourceModule("""
__global__ void func(float *a, float *b, size_t N)
{
 const int i = blockIdx.x * blockDim.x + threadIdx.x;
 if (i >= N)
 {
  return;
 }
 float temp_a = a[i];
 float temp_b = b[i];
 a[i] = (temp_a * 10 + 2 ) * ((temp_b + 2) * 10 - 5 ) * 5;
 // a[i] = a[i] + b[i];
}
""")

func = mod.get_function("func")  

def test(N):
  # N = 1024 * 1024 * 90  # float: 4M = 1024 * 1024

  print("N = %d" % N)

  N = np.int32(N)

  a = np.random.randn(N).astype(np.float32)
  b = np.random.randn(N).astype(np.float32)  
  # copy a to aa
  aa = np.empty_like(a)
  aa[:] = a
  # GPU run
  nTheads = 256
  nBlocks = int( ( N + nTheads - 1 ) / nTheads )
  start = timer()
  func(
      drv.InOut(a), drv.In(b), N,
      block=( nTheads, 1, 1 ), grid=( nBlocks, 1 ) )
  run_time = timer() - start 
  print("gpu run time %f seconds " % run_time)  
  # cpu run
  start = timer()
  aa = (aa * 10 + 2 ) * ((b + 2) * 10 - 5 ) * 5
  run_time = timer() - start 

  print("cpu run time %f seconds " % run_time) 

  # check result
  r = a - aa
  print( min(r), max(r) )

def main():
 for n in range(1, 10):
  N = 1024 * 1024 * (n * 10)
  print("------------%d---------------" % n)
  test(N)

if __name__ == '__main__':
  main()

对比

numba使用一些指令标记某些函数进行加速(也可以使用Python编写内核函数),这一点类似于OpenACC,而PyCUDA需要自己写kernel,在运行时进行编译,底层是基于C/C++实现的。通过测试,这两种方式的加速比基本差不多。但是,numba更像是一个黑盒,不知道内部到底做了什么,而PyCUDA就显得很直观。因此,这两种方式具有不同的应用:

* 如果只是为了加速自己的算法而不关心CUDA编程,那么直接使用numba会更好。

* 如果为了学习、研究CUDA编程或者实验某一个算法在CUDA下的可行性,那么使用PyCUDA。

* 如果写的程序将来要移植到C/C++,那么就一定要使用PyCUDA了,因为使用PyCUDA写的kernel本身就是用CUDA C/C++写的。

以上这篇使用Python写CUDA程序的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python os模块中的isfile()和isdir()函数均返回false问题解决方法
Feb 04 Python
Python字典及字典基本操作方法详解
Jan 30 Python
详解Django中类视图使用装饰器的方式
Aug 12 Python
python 与服务器的共享文件夹交互方法
Dec 27 Python
​如何愉快地迁移到 Python 3
Apr 28 Python
详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)
Aug 02 Python
Python re 模块findall() 函数返回值展现方式解析
Aug 09 Python
Django 拆分model和view的实现方法
Aug 16 Python
使用python matplotlib 画图导入到word中如何保证分辨率
Apr 16 Python
Python2与Python3关于字符串编码处理的差别总结
Sep 07 Python
手把手教你从PyCharm安装到激活(最新激活码),亲测有效可激活至2089年
Nov 25 Python
python爬虫利器之requests库的用法(超全面的爬取网页案例)
Dec 17 Python
pyenv命令管理多个Python版本
Mar 26 #Python
Django实现自定义404,500页面教程
Mar 26 #Python
Python 多线程实例详解
Mar 25 #Python
解决python3 urllib中urlopen报错的问题
Mar 25 #Python
Python制作Windows系统服务
Mar 25 #Python
Python 类的继承实例详解
Mar 25 #Python
python利用拉链法实现字典方法示例
Mar 25 #Python
You might like
PHP 第二节 数据类型之字符串类型
2012/04/28 PHP
php 函数使用可变数量的参数方法
2017/05/02 PHP
laravel 根据不同组织加载不同视图的实现
2019/10/14 PHP
javascript图片相似度算法实现 js实现直方图和向量算法
2014/01/14 Javascript
jQuery使用height()获取高度需要注意的地方
2014/12/13 Javascript
jQuery同步提交示例代码
2015/12/12 Javascript
在页面中输出当前客户端时间javascript实例代码
2016/03/02 Javascript
jquery.cookie.js实现用户登录保存密码功能的方法
2016/04/15 Javascript
jquery拖动层效果插件用法实例分析(附demo源码)
2016/04/28 Javascript
JavaScript中的this陷阱的最全收集并整理(没有之一)
2017/02/21 Javascript
jquery插件canvaspercent.js实现百分比圆饼效果
2017/07/18 jQuery
react的滑动图片验证码组件的示例代码
2019/02/27 Javascript
vue 父组件给子组件传值子组件给父组件传值的实例代码
2019/04/15 Javascript
构建Vue大型应用的10个最佳实践(小结)
2019/11/07 Javascript
uniapp,微信小程序中使用 MQTT的问题
2020/07/11 Javascript
[01:19:46]DOTA2-DPC中国联赛 正赛 SAG vs DLG BO3 第一场 2月28日
2021/03/11 DOTA
Python中分数的相关使用教程
2015/03/30 Python
在dataframe两列日期相减并且得到具体的月数实例
2018/07/03 Python
解决Python print 输出文本显示 gbk 编码错误问题
2018/07/13 Python
python列表推导式入门学习解析
2019/12/02 Python
Python scrapy增量爬取实例及实现过程解析
2019/12/24 Python
详解有关PyCharm安装库失败的问题的解决方法
2020/02/02 Python
openCV提取图像中的矩形区域
2020/07/21 Python
Django实现文章详情页面跳转代码实例
2020/09/16 Python
碧欧泉法国官网:Biotherm法国
2019/10/23 全球购物
自我鉴定书范文
2013/10/02 职场文书
股东协议书
2014/04/14 职场文书
项目合作协议书
2014/04/16 职场文书
银行纠风工作实施方案
2014/06/08 职场文书
解除劳动关系协议书范文
2014/09/11 职场文书
放弃继承权公证书
2015/01/23 职场文书
全国助残日活动总结
2015/05/11 职场文书
2015年英语教研组工作总结
2015/05/23 职场文书
埃及王子观后感
2015/06/16 职场文书
2016年春节问候语
2015/11/11 职场文书
关于食品安全的演讲稿范文(三篇)
2019/10/21 职场文书