如果你是一名 Python 开发者,曾想尝试 CUDA 却被 C/C++ 劝退,那么你终于可以松一口气了——今年 NVIDIA GTC 大会上传来了一条重磅消息:CUDA,英伟达深耕多年的并行计算平台和编程模型框架,正式加入了对 Python 的原生支持! 这意味着:Python 开发者无需再学习 C ...
编译 | 核子可乐、Tina 今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达 ...
英伟达发布最新版CUDA 13.1,官方直接定性:这是自2006年诞生以来最大的进步。 核心变化是推出全新的CUDA Tile编程模型,让开发者可以用Python写GPU内核,15行代码就能达到200行CUDA C++代码的性能。 Jim Keller参与设计过AMD Zen架构、苹果A系列芯片、特斯拉自动驾驶芯片 ...
12 月 8 日-10 日,CNCC 邀您共赴 “计算之约”。以算力、数据、生态为主题,本届 CNCC 首次全面改为线上举办,但规模可说是史上之 “最” :邀请嘉宾包括 ACM 图灵奖获得者、田纳西大学教授 Jack Dongarra,以及多位院士及专家,还有七百余位国内外名校学者、名企 ...
2025 年 12 月,在 CUDA 发布近二十年后,NVIDIA 推出新的 GPU 编程入口「cuTile」,通过 Tile-based 编程模型重构 GPU 内核,使开发者无需深入 CUDA C++ 即可高效编写 Kernel,引发社区热议。尽管仍处早期,Tile 思维的抽象优势、社区探索迁移工具及实践尝试表明,cuTile 有 ...
近日,来自字节跳动 Seed 团队和清华大学 AIR的新研究CUDA Agent,在 AI 领域引发了不小的轰动。 研究人员训练了一个能够编写快速 CUDA 内核的模型:不只是正确的内核,而是真正经过优化的内核。 在此之前,GPT、Claude 等大模型已经能写出「正确」的 CUDA 代码,AI 生成的代码也已获得了一定程度的应用,但能跑通和跑得快完全是两码事。 GPU 内核优化是现代深度学习的基 ...
Python易学易用,用户超过300万人,是世界上十大编程语言之一。 该语言让用户能够编写出充分体现用户算法理念的高级软件代码,而无需钻研编程细节。Python广泛的库与先进的特性使其十分适合各种 HPC 学科、工程以及大数据分析等应用。 对 NVIDIA CUDA 的支持是 ...
GPU Hackathon 是一个专门针对全球从事科学研究的应用程序开发者的 GPU 应用加速活动,目标是在 10 天的活动期间,将科研 HPC+AI 应用通过 OpenACC,Python,CUDA 等不同的编程语言移植到 GPU 上。每次活动通常有 6-10 个应用小组参加,每个应用小组由 3-5 位老师和同学 ...
最多可支持 10000+ 个并发线程。 经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。 上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。 作为一种大规模并行 ...
Today Nvidia announced that growing ranks of Python users can now take full advantage of GPU acceleration for HPC and Big Data analytics applications by using the CUDA parallel programming model. As a ...