Click here to Skip to main content
65,938 篇文章
CodeProject 正在发生变化。了解更多

CUDA

CUDA

精选阅读

作者:Wayne Wood
使用 Thrust 库验证短 CUDA 程序的执行效率。
作者:Wayne Wood
验证一系列简短的 .NET 4.0 并行编程示例的执行效率
作者:ObiWan_MCC
C# SMTP 服务器(接收器)。
作者:billconan, kavinguy
本文描述了使用CUDA实现神经网络。

最新文章

作者:Wayne Wood
使用 Thrust 库验证短 CUDA 程序的执行效率。
作者:Wayne Wood
验证一系列简短的 .NET 4.0 并行编程示例的执行效率
作者:ObiWan_MCC
C# SMTP 服务器(接收器)。
作者:billconan, kavinguy
本文描述了使用CUDA实现神经网络。

所有文章

按分数排序

CUDA 

作者:Wayne Wood
使用 Thrust 库验证短 CUDA 程序的执行效率。
作者:Wayne Wood
验证一系列简短的 .NET 4.0 并行编程示例的执行效率
作者:ObiWan_MCC
C# SMTP 服务器(接收器)。
作者:billconan, kavinguy
本文描述了使用CUDA实现神经网络。
作者:Intel
在这篇博文中,我们重点介绍了一类称为二值神经网络 (BNN) 的低精度网络,其底层基本概念,并介绍了一种 Neon CPU 和 GPU 实现。
作者:Intel
使用 Intel® FPGA SDK for OpenCL™ 技术提升性能
作者:Dan Buskirk
理解用于 CUDA 开发的 Visual Studio 项目的组织结构
作者:Nick Kopp
使用 CUDAfy.NET (CUDA in .NET) 在图形处理单元上执行 base64 编码。
作者:CodeProject
版本 2.6.5。我们快速、免费、自托管的人工智能服务器,适用于任何平台、任何语言。
作者:Dhruv__Patel
在本文中,我们将比较和对比SYCL和CUDA,并讨论oneAPI编译器如何与SYCL协同工作。
作者:grilialex
用于将 Xilinx 位流转换为 C 源代码以对 FPGA/CPLD 进行编程的流程和工具
作者:Nick Kopp
本文基于早期的《高性能查询:GPU vs. PLINQ vs. LINQ》一文,并将其移植以支持 OpenCL 设备,同时增加了基准测试,以便您可以轻松比较性能。
作者:Ryan Scott White
CudaPAD 是 NVIDIA Cuda 内核的 PTX/SASS 查看器,并提供对 Cuda 代码的即时查看。
作者:Mike Lanzetta
在本文中,我将指导您如何在 Windows 上安装最流行的工具包之一,并运行和解释一些有趣的示例。
作者:Roman Ginzburg
一个文本叠加过滤器和一个使用 transform filters 的 JPEG/JPEG2000 编码器。
作者:hax_
介绍用于分布式计算的开源 hxGrid 库。该库的主要优点:集群仅使用 Windows 2000/XP/Vista 工作站的空闲时间(无需专用工作站);易于使用;免费。
作者:phoaivu
用于背景减除的扩展高斯混合模型的 GPU 实现
作者:Afzaal Ahmad Zeeshan
在这篇文章中,我将引导您创建自己的中央集线器,以允许您的连接设备使用面部识别系统对人员进行身份验证。
作者:ChaoJui
高性能、高质量的图像模糊
作者:Adam Wojnar
简单的 .jp2/.j2k 查看器, 使用 Kakadu 可执行演示包进行解码
作者:Ryan Scott White
AMD 的 GCN(Generation Core Next Architecture)汇编语言的汇编器/编译器
作者:Intel
Theano 是在 LISA 实验室开发的一个 Python 库,用于定义、优化和评估数学表达式,包括多维数组(numpy.ndarray)的表达式。
作者:Alesiani Marco
使用 GPGPU 功能的波 PDE 模拟
作者 John Michael Hauck
对于 C# 桌面开发者来说,利用现代显卡强大的计算性能编写代码从未如此简单。在这篇文章中,我将分享一些解决一个简单(但仍然很有趣)的图像分析问题的技术。源代码 https://www.assembla.com/co
作者:Mark H Bishop
教程:使用 JCuda 和 Nsight (Eclipse) 进行 GPU 计算
作者:Android on Intel
本教程展示了如何使用OpenCL™ 2.0的两个强大功能:enqueue_kernel函数,允许您从设备入队内核,以及work_group_scan_exclusive_add和work_group_scan_inclusive_add。
作者:Maxim Kartavenkov
本文介绍如何使用 NVIDIA 编码器 API 在 C# 中创建 H.264 视频编码器 DirectShow 过滤器
作者:Intel
本文介绍了 oneAPI 产品的 Beta 版本,以促进异构编程。
作者:Nick Kopp
如何通过使用图形处理单元 (GPU) 而不是 LINQ 和 PLINQ 来获得 30 倍的查询性能提升。
作者:Igor Gribanov
在四面体网格上执行线性静力分析,并辅以第三方求解器。
作者:Vangos
本文将向您展示如何在 Windows 上使用 CUDA 构建 OpenCV。
作者:Packt Publishing
在本节中,我们将迈出使用低级 TensorFlow API 的第一步。
作者:Robert Mueller-Albrecht
使用 Intel® oneAPI 数学核心库 SYCL API
作者:Joren Heit
用于 CUDA 的混合框架代码生成器
作者:Kerem Kat
使用 OpenCV、 CUDA 和 C++ AMP 在 CPU 和 GPU 上处理网络摄像头图像
作者:Arthur V. Ratz
在本文中,我们将演示一种方法,该方法可以通过使用 NVIDIA CUDA 8.0 Runtime API 来提高实现传统分布计数算法(DCA)的代码的性能(高达 600%)
作者:Mark H Bishop
在 VS Express 的预算内开始使用 Cuda
作者:Thomas Daniels
在本文中,让我们深入了解 Keras,这是一个用于神经网络的高级库。
作者:Adnan Boz
从垃圾邮件过滤器到电影推荐和人脸检测,如今机器学习算法无处不在,帮助机器替我们思考。但是,运行这些算法需要强大的计算能力,在大多数情况下还需要超级计算机。这时,拥有 500 个核心的 GPU 就派上用场了。...
作者:ChaoJui
使用 CUDA 的爆发性能进行图像处理
作者:Bartlomiej Filipek
一篇关于现代 OpenGL 的小型指南, 以及它为何能给我们带来如此大的价值。
作者 Kevin Drzycimski
在编译时通过模板参数推导来展开循环。
作者:Intel
本文演示了如何将用 CUDA* 编写的线性代数 Jacobi 迭代方法迁移到 SYCL* 异构编程语言。
作者:CMalcheski
64 位调用约定
作者:Carlos Jiménez de Parga
用于实时体积云渲染、 动画和变形的可重用 Visual C++ 框架
作者:headmyshoulder
odeint v2 - 在 C++ 中求解常微分方程。
作者:Max R McCarty
OWASP 第 6 大最脆弱的安全风险与保密有关。
作者:Andrew Kirillov
本文介绍了使用纯 C# 实现并行计算。
作者:Debdatta Basu
探讨在 GPU 上实现基数排序的各种方法
作者:Arthur V. Ratz
本文是关于使用 Intel® Threading Building Blocks (TBB) 和 OpenMP 库进行 C++ 编程的实用指南, 以实现实现 Burrows-Wheeler 变换 (BWT) 算法的并行可扩展代码。
作者:CatchExAs
如何充分利用当前技术处理计算密集型应用程序?
作者:manythreads
这是关于使用 OpenCL™ 进行可移植多线程编程的第六篇文章,Rob Farber 讨论了如何在 OpenCL™ 中计算数据,并在同一应用程序中使用 OpenGL 进行渲染。
作者:Shao Voon Wong
在 GPU 上查找字典序排列
作者:Jeremy C. Ong
快速的 5 分钟教程,介绍如何将 CUDA 应用移植到数据并行 C++ (DPC++)
作者:Maxim Kartavenkov
本文介绍了如何在 .NET 中创建 DirectShow 过滤器, 其中包含 BaseClasses 和一些示例
作者:Matthew Faithfull
Querysoft Open Runtime:架构兼容性方面。
作者:Shao Voon Wong
如何将并行 C++ 光线追踪代码转换为 CUDA,然后通过 Intel® DPC++ 转换为 SYCL 2020。
作者:Sushil Sh.
如何使用 Eclipse 和 Android Studio 设置 Android 开发环境。
作者:Philippe Kirsanov
一个表示自“0001 年 1 月 1 日 00:00:00”以来经过的秒数的 DateTime 的小类。
作者:headmyshoulder, Denis Demidov
本文展示了如何使用 OpenCL 求解常微分方程。具体来说,它演示了如何将 odeint——一个用于常微分方程的 C++ 库——改编为与 VexCL——一个用于 OpenCL 的库——协同工作。在两个示例中研究了由此产生的性能。
作者:Dhruv__Patel
在本文中,我们将比较和对比SYCL和CUDA,介绍oneAPI,并讨论oneAPI编译器如何与SYCL协同工作。
作者:Alex Mikunov
运行时 MSIL 代码插装和 .NET 元数据扩展
作者:Dino Konstantopoulos
在 Windows 10 上使用 Nvidia 1070 GPU 运行 Theano,配备 CUDA 8 和 Visual Studio 2015
作者:Intel
TotalView 包含一组工具,为科学和学术开发者提供对进程和线程执行的控制,以及对程序状态和数据的深入可见性。
作者:Jeff B. Cromwell
在 R 和 C#.NET 中使用开源库进行格兰杰因果关系分析。
作者:Nick Kopp
GPU 上的超高品质频域图像旋转。
作者:Nick Kopp
介绍如何使用 Cudafy.NET 在 GPU 上执行处理
作者:Sergiu Ovidiu Oprea
本文将实际演示将 CUDA 转换为 SYCL 的过程。
作者:Denis Demidov
本文是 VexCL 的介绍。VexCL 是一个向量表达式模板库,旨在方便基于 C++ 的 OpenCL 开发。
作者:grilialex
如何将 Xilinx FPGA 配置数据嵌入 AVRILOS。



© . All rights reserved.