CUDA

精选阅读

CUDA 和 Thrust 的代码效率简要测试

作者：Wayne Wood

使用 Thrust 库验证短 CUDA 程序的执行效率。

对 .NET 4.0 并行代码示例效率的简要测试

作者：Wayne Wood

验证一系列简短的 .NET 4.0 并行编程示例的执行效率

C# SMTP 服务器（接收器）

作者：ObiWan_MCC

C# SMTP 服务器（接收器）。

GPU上的神经网络

作者：billconan, kavinguy

本文描述了使用CUDA实现神经网络。

所有文章

顶部

CUDA

CUDA 和 Thrust 的代码效率简要测试

作者：Wayne Wood

使用 Thrust 库验证短 CUDA 程序的执行效率。

对 .NET 4.0 并行代码示例效率的简要测试

作者：Wayne Wood

验证一系列简短的 .NET 4.0 并行编程示例的执行效率

C# SMTP 服务器（接收器）

作者：ObiWan_MCC

C# SMTP 服务器（接收器）。

GPU上的神经网络

作者：billconan, kavinguy

本文描述了使用CUDA实现神经网络。

使用二元算术加速神经网络

作者：Intel

在这篇博文中，我们重点介绍了一类称为二值神经网络 (BNN) 的低精度网络，其底层基本概念，并介绍了一种 Neon CPU 和 GPU 实现。

推动 OpenCL™ 在 FPGA 上的发展

作者：Intel

使用 Intel® FPGA SDK for OpenCL™ 技术提升性能

避免在 Windows 上进行 CUDA 开发的考验与磨难

作者：Dan Buskirk

理解用于 CUDA 开发的 Visual Studio 项目的组织结构

GPU 上的 Base64 编码

作者：Nick Kopp

使用 CUDAfy.NET (CUDA in .NET) 在图形处理单元上执行 base64 编码。

CodeProject.AI Server：轻松实现 AI。

作者：CodeProject

版本 2.6.5。我们快速、免费、自托管的人工智能服务器，适用于任何平台、任何语言。

比较编程模型：SYCL和CUDA

作者：Dhruv__Patel

在本文中，我们将比较和对比SYCL和CUDA，并讨论oneAPI编译器如何与SYCL协同工作。

将 Xilinx FPGA/CPLD 转换为 C 源代码

作者：grilialex

用于将 Xilinx 位流转换为 C 源代码以对 FPGA/CPLD 进行编程的流程和工具

AMD GPU 和 Intel CPU 上的 CUDA 编程模型

作者：Nick Kopp

本文基于早期的《高性能查询：GPU vs. PLINQ vs. LINQ》一文，并将其移植以支持 OpenCL 设备，同时增加了基准测试，以便您可以轻松比较性能。

CudaPAD

作者：Ryan Scott White

CudaPAD 是 NVIDIA Cuda 内核的 PTX/SASS 查看器，并提供对 Cuda 代码的即时查看。

Windows 上的深度学习：入门指南

作者：Mike Lanzetta

在本文中，我将指导您如何在 Windows 上安装最流行的工具包之一，并运行和解释一些有趣的示例。

DirectShow 过滤器开发第三部分：Transform Filters

作者：Roman Ginzburg

一个文本叠加过滤器和一个使用 transform filters 的 JPEG/JPEG2000 编码器。

中小型办公室的分布式计算

作者：hax_

介绍用于分布式计算的开源 hxGrid 库。该库的主要优点：集群仅使用 Windows 2000/XP/Vista 工作站的空闲时间（无需专用工作站）；易于使用；免费。

GPU 上的扩展 GMM 用于背景减除

作者：phoaivu

用于背景减除的扩展高斯混合模型的 GPU 实现

连接设备上的面部生物识别身份验证

作者：Afzaal Ahmad Zeeshan

在这篇文章中，我将引导您创建自己的中央集线器，以允许您的连接设备使用面部识别系统对人员进行身份验证。

使用 CUDA 的快速图像模糊

作者：ChaoJui

高性能、高质量的图像模糊

更快的 JPEG2000 查看器

作者：Adam Wojnar

简单的 .jp2/.j2k 查看器，使用 Kakadu 可执行演示包进行解码

AMD GPU 的 GCN 汇编器

作者：Ryan Scott White

AMD 的 GCN（Generation Core Next Architecture）汇编语言的汇编器/编译器

使用 Intel® 软件优化 Theano 和 Intel® Python 发行版入门

作者：Intel

Theano 是在 LISA 实验室开发的一个 Python 库，用于定义、优化和评估数学表达式，包括多维数组（numpy.ndarray）的表达式。

GPGPU 加速波 PDE

作者：Alesiani Marco

使用 GPGPU 功能的波 PDE 模拟

GPGPU Papyrus 演示

作者 John Michael Hauck

对于 C# 桌面开发者来说，利用现代显卡强大的计算性能编写代码从未如此简单。在这篇文章中，我将分享一些解决一个简单（但仍然很有趣）的图像分析问题的技术。源代码 https://www.assembla.com/co

使用 CUDA、Eclipse 和 Java (JCuda) 进行 GPU 计算

作者：Mark H Bishop

教程：使用 JCuda 和 Nsight (Eclipse) 进行 GPU 计算

OpenCL 2.0中的GPU-Quicksort：嵌套并行和工作组扫描函数

作者：Android on Intel

本教程展示了如何使用OpenCL™ 2.0的两个强大功能：enqueue_kernel函数，允许您从设备入队内核，以及work_group_scan_exclusive_add和work_group_scan_inclusive_add。

C# 中的 H.264 CUDA 编码器 DirectShow 过滤器

作者：Maxim Kartavenkov

本文介绍如何使用 NVIDIA 编码器 API 在 C# 中创建 H.264 视频编码器 DirectShow 过滤器

使用 oneAPI 进行异构编程

作者：Intel

本文介绍了 oneAPI 产品的 Beta 版本，以促进异构编程。

高性能查询：GPU vs. PLINQ vs. LINQ

作者：Nick Kopp

如何通过使用图形处理单元 (GPU) 而不是 LINQ 和 PLINQ 来获得 30 倍的查询性能提升。

高性能 C# 有限元

作者：Igor Gribanov

在四面体网格上执行线性静力分析，并辅以第三方求解器。

如何在 Windows 上使用 CUDA 构建 OpenCV

作者：Vangos

本文将向您展示如何在 Windows 上使用 CUDA 构建 OpenCV。

如何开始使用 TensorFlow

作者：Packt Publishing

在本节中，我们将迈出使用低级 TensorFlow API 的第一步。

如何从 CUDA 数学库调用迁移到 oneMKL

作者：Robert Mueller-Albrecht

使用 Intel® oneAPI 数学核心库 SYCL API

HyCuda，用于 CUDA 的混合框架代码生成器

作者：Joren Heit

用于 CUDA 的混合框架代码生成器

使用 CPU、 GPU 和 C++ AMP 的图像滤镜

作者：Kerem Kat

使用 OpenCV、 CUDA 和 C++ AMP 在 CPU 和 GPU 上处理网络摄像头图像

使用 CUDA 8.0 Runtime API 实现并行可扩展分布计数算法（DCA）

作者：Arthur V. Ratz

在本文中，我们将演示一种方法，该方法可以通过使用 NVIDIA CUDA 8.0 Runtime API 来提高实现传统分布计数算法（DCA）的代码的性能（高达 600%）

在 Windows 7-x64 上安装 Cuda 并使用 VS 2008 Express 进行托管代码

作者：Mark H Bishop

在 VS Express 的预算内开始使用 Cuda

Keras 入门

作者：Thomas Daniels

在本文中，让我们深入了解 Keras，这是一个用于神经网络的高级库。

使用 NVIDIA CUDA 进行大规模机器学习

作者：Adnan Boz

从垃圾邮件过滤器到电影推荐和人脸检测，如今机器学习算法无处不在，帮助机器替我们思考。但是，运行这些算法需要强大的计算能力，在大多数情况下还需要超级计算机。这时，拥有 500 个核心的 GPU 就派上用场了。...

学习如何使用 CUDA 进行 Alpha 混合

作者：ChaoJui

使用 CUDA 的爆发性能进行图像处理

学习现代 OpenGL

作者：Bartlomiej Filipek

一篇关于现代 OpenGL 的小型指南，以及它为何能给我们带来如此大的价值。

基于模板参数的循环展开

作者 Kevin Drzycimski

在编译时通过模板参数推导来展开循环。

将 Jacobi 迭代方法从 CUDA 迁移到 SYCL

作者：Intel

本文演示了如何将用 CUDA* 编写的线性代数 Jacobi 迭代方法迁移到 SYCL* 异构编程语言。

Nightmare on (Overwh)Elm Street： 64 位调用约定

作者：CMalcheski

64 位调用约定

Nimbus SDK：用于 C++ 实时体积云渲染、动画和变形的微小框架

作者：Carlos Jiménez de Parga

用于实时体积云渲染、动画和变形的可重用 Visual C++ 框架

odeint v2 - 在 C++ 中求解常微分方程。

作者：headmyshoulder

odeint v2 - 在 C++ 中求解常微分方程。

OWASP #6 防止 ASP.NET 中的敏感数据泄露 – 第 1 部分

作者：Max R McCarty

OWASP 第 6 大最脆弱的安全风险与保密有关。

C# 中的并行计算

作者：Andrew Kirillov

本文介绍了使用纯 C# 实现并行计算。

在 GPU 上使用 C++ AMP 实现并行基数排序

作者：Debdatta Basu

探讨在 GPU 上实现基数排序的各种方法

使用 Intel® Threading Building Blocks 和 OpenMP 库的并行可扩展 Burrows-Wheeler 变换 (BWT)

作者：Arthur V. Ratz

本文是关于使用 Intel® Threading Building Blocks (TBB) 和 OpenMP 库进行 C++ 编程的实用指南，以实现实现 Burrows-Wheeler 变换 (BWT) 算法的并行可扩展代码。

并行蒙特卡洛算法 #1

作者：CatchExAs

如何充分利用当前技术处理计算密集型应用程序？

第六部分：原始重启和 OpenGL 互操作性

作者：manythreads

这是关于使用 OpenCL™ 进行可移植多线程编程的第六篇文章，Rob Farber 讨论了如何在 OpenCL™ 中计算数据，并在同一应用程序中使用 OpenGL 进行渲染。

使用 CUDA 和 OpenCL 进行排列

作者：Shao Voon Wong

在 GPU 上查找字典序排列

在 5 分钟内将 CUDA 应用移植到 oneAPI 和 DPC++

作者：Jeremy C. Ong

快速的 5 分钟教程，介绍如何将 CUDA 应用移植到数据并行 C++ (DPC++)

纯 .NET DirectShow 过滤器（C#）

作者：Maxim Kartavenkov

本文介绍了如何在 .NET 中创建 DirectShow 过滤器，其中包含 BaseClasses 和一些示例

QOR 架构方面

作者：Matthew Faithfull

Querysoft Open Runtime：架构兼容性方面。

从 CUDA 到 SYCL 2020 通过 DPC++ 进行光线追踪

作者：Shao Voon Wong

如何将并行 C++ 光线追踪代码转换为 CUDA，然后通过 Intel® DPC++ 转换为 SYCL 2020。

设置您的 Android 开发环境

作者：Sushil Sh.

如何使用 Eclipse 和 Android Studio 设置 Android 开发环境。

表示自“0001 年 1 月 1 日 00:00:00”以来经过的秒数的 DateTime 的小类

作者：Philippe Kirsanov

一个表示自“0001 年 1 月 1 日 00:00:00”以来经过的秒数的 DateTime 的小类。

在C++中使用OpenCL求解常微分方程

作者：headmyshoulder, Denis Demidov

本文展示了如何使用 OpenCL 求解常微分方程。具体来说，它演示了如何将 odeint——一个用于常微分方程的 C++ 库——改编为与 VexCL——一个用于 OpenCL 的库——协同工作。在两个示例中研究了由此产生的性能。

SYCL与CUDA

作者：Dhruv__Patel

在本文中，我们将比较和对比SYCL和CUDA，介绍oneAPI，并讨论oneAPI编译器如何与SYCL协同工作。

在 .NET 中实现模型约束 - II

作者：Alex Mikunov

运行时 MSIL 代码插装和 .NET 元数据扩展

在 Windows 10 上使用 GPU 进行 Theano 机器学习

作者：Dino Konstantopoulos

在 Windows 10 上使用 Nvidia 1070 GPU 运行 Theano，配备 CUDA 8 和 Visual Studio 2015

关于线程的思考。

作者：Intel

TotalView 包含一组工具，为科学和学术开发者提供对进程和线程执行的控制，以及对程序状态和数据的深入可见性。

C#.NET 中的时间序列分析：第 II 部分

作者：Jeff B. Cromwell

在 R 和 C#.NET 中使用开源库进行格兰杰因果关系分析。

GPU 上的超高品质图像旋转

作者：Nick Kopp

GPU 上的超高品质频域图像旋转。

在 .NET 中使用 Cudafy 进行 GPGPU 编程

作者：Nick Kopp

介绍如何使用 Cudafy.NET 在 GPU 上执行处理

使用 oneAPI 将 CUDA 转换为 SYCL

作者：Sergiu Ovidiu Oprea

本文将实际演示将 CUDA 转换为 SYCL 的过程。

VexCL: 用于 OpenCL 的向量表达式模板库

作者：Denis Demidov

本文是 VexCL 的介绍。VexCL 是一个向量表达式模板库，旨在方便基于 C++ 的 OpenCL 开发。

Xilinx FPGA 与 AVRILOS

作者：grilialex

如何将 Xilinx FPGA 配置数据嵌入 AVRILOS。

CUDA

精选阅读

最新文章

所有文章

CUDA