65,938 篇文章
CodeProject 正在发生变化。
了解更多
。
全部
/
语言
/
CUDA
人工智能
人工智能
神经网络
机器学习
深度学习
ML.Net
大数据
数据科学
Tensorflow
ChatGPT
物联网
物联网
Arduino
边缘设备
Raspberry-Pi
可穿戴设备
IoT Edge
工业物联网
DevOps
DevOps
敏捷
自动化
持续构建
持续交付
持续部署
持续集成
部署
Git
安装
集成测试
负载测试
质量保证
TFS
单元测试
测试
容器
容器
Docker
Kubernetes
虚拟机
高性能计算
高性能计算
GPU
并行处理
并行化
矢量化
托管服务
托管服务
AWS
Cordova
ExtJS
Google Cloud
微服务
PhoneGap
无服务器
存储
Web Hosting
WordPress
Azure
安全
安全
区块链
密码学
加密
身份
身份服务器
Web 开发
Web 开发
Blazor
CSS3
Flask
HTML5
Kestrel
LESS
Nginx
Node.js
React
SCSS
Spring
Vue.js
ASP.NET
CSS
Apache
HTML
IIS
XHTML
移动应用
移动应用
Flutter
Ionic
iOS
Nativescript
React Native
Xamarin
Windows Mobile
Android
桌面编程
桌面编程
Cocoa
Electron
QT
通用 Windows 平台
X11
Windows Forms
ATL
MFC
Swing
Win32
WTL
WPF
XAML
系统
数据库开发
数据库开发
数据可视化
Elasticsearch
Lucene
MariaDB
MongoDB
NoSQL
PostgreSQL
Redis
MySQL
SQL Server
生产力应用和服务
生产力应用和服务
LibreOffice
OpenOffice
Sharepoint
团队沟通工具
Biztalk
Microsoft Office
SAP
游戏开发
游戏开发
Doom
Kinect
Playstation 4
Playstation 5
Unity
Unreal
XBox
多媒体
多媒体
音频
图像处理
视频
音视频
DirectX
GDI
GDI+
OpenGL
通用编程
通用编程
算法
压缩
计算几何
仿真
异常
文件
互联网
本地化
内存管理
优化
解析器
性能
正则表达式
排序
状态机
架构
设计/图形
打印
字符串
线程
可用性
编程语言
编程语言
ASM
Bash
Basic
COBOL
Dart
Go
Haskell
Kotlin
Lua
Pascal
R
Razor
Rust
Scala
Swift
Typescript
Objective C
Visual Basic
VBScript
C++
C#
F#
FORTRAN
Java
Javascript
Perl
Python
Ruby
SQL
PHP
PowerShell
XML
提交您的文章
CUDA
CUDA
精选阅读
CUDA 和 Thrust 的代码效率简要测试
作者:
Wayne Wood
使用 Thrust 库验证短 CUDA 程序的执行效率。
对 .NET 4.0 并行代码示例效率的简要测试
作者:
Wayne Wood
验证一系列简短的 .NET 4.0 并行编程示例的执行效率
C# SMTP 服务器(接收器)
作者:
ObiWan_MCC
C# SMTP 服务器(接收器)。
GPU上的神经网络
作者:
billconan, kavinguy
本文描述了使用CUDA实现神经网络。
最新文章
CUDA 和 Thrust 的代码效率简要测试
作者:
Wayne Wood
使用 Thrust 库验证短 CUDA 程序的执行效率。
对 .NET 4.0 并行代码示例效率的简要测试
作者:
Wayne Wood
验证一系列简短的 .NET 4.0 并行编程示例的执行效率
C# SMTP 服务器(接收器)
作者:
ObiWan_MCC
C# SMTP 服务器(接收器)。
GPU上的神经网络
作者:
billconan, kavinguy
本文描述了使用CUDA实现神经网络。
所有文章
文章
项目
技术博客
技巧/窍门
视频
参考
资产
顶部
按分数排序
标题
更新时间
作者
分数
CUDA
CUDA 和 Thrust 的代码效率简要测试
作者:
Wayne Wood
使用 Thrust 库验证短 CUDA 程序的执行效率。
对 .NET 4.0 并行代码示例效率的简要测试
作者:
Wayne Wood
验证一系列简短的 .NET 4.0 并行编程示例的执行效率
C# SMTP 服务器(接收器)
作者:
ObiWan_MCC
C# SMTP 服务器(接收器)。
GPU上的神经网络
作者:
billconan, kavinguy
本文描述了使用CUDA实现神经网络。
使用二元算术加速神经网络
作者:
Intel
在这篇博文中,我们重点介绍了一类称为二值神经网络 (BNN) 的低精度网络,其底层基本概念,并介绍了一种 Neon CPU 和 GPU 实现。
推动 OpenCL™ 在 FPGA 上的发展
作者:
Intel
使用 Intel® FPGA SDK for OpenCL™ 技术提升性能
避免在 Windows 上进行 CUDA 开发的考验与磨难
作者:
Dan Buskirk
理解用于 CUDA 开发的 Visual Studio 项目的组织结构
GPU 上的 Base64 编码
作者:
Nick Kopp
使用 CUDAfy.NET (CUDA in .NET) 在图形处理单元上执行 base64 编码。
CodeProject.AI Server:轻松实现 AI。
作者:
CodeProject
版本 2.6.5。我们快速、免费、自托管的人工智能服务器,适用于任何平台、任何语言。
比较编程模型:SYCL和CUDA
作者:
Dhruv__Patel
在本文中,
我们将比较和对比SYCL和CUDA,
并讨论oneAPI编译器如何与SYCL协同工作。
将 Xilinx FPGA/CPLD 转换为 C 源代码
作者:
grilialex
用于将 Xilinx 位流转换为 C 源代码以对 FPGA/CPLD 进行编程的流程和工具
AMD GPU 和 Intel CPU 上的 CUDA 编程模型
作者:
Nick Kopp
本文基于早期的《高性能查询:GPU vs. PLINQ vs. LINQ》一文,并将其移植以支持 OpenCL 设备,同时增加了基准测试,以便您可以轻松比较性能。
CudaPAD
作者:
Ryan Scott White
CudaPAD 是 NVIDIA Cuda 内核的 PTX/SASS 查看器,并提供对 Cuda 代码的即时查看。
Windows 上的深度学习:入门指南
作者:
Mike Lanzetta
在本文中,我将指导您如何在 Windows 上安装最流行的工具包之一,并运行和解释一些有趣的示例。
DirectShow 过滤器开发第三部分:Transform Filters
作者:
Roman Ginzburg
一个文本叠加过滤器和一个使用 transform filters 的 JPEG/JPEG2000 编码器。
中小型办公室的分布式计算
作者:
hax_
介绍用于分布式计算的开源 hxGrid 库。该库的主要优点:集群仅使用 Windows 2000/XP/Vista 工作站的空闲时间(无需专用工作站);易于使用;免费。
GPU 上的扩展 GMM 用于背景减除
作者:
phoaivu
用于背景减除的扩展高斯混合模型的 GPU 实现
连接设备上的面部生物识别身份验证
作者:
Afzaal Ahmad Zeeshan
在这篇文章中,我将引导您创建自己的中央集线器,以允许您的连接设备使用面部识别系统对人员进行身份验证。
使用 CUDA 的快速图像模糊
作者:
ChaoJui
高性能、高质量的图像模糊
更快的 JPEG2000 查看器
作者:
Adam Wojnar
简单的 .
jp2/.
j2k 查看器,
使用 Kakadu 可执行演示包进行解码
AMD GPU 的 GCN 汇编器
作者:
Ryan Scott White
AMD 的 GCN(
Generation Core Next Architecture)
汇编语言的汇编器/编译器
使用 Intel® 软件优化 Theano 和 Intel® Python 发行版入门
作者:
Intel
Theano 是在 LISA 实验室开发的一个 Python 库,用于定义、优化和评估数学表达式,包括多维数组(numpy.ndarray)的表达式。
GPGPU 加速波 PDE
作者:
Alesiani Marco
使用 GPGPU 功能的波 PDE 模拟
GPGPU Papyrus 演示
作者
John Michael Hauck
对于 C# 桌面开发者来说,利用现代显卡强大的计算性能编写代码从未如此简单。在这篇文章中,我将分享一些解决一个简单(但仍然很有趣)的图像分析问题的技术。源代码 https:/
/
www.
assembla.
com/
co
使用 CUDA、Eclipse 和 Java (JCuda) 进行 GPU 计算
作者:
Mark H Bishop
教程:使用 JCuda 和 Nsight (Eclipse) 进行 GPU 计算
OpenCL 2.0中的GPU-Quicksort:嵌套并行和工作组扫描函数
作者:
Android on Intel
本教程展示了如何使用OpenCL™ 2.0的两个强大功能:enqueue_kernel函数,允许您从设备入队内核,以及work_group_scan_exclusive_add和work_group_scan_inclusive_add。
C# 中的 H.264 CUDA 编码器 DirectShow 过滤器
作者:
Maxim Kartavenkov
本文介绍如何使用 NVIDIA 编码器 API 在 C# 中创建 H.264 视频编码器 DirectShow 过滤器
使用 oneAPI 进行异构编程
作者:
Intel
本文介绍了 oneAPI 产品的 Beta 版本,以促进异构编程。
高性能查询:GPU vs. PLINQ vs. LINQ
作者:
Nick Kopp
如何通过使用图形处理单元 (GPU) 而不是 LINQ 和 PLINQ 来获得 30 倍的查询性能提升。
高性能 C# 有限元
作者:
Igor Gribanov
在四面体网格上执行线性静力分析,并辅以第三方求解器。
如何在 Windows 上使用 CUDA 构建 OpenCV
作者:
Vangos
本文将向您展示如何在 Windows 上使用 CUDA 构建 OpenCV。
如何开始使用 TensorFlow
作者:
Packt Publishing
在本节中,我们将迈出使用低级 TensorFlow API 的第一步。
如何从 CUDA 数学库调用迁移到 oneMKL
作者:
Robert Mueller-Albrecht
使用 Intel® oneAPI 数学核心库 SYCL API
HyCuda,用于 CUDA 的混合框架代码生成器
作者:
Joren Heit
用于 CUDA 的混合框架代码生成器
使用 CPU、
GPU 和 C++ AMP 的图像滤镜
作者:
Kerem Kat
使用 OpenCV、
CUDA 和 C++ AMP 在 CPU 和 GPU 上处理网络摄像头图像
使用 CUDA 8.
0 Runtime API 实现并行可扩展分布计数算法(
DCA)
作者:
Arthur V. Ratz
在本文中,
我们将演示一种方法,
该方法可以通过使用 NVIDIA CUDA 8.
0 Runtime API 来提高实现传统分布计数算法(
DCA)
的代码的性能(
高达 600%)
在 Windows 7-x64 上安装 Cuda 并使用 VS 2008 Express 进行托管代码
作者:
Mark H Bishop
在 VS Express 的预算内开始使用 Cuda
Keras 入门
作者:
Thomas Daniels
在本文中,让我们深入了解 Keras,这是一个用于神经网络的高级库。
使用 NVIDIA CUDA 进行大规模机器学习
作者:
Adnan Boz
从垃圾邮件过滤器到电影推荐和人脸检测,如今机器学习算法无处不在,帮助机器替我们思考。但是,运行这些算法需要强大的计算能力,在大多数情况下还需要超级计算机。这时,拥有 500 个核心的 GPU 就派上用场了。.
.
.
学习如何使用 CUDA 进行 Alpha 混合
作者:
ChaoJui
使用 CUDA 的爆发性能进行图像处理
学习现代 OpenGL
作者:
Bartlomiej Filipek
一篇关于现代 OpenGL 的小型指南,
以及它为何能给我们带来如此大的价值。
基于模板参数的循环展开
作者
Kevin Drzycimski
在编译时通过模板参数推导来展开循环。
将 Jacobi 迭代方法从 CUDA 迁移到 SYCL
作者:
Intel
本文演示了如何将用 CUDA* 编写的线性代数 Jacobi 迭代方法迁移到 SYCL* 异构编程语言。
Nightmare on (Overwh)Elm Street:
64 位调用约定
作者:
CMalcheski
64 位调用约定
Nimbus SDK:
用于 C++ 实时体积云渲染、
动画和变形的微小框架
作者:
Carlos Jiménez de Parga
用于实时体积云渲染、
动画和变形的可重用 Visual C++ 框架
odeint v2 - 在 C++ 中求解常微分方程。
作者:
headmyshoulder
odeint v2 - 在 C++ 中求解常微分方程。
OWASP #6 防止 ASP.
NET 中的敏感数据泄露 – 第 1 部分
作者:
Max R McCarty
OWASP 第 6 大最脆弱的安全风险与保密有关。
C# 中的并行计算
作者:
Andrew Kirillov
本文介绍了使用纯 C# 实现并行计算。
在 GPU 上使用 C++ AMP 实现并行基数排序
作者:
Debdatta Basu
探讨在 GPU 上实现基数排序的各种方法
使用 Intel® Threading Building Blocks 和 OpenMP 库的并行可扩展 Burrows-Wheeler 变换 (BWT)
作者:
Arthur V. Ratz
本文是关于使用 Intel® Threading Building Blocks (TBB) 和 OpenMP 库进行 C++ 编程的实用指南,
以实现实现 Burrows-Wheeler 变换 (BWT) 算法的并行可扩展代码。
并行蒙特卡洛算法 #1
作者:
CatchExAs
如何充分利用当前技术处理计算密集型应用程序?
第六部分:原始重启和 OpenGL 互操作性
作者:
manythreads
这是关于使用 OpenCL™ 进行可移植多线程编程的第六篇文章,Rob Farber 讨论了如何在 OpenCL™ 中计算数据,并在同一应用程序中使用 OpenGL 进行渲染。
使用 CUDA 和 OpenCL 进行排列
作者:
Shao Voon Wong
在 GPU 上查找字典序排列
在 5 分钟内将 CUDA 应用移植到 oneAPI 和 DPC++
作者:
Jeremy C. Ong
快速的 5 分钟教程,介绍如何将 CUDA 应用移植到数据并行 C++ (DPC++)
纯 .NET DirectShow 过滤器(
C#)
作者:
Maxim Kartavenkov
本文介绍了如何在 .NET 中创建 DirectShow 过滤器,
其中包含 BaseClasses 和一些示例
QOR 架构方面
作者:
Matthew Faithfull
Querysoft Open Runtime:架构兼容性方面。
从 CUDA 到 SYCL 2020 通过 DPC++ 进行光线追踪
作者:
Shao Voon Wong
如何将并行 C++ 光线追踪代码转换为 CUDA,然后通过 Intel® DPC++ 转换为 SYCL 2020。
设置您的 Android 开发环境
作者:
Sushil Sh.
如何使用 Eclipse 和 Android Studio 设置 Android 开发环境。
表示自“0001 年 1 月 1 日 00:00:00”以来经过的秒数的 DateTime 的小类
作者:
Philippe Kirsanov
一个表示自“0001 年 1 月 1 日 00:00:00”以来经过的秒数的 DateTime 的小类。
在C++中使用OpenCL求解常微分方程
作者:
headmyshoulder, Denis Demidov
本文展示了如何使用 OpenCL 求解常微分方程。具体来说,它演示了如何将 odeint——一个用于常微分方程的 C++ 库——改编为与 VexCL——一个用于 OpenCL 的库——协同工作。在两个示例中研究了由此产生的性能。
SYCL与CUDA
作者:
Dhruv__Patel
在本文中,
我们将比较和对比SYCL和CUDA,
介绍oneAPI,
并讨论oneAPI编译器如何与SYCL协同工作。
在 .
NET 中实现模型约束 - II
作者:
Alex Mikunov
运行时 MSIL 代码插装和 .
NET 元数据扩展
在 Windows 10 上使用 GPU 进行 Theano 机器学习
作者:
Dino Konstantopoulos
在 Windows 10 上使用 Nvidia 1070 GPU 运行 Theano,配备 CUDA 8 和 Visual Studio 2015
关于线程的思考。
作者:
Intel
TotalView 包含一组工具,为科学和学术开发者提供对进程和线程执行的控制,以及对程序状态和数据的深入可见性。
C#.NET 中的时间序列分析:第 II 部分
作者:
Jeff B. Cromwell
在 R 和 C#.NET 中使用开源库进行格兰杰因果关系分析。
GPU 上的超高品质图像旋转
作者:
Nick Kopp
GPU 上的超高品质频域图像旋转。
在 .NET 中使用 Cudafy 进行 GPGPU 编程
作者:
Nick Kopp
介绍如何使用 Cudafy.NET 在 GPU 上执行处理
使用 oneAPI 将 CUDA 转换为 SYCL
作者:
Sergiu Ovidiu Oprea
本文将实际演示将 CUDA 转换为 SYCL 的过程。
VexCL: 用于 OpenCL 的向量表达式模板库
作者:
Denis Demidov
本文是 VexCL 的介绍。
VexCL 是一个向量表达式模板库,
旨在方便基于 C++ 的 OpenCL 开发。
Xilinx FPGA 与 AVRILOS
作者:
grilialex
如何将 Xilinx FPGA 配置数据嵌入 AVRILOS。
©
. All rights reserved.