Click here to Skip to main content
65,938 篇文章
CodeProject 正在发生变化。了解更多
所有 / HPC / GPU

GPU

GPU

精选阅读

作者:Jeremy C. Ong
纹理编码器和解码器通常是游戏中带宽占用最多的部分, 并且使用 Arm 的 ASTC 编码器进行优化编码可以为运行时解码带来很多好处。
作者:Intel
使用 Intel® FPGA SDK for OpenCL™ 技术提升性能
作者:Bahrudin Hrnjica
ANNdotNET v1.0 已发布
作者:tugrulGtx
仅头文件的 C++ 工具,支持基本的数组式使用模式,并使用系统中多张显卡作为存储,带有 LRU 缓存。

最新文章

作者:Jeremy C. Ong
纹理编码器和解码器通常是游戏中带宽占用最多的部分, 并且使用 Arm 的 ASTC 编码器进行优化编码可以为运行时解码带来很多好处。
作者:Intel
使用 Intel® FPGA SDK for OpenCL™ 技术提升性能
作者:Bahrudin Hrnjica
ANNdotNET v1.0 已发布
作者:tugrulGtx
仅头文件的 C++ 工具,支持基本的数组式使用模式,并使用系统中多张显卡作为存储,带有 LRU 缓存。

所有文章

按分数排序

GPU 

作者:Jeremy C. Ong
纹理编码器和解码器通常是游戏中带宽占用最多的部分, 并且使用 Arm 的 ASTC 编码器进行优化编码可以为运行时解码带来很多好处。
作者:Intel
使用 Intel® FPGA SDK for OpenCL™ 技术提升性能
作者:Bahrudin Hrnjica
ANNdotNET v1.0 已发布
作者:tugrulGtx
仅头文件的 C++ 工具,支持基本的数组式使用模式,并使用系统中多张显卡作为存储,带有 LRU 缓存。
作者:Dhruv__Patel
在本文中,我们将比较和对比SYCL和CUDA,并讨论oneAPI编译器如何与SYCL协同工作。
作者:Roger Winter
在本文中,我们将探讨开发人员如何利用 oneAPI 的跨架构能力,在他们的应用程序中利用 GPU 资源。
作者:Raphael Mun
在本文中,我们将构建一个功能齐全的 MNIST 手写识别应用程序,使用 TensorFlow Lite 在低功耗 STMicroelectronics 微控制器上运行我们的 AI 推理,该微控制器使用基于 Arm Cortex M7 的处理器。
作者:Bahrudin Hrnjica
如何计算数据集的一些基本统计操作。
作者:Michael Coppock
在 GDC 2014 上, 微软发布了令人惊叹的消息, 宣布 2015 年 PC 游戏将迎来 Direct3D 的下一代版本—— Direct3D 12。 D3D 12 回归底层编程; 它赋予游戏开发者更多控制权, 并引入了许多令人兴奋的新特性。
作者:Asif Bahrainwala
HPC 通过计算着色器(GPGPU)。
作者:Intel
这不仅仅是今天的架构和明天的架构之间的关系,而是今天的架构与明天的架构之间的关系。oneAPI 有潜力成为编译各种架构代码的行业标准。
作者:Elmira Volkova, Alexander Bobyr, Igor Ermolaev
在本文中,我们将计算分配给主机 CPU 和独立 Intel® GPU,使两个处理器都能保持忙碌。
作者:Ryan Scott White
AMD 的 GCN(Generation Core Next Architecture)汇编语言的汇编器/编译器
作者:DaveAuld
替换的 GPU 散热器——冰凉还是热得受不了?
作者:Benjamin Consolvo
本文探讨了大型语言模型(LLM)在各种应用中的使用,例如聊天机器人、代码生成和调试。
作者:Intel
本节介绍了使用 Amazon Web Services (AWS) Greengrass 和 AWS Lambda 软件的 FaaS 推理样本(基于 Python 2.7)的实现。
作者:Intel
本文是关于将工作负载分派给平台中的所有 OpenCL 设备,以共同完成计算任务的方法的循序渐进指南。
作者:Raphael Mun
在本文中,我们将简要介绍两个使用 Vulkan 最大化游戏图形性能的示例。
作者:Dhruv__Patel
在本文中,我们将研究开发人员如何使用 Intel® Advisor 和 Intel® VTune™ Profiler 来有效地卸载到 GPU 并优化其跨架构应用程序。
作者:Intel
本白皮书介绍了开发人员如何集成 Intel® RealSense™ SDK 背景分割 (BGS) 中间件来创建新的沉浸式协作应用程序。
作者:Packt Publishing
比特币挖矿过程。
作者:Intel
在本文中,我们将介绍一种快速简便的方法,通过高级系统概述来查看您的游戏是否受 CPU 限制。
作者:Bartlomiej Filipek
一篇关于现代 OpenGL 的小型指南, 以及它为何能给我们带来如此大的价值。
作者:Bahrudin Hrnjica
使用 CNTK 和 C# 进行线性回归。
作者:Android on Intel
本文展示了如何分析和改进移动游戏性能,以及如何使用 mTricks Looting Crown 作为示例,为移动平台优化图形资源。
作者:Jeremy C. Ong
快速的 5 分钟教程,介绍如何将 CUDA 应用移植到数据并行 C++ (DPC++)
作者:Igor Gribanov
C++ 迭代器和算法对容器效果很好,但我们能否对数组结构进行排序?
作者 Doug Mcnabb
稀疏程序化体积渲染(SPVR)是一种用于渲染实时体积效果的技术。我们很高兴即将出版的《GPU Pro 6》一书将包含一个 SPVR 章节。本文档提供了一些额外的细节。
作者:Sergiu Oprea
SYCL和OpenCL之间的区别和相似之处
by Tom Pantels
本文描述了两个应用程序, 这些应用程序演示了诸如触摸响应时间差或无响应以及高能耗等问题, 这两个问题都对应用程序性能和用户体验至关重要。 然后, 我们将讨论如何优化这些应用程序以解决这些问题。
作者:Intel
使用 Intel® 消费者 GPU 和 Windows* Subsystem for Linux 2 进行快速简便的训练和推理。
作者:Pavel Busko
Arm Mobile Studio Pro 允许我们在 CI 服务器上执行自动测试时记录 Mali 系列 GPU 的硬件计数器,帮助我们解决任务。



© . All rights reserved.