65,938 篇文章
CodeProject 正在发生变化。
了解更多
。
所有
/
HPC
/
GPU
人工智能
人工智能
神经网络
机器学习
深度学习
ML.Net
大数据
数据科学
Tensorflow
ChatGPT
物联网
物联网
Arduino
边缘设备
Raspberry-Pi
可穿戴设备
IoT Edge
工业物联网
DevOps
DevOps
敏捷
自动化
持续构建
持续交付
持续部署
持续集成
部署
Git
安装
集成测试
负载测试
质量保证
TFS
单元测试
测试
容器
容器
Docker
Kubernetes
虚拟机
高性能计算
高性能计算
GPU
并行处理
并行化
矢量化
托管服务
托管服务
AWS
Cordova
ExtJS
Google Cloud
微服务
PhoneGap
无服务器
存储
Web Hosting
WordPress
Azure
安全
安全
区块链
密码学
加密
身份
身份服务器
Web 开发
Web 开发
Blazor
CSS3
Flask
HTML5
Kestrel
LESS
Nginx
Node.js
React
SCSS
Spring
Vue.js
ASP.NET
CSS
Apache
HTML
IIS
XHTML
移动应用
移动应用
Flutter
Ionic
iOS
Nativescript
React Native
Xamarin
Windows Mobile
Android
桌面编程
桌面编程
Cocoa
Electron
QT
通用 Windows 平台
X11
Windows Forms
ATL
MFC
Swing
Win32
WTL
WPF
XAML
系统
数据库开发
数据库开发
数据可视化
Elasticsearch
Lucene
MariaDB
MongoDB
NoSQL
PostgreSQL
Redis
MySQL
SQL Server
生产力应用和服务
生产力应用和服务
LibreOffice
OpenOffice
Sharepoint
团队沟通工具
Biztalk
Microsoft Office
SAP
游戏开发
游戏开发
Doom
Kinect
Playstation 4
Playstation 5
Unity
Unreal
XBox
多媒体
多媒体
音频
图像处理
视频
音视频
DirectX
GDI
GDI+
OpenGL
通用编程
通用编程
算法
压缩
计算几何
仿真
异常
文件
互联网
本地化
内存管理
优化
解析器
性能
正则表达式
排序
状态机
架构
设计/图形
打印
字符串
线程
可用性
编程语言
编程语言
ASM
Bash
Basic
COBOL
Dart
Go
Haskell
Kotlin
Lua
Pascal
R
Razor
Rust
Scala
Swift
Typescript
Objective C
Visual Basic
VBScript
C++
C#
F#
FORTRAN
Java
Javascript
Perl
Python
Ruby
SQL
PHP
PowerShell
XML
提交您的文章
GPU
GPU
精选阅读
一种新的自适应可伸缩纹理压缩 (ASTC) 编解码器,
用于加速游戏中的纹理处理
作者:
Jeremy C. Ong
纹理编码器和解码器通常是游戏中带宽占用最多的部分,
并且使用 Arm 的 ASTC 编码器进行优化编码可以为运行时解码带来很多好处。
推动 OpenCL™ 在 FPGA 上的发展
作者:
Intel
使用 Intel® FPGA SDK for OpenCL™ 技术提升性能
ANNdotNET v1.0 已发布
作者:
Bahrudin Hrnjica
ANNdotNET v1.0 已发布
C++ 虚拟数组实现,由用户系统组合显存支持
作者:
tugrulGtx
仅头文件的 C++ 工具,支持基本的数组式使用模式,并使用系统中多张显卡作为存储,带有 LRU 缓存。
最新文章
一种新的自适应可伸缩纹理压缩 (ASTC) 编解码器,
用于加速游戏中的纹理处理
作者:
Jeremy C. Ong
纹理编码器和解码器通常是游戏中带宽占用最多的部分,
并且使用 Arm 的 ASTC 编码器进行优化编码可以为运行时解码带来很多好处。
推动 OpenCL™ 在 FPGA 上的发展
作者:
Intel
使用 Intel® FPGA SDK for OpenCL™ 技术提升性能
ANNdotNET v1.0 已发布
作者:
Bahrudin Hrnjica
ANNdotNET v1.0 已发布
C++ 虚拟数组实现,由用户系统组合显存支持
作者:
tugrulGtx
仅头文件的 C++ 工具,支持基本的数组式使用模式,并使用系统中多张显卡作为存储,带有 LRU 缓存。
所有文章
文章
项目
技术博客
技巧/窍门
视频
参考
资产
顶部
按分数排序
标题
更新时间
作者
分数
GPU
一种新的自适应可伸缩纹理压缩 (ASTC) 编解码器,
用于加速游戏中的纹理处理
作者:
Jeremy C. Ong
纹理编码器和解码器通常是游戏中带宽占用最多的部分,
并且使用 Arm 的 ASTC 编码器进行优化编码可以为运行时解码带来很多好处。
推动 OpenCL™ 在 FPGA 上的发展
作者:
Intel
使用 Intel® FPGA SDK for OpenCL™ 技术提升性能
ANNdotNET v1.0 已发布
作者:
Bahrudin Hrnjica
ANNdotNET v1.0 已发布
C++ 虚拟数组实现,由用户系统组合显存支持
作者:
tugrulGtx
仅头文件的 C++ 工具,支持基本的数组式使用模式,并使用系统中多张显卡作为存储,带有 LRU 缓存。
比较编程模型:SYCL和CUDA
作者:
Dhruv__Patel
在本文中,
我们将比较和对比SYCL和CUDA,
并讨论oneAPI编译器如何与SYCL协同工作。
跨架构能力:用 GPU 进行思考
作者:
Roger Winter
在本文中,我们将探讨开发人员如何利用 oneAPI 的跨架构能力,在他们的应用程序中利用 GPU 资源。
低功耗微控制器上的深度学习 AI:使用 TensorFlow Lite Micro 在 Arm Cortex-M 设备上进行 MNIST 手写识别
作者:
Raphael Mun
在本文中,我们将构建一个功能齐全的 MNIST 手写识别应用程序,使用 TensorFlow Lite 在低功耗 STMicroelectronics 微控制器上运行我们的 AI 推理,该微控制器使用基于 Arm Cortex M7 的处理器。
使用 CNTK 和 C# 进行描述性统计和数据归一化
作者:
Bahrudin Hrnjica
如何计算数据集的一些基本统计操作。
Direct3D* 12 - PC 上的控制台 API 效率和性能
作者:
Michael Coppock
在 GDC 2014 上,
微软发布了令人惊叹的消息,
宣布 2015 年 PC 游戏将迎来 Direct3D 的下一代版本——
Direct3D 12。
D3D 12 回归底层编程;
它赋予游戏开发者更多控制权,
并引入了许多令人兴奋的新特性。
DirectX 11 计算着色器
作者:
Asif Bahrainwala
HPC 通过计算着色器(GPGPU)。
发现 oneAPI 如何革新编程
作者:
Intel
这不仅仅是今天的架构和明天的架构之间的关系,而是今天的架构与明天的架构之间的关系。oneAPI 有潜力成为编译各种架构代码的行业标准。
使用 OpenMP 高效异构并行编程
作者:
Elmira Volkova, Alexander Bobyr, Igor Ermolaev
在本文中,我们将计算分配给主机 CPU 和独立 Intel® GPU,使两个处理器都能保持忙碌。
AMD GPU 的 GCN 汇编器
作者:
Ryan Scott White
AMD 的 GCN(
Generation Core Next Architecture)
汇编语言的汇编器/编译器
Gelid Icy Vision Rev 2- GPU 散热器
作者:
DaveAuld
替换的 GPU 散热器——冰凉还是热得受不了?
生成式 AI 游乐场:在最新的 Intel® GPU 上使用 Camel-5b 和 Open LLaMA 3B 的 LLM
作者:
Benjamin Consolvo
本文探讨了大型语言模型(LLM)在各种应用中的使用,例如聊天机器人、代码生成和调试。
开始使用 Intel® OpenVINO™ 工具包和 AWS Greengrass
作者:
Intel
本节介绍了使用 Amazon Web Services (AWS) Greengrass 和 AWS Lambda 软件的 FaaS 推理样本(基于 Python 2.7)的实现。
通过 OpenCL™ 实现异构计算
作者:
Intel
本文是关于将工作负载分派给平台中的所有 OpenCL 设备,以共同完成计算任务的方法的循序渐进指南。
使用 Vulkan API 为 Android 移动游戏开发实现高性能计算机图形
作者:
Raphael Mun
在本文中,我们将简要介绍两个使用 Vulkan 最大化游戏图形性能的示例。
如何确定是否充分利用了您的跨架构实现
作者:
Dhruv__Patel
在本文中,我们将研究开发人员如何使用 Intel® Advisor 和 Intel® VTune™ Profiler 来有效地卸载到 GPU 并优化其跨架构应用程序。
Intel® RealSense™ SDK 背景分割功能
作者:
Intel
本白皮书介绍了开发人员如何集成 Intel® RealSense™ SDK 背景分割 (BGS) 中间件来创建新的沉浸式协作应用程序。
介绍区块链中的挖矿过程
作者:
Packt Publishing
比特币挖矿过程。
您的游戏是否受 GPU 限制
作者:
Intel
在本文中,我们将介绍一种快速简便的方法,通过高级系统概述来查看您的游戏是否受 CPU 限制。
学习现代 OpenGL
作者:
Bartlomiej Filipek
一篇关于现代 OpenGL 的小型指南,
以及它为何能给我们带来如此大的价值。
使用 CNTK 和 C# 进行线性回归
作者:
Bahrudin Hrnjica
使用 CNTK 和 C# 进行线性回归。
优化 Intel® Atom™ 平台上 Android 游戏 mTricks Looting Crown
作者:
Android on Intel
本文展示了如何分析和改进移动游戏性能,以及如何使用 mTricks Looting Crown 作为示例,为移动平台优化图形资源。
在 5 分钟内将 CUDA 应用移植到 oneAPI 和 DPC++
作者:
Jeremy C. Ong
快速的 5 分钟教程,介绍如何将 CUDA 应用移植到数据并行 C++ (DPC++)
在 C++ 中对数组结构 (SOA) 的元素进行排序和删除
作者:
Igor Gribanov
C++ 迭代器和算法对容器效果很好,但我们能否对数组结构进行排序?
稀疏程序化体积渲染
作者
Doug Mcnabb
稀疏程序化体积渲染(SPVR)是一种用于渲染实时体积效果的技术。我们很高兴即将出版的《GPU Pro 6》一书将包含一个 SPVR 章节。本文档提供了一些额外的细节。
SYCL和OpenCL
作者:
Sergiu Oprea
SYCL和OpenCL之间的区别和相似之处
Touch Response Measurement,
Analysis,
and Optimization for Windows Applications
by
Tom Pantels
本文描述了两个应用程序,
这些应用程序演示了诸如触摸响应时间差或无响应以及高能耗等问题,
这两个问题都对应用程序性能和用户体验至关重要。
然后,
我们将讨论如何优化这些应用程序以解决这些问题。
在 Intel® Arc™ GPU 上进行 TensorFlow 的迁移学习。
作者:
Intel
使用 Intel® 消费者 GPU 和 Windows* Subsystem for Linux 2 进行快速简便的训练和推理。
坦克世界:现代图形需求的自动化性能测试
作者:
Pavel Busko
Arm Mobile Studio Pro 允许我们在 CI 服务器上执行自动测试时记录 Mali 系列 GPU 的硬件计数器,帮助我们解决任务。
©
. All rights reserved.