通过VTune性能监控浅析高模3D渲染中CPU缓存内存对性能的影响

1. 前言

其实万恶之源就是各家渲染工具测出来各个cpu的效率明显不一样。初步分析cpu之间的差距和模型(包括光源和高级贴图等因素)关系最大,和不同渲染器和渲染方式关系不大。但是这个差距是为什么产生的,也就是不同模型的“性能特征”区别,仍然是个疑问。

为了弄清楚这个问题,从而搞清渲染应该用什[……]

阅读全文

EPYC2 ROME拓扑结构测试分析方法

概述

AMD目前对自家企业级EPYC2 CPU北桥的设计一致三缄其口,只是承认了它只是分为4个节点(quadrant)拼成,每个节点负责自己的内存pcie总线等;如果应用是numa-aware的话可以开启NPS-2或者NPS-4,使得每个(或者每2个)节点只存取各自分配的内存通道而不需要经常跨节点[……]

阅读全文

这些新型存储器将再造AI算力!

之前的计算时代(大型机/小型机、PC/服务器和智能手机/平板电脑)都受益于摩尔定律的进步,即2D缩放同时伴随着性能、功耗和面积/成本的提高(也被称为“PPAC”)。

当人工智能应用蓬勃发展时,摩尔定律正在放缓;因此,该行业需要突破2D缩放,以新的方式驱动PPAC。具体来说,我们需要新的计算架构[……]

阅读全文

存算一体化怎样突破冯·诺依曼架构?

在讨论超越冯·诺依曼计算架构之前,最好先解释一下冯·诺依曼计算是什么。首先介绍一下摩尔定律的背景知识。

作为一个行业,我们已经通过摩尔定律在降低芯片的尺寸、成本和功耗方面取得了巨大的进步。从1956年Univac I(第一台商用电子计算机,每秒1900次浮点操作消耗125千瓦)到今天的超级计算[……]

阅读全文

特斯拉的蚁穴

参考文章:Flash Memory Wear Killing Older Tesla’s Due to Excessive Data Logging: Report   — from Tom’s hardware

 

随着使用时间的增加,传统汽车尤其是引擎部分会逐步老[……]

阅读全文