通过VTune性能监控浅析高模3D渲染中CPU缓存内存对性能的影响

Posted on 2020年2月22日2020年2月22日 by Laura

1. 前言

其实万恶之源就是各家渲染工具测出来各个cpu的效率明显不一样。初步分析cpu之间的差距和模型（包括光源和高级贴图等因素）关系最大，和不同渲染器和渲染方式关系不大。但是这个差距是为什么产生的，也就是不同模型的“性能特征”区别，仍然是个疑问。

为了弄清楚这个问题，从而搞清渲染应该用什[……]

EPYC2 ROME拓扑结构测试分析方法

Posted on 2020年2月22日2020年2月22日 by Laura

概述

AMD目前对自家企业级EPYC2 CPU北桥的设计一致三缄其口，只是承认了它只是分为4个节点（quadrant）拼成，每个节点负责自己的内存pcie总线等；如果应用是numa-aware的话可以开启NPS-2或者NPS-4，使得每个（或者每2个）节点只存取各自分配的内存通道而不需要经常跨节点[……]

这些新型存储器将再造AI算力！

Posted on 2019年10月30日2019年12月3日 by Laura

之前的计算时代（大型机/小型机、PC/服务器和智能手机/平板电脑）都受益于摩尔定律的进步，即2D缩放同时伴随着性能、功耗和面积/成本的提高（也被称为“PPAC”）。

当人工智能应用蓬勃发展时，摩尔定律正在放缓；因此，该行业需要突破2D缩放，以新的方式驱动PPAC。具体来说，我们需要新的计算架构[……]

存算一体化怎样突破冯·诺依曼架构？

Posted on 2019年10月30日2019年12月3日 by Laura

在讨论超越冯·诺依曼计算架构之前，最好先解释一下冯·诺依曼计算是什么。首先介绍一下摩尔定律的背景知识。

作为一个行业，我们已经通过摩尔定律在降低芯片的尺寸、成本和功耗方面取得了巨大的进步。从1956年Univac I(第一台商用电子计算机，每秒1900次浮点操作消耗125千瓦)到今天的超级计算[……]

特斯拉的蚁穴

Posted on 2019年10月24日2019年12月3日 by Laura

参考文章：Flash Memory Wear Killing Older Tesla’s Due to Excessive Data Logging: Report — from Tom’s hardware

随着使用时间的增加，传统汽车尤其是引擎部分会逐步老[……]