构建自动优化工具Halide

随着人工智能,VR等领域的发展,我们对于高性能图像处理程序的需求越来越大;当前编程工具开发的高性能图像处理程序牺牲了程序的可读性,模块性,可移植性等;其主要原因是,当前程序将算法描述, 数据存储以及计算糅杂一起。同时手工编写高性能图像处理程序开发效率较低,难以快速构建大量高性能图像处理代码。[……]

阅读全文

浅析Rogue架构

随着人工智能的飞速发展,和业界对人工智能项目落地的巨大需求,移动端GPU的竞争也日益激烈,除了来自各GPU厂商之间的竞争之外,也要与专用芯片展开竞争(例如寒武纪的NPU等),可谓群雄逐鹿。

在之前的一篇浅析移动端GPU的文章中介绍过移动端GPU领域主要的三家厂商。随着苹果弃用PowerVR,在[……]

阅读全文

CPU性能发展遇到的瓶颈

通常一个处理器通常包含多个核心(Core),集成 Cache 子系统,内存子系统通过内部或外部总线与其通信。在经典CPU中一般有两个常用的组件:北桥(North Bridge)和南桥(SouthBridge)。它们是处理器和内存以及其他外设沟通的渠道。图1给出了处理器、内存、南北桥以及其他总线之间的[……]

阅读全文

[馊评测] NVMe SSD功耗测试

近期我们使用DriveMaster对几款NVMe SSD的进行了功耗测试,具体步骤如下:

  1. 设置SSD的Power State
  2. 格式化SSD
  3. Idle 10分钟,并测量其工作电流
  4. 进行随机写 盘容量的20%,并测量其工作电流
  5. Idle 1分钟,并测量其工作电流 (时间[……]

阅读全文