7年来第一次:PowerVR GPU升级真正全新架构

简介:

在加州圣克拉拉举办的年度技术峰会上,Imagination抛出重磅炸弹,宣布了2010年以来的第一个真正 全新GPU架构,代号“Furian”。

七年前的“Rogue”架构是PowerVR GPU第一次采用统一着色器设计,如今已经遍布全球各个领域,PowerVR 6/7/8系列都是基于它衍生来的。

Furian的设计首要目标是改进功耗和性能,具体来说就是每毫瓦性能、每平方毫米性能,号称相比于7XT Plus可提升35%的着色器性能、80%的填充率性能(没说像素还是纹理)、70-90%的综合性能。

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构总览

Furian架构不是从零开始设计的,而是在Rogue的基础上全面翻新。它还是基于区块延迟渲染(Tile Based Deferred Rendering),但几乎每个模块单元、数据流、整体布局都是新设计的,比如支持多线程多任务数据执行,比如微内核固件控制,比如帧缓冲和几何无损压缩,比如新的安全和虚拟化技术,比如增强的扩展性,这对于未来深挖潜力十分关键。

新架构在最核心的ALU Cluster(算术逻辑单元丛簇)方面大大改进,尤其是在每个单独流水线内将原来成对的MAD ALU换成了一个MAD ALU、一个MUL ALU,前者可做加法和乘法,后者只做乘法。

这样的结构效率更高,也更节能——MAD ALU大得多,也需要更多资源才能喂饱。

同时,新架构将每个丛簇的流水线从16级扩展为32级,可降低控制电路负载,而且整体丛簇少了,纹理单元就可以上去了,每时钟周期的双线性采样翻番到8个。

新架构还支持尚未定案的OpenCL 2.x计算标准,以及全面支持Vulkan、OpenVX。

7年来第一次:PowerVR GPU升级真正全新架构

  ALU丛簇总览

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构布局变化

7年来第一次:PowerVR GPU升级真正全新架构

  ALU密度和效率改进:流水线翻番

Furian架构是面向未来的,可以满足7nm工艺、VR游戏、4K超高清、120fps高帧率、HDR高动态画面、神经网络等等的需求。

不过,Imagination今天只是宣布了新架构,并没有任何新的产品设计(虽然提到了PowerVR 8XT),具体还要看后续规划,以及芯片厂商的设计。

至于基于新架构的实际产品,差不多得到2019年了。

7年来第一次:PowerVR GPU升级真正全新架构

  Furian新架构来也

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构要特点

7年来第一次:PowerVR GPU升级真正全新架构

  架构变换努力方向

7年来第一次:PowerVR GPU升级真正全新架构

  PowerVR进化史

7年来第一次:PowerVR GPU升级真正全新架构

  两代架构提升对比

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构的一些核心特点

7年来第一次:PowerVR GPU升级真正全新架构

  更具灵活性

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

扩展性极强

7年来第一次:PowerVR GPU升级真正全新架构

  GPU计算增强

7年来第一次:PowerVR GPU升级真正全新架构

  单独的固件处理器

7年来第一次:PowerVR GPU升级真正全新架构

  高效率系统集成

7年来第一次:PowerVR GPU升级真正全新架构

  市场方向:下一代自动驾驶、移动、平板、变形产品

7年来第一次:PowerVR GPU升级真正全新架构

  市场方向:下一代VR/AR、AI、神经网络、深度学习

7年来第一次:PowerVR GPU升级真正全新架构

  架构汇总

 


  

本文转自d1net(转载)


相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
目录
相关文章
|
7月前
|
存储 调度 C++
16 倍性能提升,成本降低 98%! 解读 SLS 向量索引架构升级改造
大规模数据如何进行语义检索? 当前 SLS 已经支持一站式的语义检索功能,能够用于 RAG、Memory、语义聚类、多模态数据等各种场景的应用。本文分享了 SLS 在语义检索功能上,对模型推理和部署、构建流水线等流程的优化,最终带给用户更高性能和更低成本的针对大规模数据的语义索引功能。
585 60
|
存储 机器学习/深度学习 数据库
阿里云服务器X86/ARM/GPU/裸金属/超算五大架构技术特点、场景适配参考
在云计算技术飞速发展的当下,云计算已经渗透到各个行业,成为企业数字化转型的关键驱动力。选择合适的云服务器架构对于提升业务效率、降低成本至关重要。阿里云提供了多样化的云服务器架构选择,包括X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器以及高性能计算等。本文将深入解析这些架构的特点、优势及适用场景,以供大家了解和选择参考。
1508 61
|
11月前
|
存储 运维 Java
官宣 | Fluss 0.7 发布公告:稳定性与架构升级
Fluss 0.7 版本正式发布!历经 3 个月开发,完成 250+ 次代码提交,聚焦稳定性、架构升级、性能优化与安全性。新增湖流一体弹性无状态服务、流式分区裁剪功能,大幅提升系统可靠性和查询效率。同时推出 Fluss Java Client 和 DataStream Connector,支持企业级安全认证与鉴权机制。未来将在 Apache 孵化器中继续迭代,探索多模态数据场景,欢迎开发者加入共建!
933 8
官宣 | Fluss 0.7 发布公告:稳定性与架构升级
|
10月前
|
人工智能 安全 Cloud Native
Nacos 3.0 架构升级,AI 时代更安全的 Registry
随着Nacos3.0的发布,定位由“更易于构建云原生应用的动态服务发现、配置管理和服务管理平台”升级至“ 一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台 ”。
|
7月前
|
存储 SQL 消息中间件
从 ClickHouse 到 StarRocks 存算分离: 携程 UBT 架构升级实践
查询性能实现从秒级到毫秒级的跨越式提升
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
34_GPT系列:从1到5的架构升级_深度解析
大型语言模型(LLM)的发展历程中,OpenAI的GPT系列无疑扮演着至关重要的角色。自2018年GPT-1问世以来,每一代GPT模型都在架构设计、预训练策略和性能表现上实现了质的飞跃。本专题将深入剖析GPT系列从1.17亿参数到能够处理百万级token上下文的技术演进,特别关注2025年8月8日发布的GPT-5如何引领大模型技术迈向通用人工智能(AGI)的重要一步。
806 2
|
8月前
|
存储 JSON 数据处理
ClkLog埋点与用户行为分析系统:架构升级与性能全面提升
随着越来越多企业在实际业务中使用 ClkLog,数据规模和分析需求也不断提升,部分用户日活已经超过10万,为了顺应这一趋势,ClkLog 秉持 “开放透明、持续演进”的理念,推出了迄今为止最重要的一次性能优化升级。新版本在大规模数据处理与复杂查询场景中,性能表现实现了跨越式提升。经过多轮研发与严格测试,新版本现已正式上线:在原有付费版 1.0 的基础上架构全面升级,并同步发布全新的 2.0 版本。为用户带来更强的性能与更广的适用场景。
|
11月前
|
存储 关系型数据库 数据库
高性能云盘:一文解析RDS数据库存储架构升级
性能、成本、弹性,是客户实际使用数据库过程中关注的三个重要方面。RDS业界率先推出的高性能云盘(原通用云盘),是PaaS层和IaaS层的深度融合的技术最佳实践,通过使用不同的存储介质,为客户提供同时满足低成本、低延迟、高持久性的体验。

热门文章

最新文章