|
|
芯东西(公众号:aichip001)
$ Q+ o7 s$ T; _作者 | ZeR0
. {" r" h& \5 P' C3 p0 G2 {编辑 | 漠影
9 j% b* s$ h. F% E; h芯东西 6 月 15 日报道,又一家国产 GPU 公司的新品出鞘!今日下午,中科恒星(简称 ATS)宣布推出国产自主 GPU 架构 " 天狼星 "。
8 k5 j4 [& t* T' E5 v2 }$ N2 ^
& k1 L- B, v, p N* ^+ s7 W" x2 ^7 E; b
; V6 Q/ V" K) p+ _4 @: y6 B3 Z
▲邓仰东博士介绍 " 天狼星 "GPU 架构+ |/ T8 f3 G& _. z/ f- U
中科恒星成立于 2019 年 8 月,致力于自研核心图形架构 GPU 芯片,提供芯片产品和相关系统解决方案。其研发团队由卡内基梅隆大学电子与计算机工程博士、清华大学软件学院、微电子学研究所副教授、NVIDIA 合作教授邓仰东博士带队。2 I8 U( O) c$ C* V! Q" k. U
邓仰东是 GPU 通用计算最早研究人员之一,被誉为 "GPU 通用计算先行者 ",长期从事图形处理器体系结构、并行计算研究和芯片产品开发工作,曾设计出全球第一个基于 FPGA 的 GPU 仿真平台,研究成果在 ISCA、MICRO 等顶级会议和期刊发表;撰写过多部教材和专著,其中《异构处理器 OpenCL 编程导论》是国内 GPU 异构计算第一部教材,《3-Dimensional VLSI》是三维集成电路的第一部专著。
3 R- {) N3 B9 H8 ^' _: h- k谈及给 GPU 架构取名为 " 天狼星 " 的原因,中天恒星创始人黄永博士说:" 我们的架构全部是以恒星来命名的。Stellar 是恒星、星宿、星座的意思,引申出来有超一流、卓越的含义。第二代架构命名为大角星;大角星是第二亮的恒星。只是因为距离地球更远,所以看起来没有天狼星亮;实际上,大角星比天狼星更亮,其亮度是太阳的 110 倍。"* }( j1 `/ X: `
一、三个技术优势:性价比、自主 IP、完备交付能力' N5 {' A+ ?3 i; U# b
由中天恒星联合创始人、总架构师邓仰东带队研发的 " 天狼星 "GPU 架构,主要有三个技术优势:
- y/ C k3 c X6 ^. M6 t# o; ^1 _第一、面向亿级订单市场,以独立显卡 GPU 芯片主流产品为突破口,瞄准需求广阔、增长强劲的亿级刚需市场,突出性价比优势。
# H; H) g# z) N8 Y& K第二、拥有完全自主知识产权,以清华大学超过 10 年研究基础为依托的自研核心架构,确保产品迭代自主可控;以基础理论研究为基础,从数学公式推导开始,从架构设计、算法模型、原理验证、硬件实现、驱动开发等环节全部正向设计;核心架构完整知识产权,已申请专利和著作权数百项,数十项已获授权;相关研究成果发表于 ISCA、Micro、IEEE TPDS、IEEE TCAD 等顶级会议和期刊。( |: X! N) E$ s/ {+ |
第三、完备的交付能力,上下游产业链准备充分,确保产品量产自主可控;芯片设计完成全面验证,确保流片成功;软硬件接口符合国际标准,确保芯片装机即可使用,包括操作系统认证:Windows WHQL;API 认证:OpenGL Conformance Test;外围接口认证:HDMI DP CTS;专业测试认证:PHY layer 和 LIINK layer;质量体系认证:显卡 3C 认证(中国)、 日本 VCCI 、欧盟 CE、 美国 FCC。
; J4 }9 J$ e. H
, L; R3 e+ H6 V' x, C, n; m4 p. Z5 @+ N* K) V
5 E4 x& q1 L7 D1 ^, ?8 c
▲邓仰东博士分享图形 GPU 市场及规模2 m5 C( r% P5 p+ m. U* y
国际信息显示学会中国总裁 fellow、俄罗斯工程院外籍院士、国际信息显示学会北京分会理事长严群博士现场分享说,今天看到的显示内容,显示的所有都在显示的平面上,没有跳跃出平面的状态,最大的问题就是它的互动性没法体现。我们现在逐步进入到下一代显示,显示的内容不仅在平面上,而且可以跳到空间上,跟人进行实时影像交互,预计五年到十年可能就会到来。他谈道,做空间三维影像对数据量的要求非常大、计算需求非常大,这个生态是非常需要有高算力的图形化处理硬件。
n- w2 r0 r7 b4 g- g7 F7 d x 二、七大架构亮点:灵活优化的指令集,支持物理真实渲染,片上互联架构1 A( P; H B! ^* M7 ^ a8 c
" 天狼星 "GPU 架构亮相,该架构有七大亮点:1 K Y: I+ B& c/ y! E4 w
一是具有 3D 图形引擎 +2D 图形加速 + 视频引擎。
3 P/ O B/ `; x( B二是自主可控 / 灵活优化的指令集和 VLIW/SIMD 机器指令集(ICCD ’ 13);其中,自主可控 / 灵活优化的指令集,保证 GPU 芯片迭代的软件兼容。1 l. ]7 t& `+ @% r
三是 SIMT 计算框架,充分利用图形应用的数据并行性( DATE ’ 12.ICCD ’ 13,TVLSI15)。
, B4 J( w! o( W. I6 G. R) J四是支持物理真实渲染 ( ACMComputingSurvey ’ 14,SIGGRAPHASIA ’ 14.15)。 v( ?* Y5 `2 E, k: t/ J7 M+ r
五是 Shader Core(Graphics ProcessingCluster),包括 SIMT 独立指令执行单元、以 32 位浮点 ALU 为基础的统一图形架构(ICCD13)以及集成寄存器堆、纹理 / 数据缓存。
p7 j; r, S4 _2 m% i- E六是延迟聚集式全局线程调度技术(ISCA20、TPDS21、TCAD ’ 21)。5 W% E3 d& }3 ~
七是具有良好性能伸缩性的片上互联架构(MICRO ’ 20、TPDS ’ 21)。- I$ J& n+ Z- z3 \$ }$ }7 v
" 把自己的钱掏出来做这件事,把整个产品、公司的命运和自己的命运联系起来,这是我看到比较少的," 上海市集成电路行业协会秘书长郭奕武也来到现场表示祝贺," 他们非常踏实地在做事情,我觉得在这个方面值得大家学习,也是值得大家肯定的。"
7 v8 |0 f5 `6 t. `% n他总结说,中天恒星自研架构有几个特点:一是 3D 图形渲染,二是指令集的自主可控,三是框架结构,包括在整个储存器当中的 DDR4,中天恒星都用上了,决定了其未来的产品、用途非常广泛,而且可以用在各个方面。, I W" f1 G$ k) Y6 S$ X
三、核心图形引擎完全自主设计,不涉及第三方 IP$ D5 `% x5 s9 c* [2 i
当前,Imagination 和 Vivante 两家公司是主要的 GPU IP 来源,这些 IP 主要是针对移动应用的 GPU 内核,不适合桌面应用。此外,购买第三方的 IP,难以形成成熟的图形显卡级 GPU,核心电路专利无法自控和自主迭代。8 ^! Y/ b' u# K% W0 J" ^. X
邓仰东谈道:" 很多国产的 GPU 的 IP 授权主要购买的第三方。中天恒星的路线有所不同,核心的图形引擎完全自主设计的,所以 3D 图形引擎这块不涉及到别人的知识产权,也没有 IP 的问题,全部是我们自己拥有,从 0 到完整架构的实现,都是我们自主的技术。"- y1 A, G/ K4 ?( |& F6 T
自研 GPU 架构存在极高的技术挑战。据邓仰东分享,GPU 设计有几个地方非常复杂:, c1 n" y w8 { {$ @( [" Z
一个是架构级的设计,这其实是个统筹的艺术。GPU 本身的资源,在所谓的 uni 版的 shader,所有的计算资源是一样的,大家都用 32 比特或者 64 比特的浮点运算单元,这是一个配合的问题。
$ W- `/ t+ @) n有很多个核共享 L2 的 cash,然后每个核内有自身的计算单元,还有通往片外的各种通道,实际上片上还有一些针对图形的,比如像纹理的缓存;这些虽然很容易知道是什么样的模块,难的是如何配合起来实现整体性能最优。
/ r" e6 ^3 h! T0 l! n" [换言之,如何通过统筹协调,能够适应绝大多数图形应用。在大多数情况下,均衡的设计保持性能每秒至少 30 帧,这是一个极具挑战的地方。
+ i: Z9 l) ], z q- k5 A二是架构仿真的时间非常长,需要经验也需要直觉,去找出架构问题到底出在哪里。这是一个很大的挑战,需要有多年的积累才能去做这件事。) o4 T& y' z! S+ c" Y( g+ C
结语:四年潜心研发,2025 年量产第二代 GPU 架构
: ~; i1 ^6 L0 o" v+ r" 天狼星 "GPU 架构并非一蹴而就,而经历了长期耕耘:2019 年,第一代 " 天狼星 " 架构芯片设计验证完成。2021 年,第一代 " 天狼星 " 架构 GPU 诞生;2022 年,定义第二代 GPU 架构 " 大角星 ";2023 年,第一代 " 天狼星 " 架构 GPU 实现量产。1 j* c% y3 ~5 @% `+ W2 q
据悉,2024 年,中天恒星会继续优化基于 " 天狼星 " 架构的 GPU。2025 年,将量产第二代 GPU 架构 " 大角星 "。7 h1 C, ]: s5 g0 J$ ]- C
中天恒星将提供 GPU 芯片、板卡和系统解决方案,以 PC 标准市场(包括台式机、一体机、笔记本电脑和部分服务器)为核心目标,逐渐拓展至大屏电视、数据中心、云渲染和车载智能系统等市场。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|