京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 876|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。3 x% f& X6 M7 w* Q/ u7 \. k' s
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
2 @* J1 Q: W; B2 y& {            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
/ v' p( _/ g& A3 q# {) v            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。6 D/ T8 w4 z; K' k8 i; \
                        
4 [7 u7 d3 c' f  N            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
4 L- o8 I  g  ]- A" {% T8 }/ g            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。& K0 Z6 C7 f+ f. l$ h$ L
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。8 A) u1 L& A8 [2 i) u
            研发人员占绝大多数
3 i( B# o% X: R) L; ?, d            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
$ L1 [# g$ u; _/ ^            预训练部分的工作细分为:
: S. o- r2 r! r6 v& |1 |- n; ~            计算机集群扩展(Compute cluster scaling)
) K' t1 }/ \0 x4 H/ r. ]0 A. O% T            数据(Data)
7 V8 ]4 z, K0 G/ L# L3 R. X) [6 {            分布式训练基础设施(Distributed training infrastructure)
% k. E" Q4 L8 |% f% H9 E6 I            硬件正确性(Hardware correctness)4 `  [$ S: v0 F$ r! H
            优化 & 架构(Optimization & architecture)
- P- R. @1 F0 W& Q2 S# z            Training run babysitting
/ x/ |  v8 R4 u1 _  ~& |            长上下文部分的工作细分为:5 f1 c1 T! g( O( }8 w6 H# F; |
            长上下文研究(Long context research)
* b" T& H4 Y" U, _% B8 C  e" l            长上下文内核(Long context kernels)' ~9 J" L1 |. w+ m7 F# w2 z3 c
            视觉部分的工作细分为:/ q* {% e+ a! I) s
            架构研究(Architecture research)2 h+ F, L7 _5 T' K' `- k
            计算机集群扩展(Compute cluster scaling)
( j3 ~7 Z9 {  R6 C7 T; ?0 E            分布式训练基础设施(Distributed training infrastructure)# j, R1 b) G% u3 A; T8 X+ A( {
            硬件正确性(Hardware correctness)
  e) s. j5 `# K! D' A# Q$ |            数据(Data)8 Q( w5 u3 S& P! K% U2 Y* x
            对齐数据(Alignment Data)
& M) }* k& S" a, X3 T            Training run babysitting
- W4 W: R! m( W% n. \            部署 & 后训练(Deployment & post-training)3 P* I; S1 g: b1 W$ L/ @
            强化学习 & 对齐部分的工作细分为:
. h* |+ p4 A2 A/ z  l  ]            数据集贡献(Dataset contributions)4 T9 k( G" n" m& o& {8 C. x, A# T
            数据基础设施(Data infrastructure)
3 t8 I# ?& G$ {; y: E8 E            ChatML 格式(ChatML format)0 o. b, }& w" Q7 V
            模型安全(Model safety)
: R; J2 t. q" N6 M            Refusals
4 V3 w; J  ^9 D) X- ~1 P            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)5 |- `  x; B# {
            Flagship training runs) q! R9 o' P6 T0 S. Q; d+ `
            代码功能(Code capability)
# \) ^4 F- Y$ q7 w6 s            评估 & 分析部分的工作细分为:$ y3 G6 f4 u5 y  c; M$ q8 L( I
            OpenAI Evals 库
5 i- l  B3 d6 K/ Q            模型等级评估基础设施(Model-graded evaluation infrastructure)
5 ^9 }4 V% b0 H7 s8 R            加速预测(Acceleration forecasting)2 H& N. S1 W% q, Y2 B$ c
            ChatGPT 评估' n/ \# y9 ]7 w9 b: E. {, g! a) `9 @
            能力评估(Capability evaluations)5 x& H: [' K7 P5 H
            编码评估(Coding evaluations)7 ]2 N9 f& x  x# w+ h! _
            真实世界用例评估(Real-world use case evaluations)
) l: I; ?6 R1 g            污染调查(Contamination investigations)
% u2 H7 b% Y% @( R/ w            指令遵循和 API 评估(Instruction following and API evals)
+ r+ ~. A' w/ r' [/ F# k0 d            新功能评估(Novel capability discovery)
& S  z1 o& d5 m1 t            ……
: i+ ~# u1 |3 k9 N1 Q" @            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。. X/ K' ~5 o. V
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
) P5 E  X/ h6 v7 G            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。: W+ e. Z; e0 T) ~5 X$ z0 A
                        
" \9 c  e: G) ~/ e' f7 r" t            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。* f3 d/ f$ D  q* j0 V
            预训练组2 Z' n0 Y2 O& z3 _3 o. N8 s- \
            Trevor Cai
2 c; X! Y# y! X; {. l6 b            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。; S. C7 z! w4 b# s& {. l( s* l
            袁启明
. F0 Q# W( l" {% E) ~; @. g                        
6 D( z* Z% q+ Z$ |- R* q2 l* S            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
0 K/ _. d: O7 ]7 N2 Y9 \7 S4 @/ v# U            Che Chang
* o2 @2 m/ A, X7 a            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
2 n( o9 d7 Y4 _            欧阳龙# `% m3 r7 B- e! r% H/ K
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
  S8 C5 ]" q) o0 s9 q            翁丽莲, I1 t2 m  s" x) y
                        
/ v$ W, V1 g5 [  J& ^8 I9 X            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。7 ^9 W: K! B7 ~
            Tao Xu
1 A; N- G: {+ ^3 }: n( J            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
0 M2 ~- u/ w- Q2 e- O! e, f            Jie Tang
& u3 V4 i  |2 L5 e. ^& R; D3 @                        ' `/ V3 l4 @0 m8 ^& x, A5 ~; n7 N
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。, N3 Q% L% B/ q
            Ben Wang
: a9 k' P3 Q7 u+ X            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。& ~# F0 L; ?3 F" D
            视觉组
' Y! {# A' M. Q1 J8 Q5 t5 \% \            Mark Chen
9 l0 t0 Z% Y) l) }0 I3 H3 s                        
3 q5 [9 V0 k6 P- q5 Q            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。% v. y1 o# N5 W( b
            Casey Chu7 y9 ~9 {8 P( W4 o2 W3 w! q
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。5 x4 @( B+ }+ ^9 L9 O  A
            胡绳丽9 N- ], `3 Y* N! L* c8 V
                        ! T0 A. H7 `0 l. X3 f# C/ h) M
            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
' Z( [7 s6 a+ l; F+ [2 _            Tianhao Zheng
0 O8 g$ C& x! X! {: b$ {            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。* K9 M' }6 @7 j( g. P& I3 p' Y5 J
            翁家翌
) Y* j8 a! W- Y& ^3 o$ k9 ]& |                        6 @  s9 _3 q' S( s$ [  i
            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
# l$ x$ l, Q9 T. R            强化学习 & 对齐组
! z+ E$ N; g- V5 `            Chong Zhang
  E* S; f% O, r) g0 E  u                        ' Q7 k0 c6 o6 K) P5 F% z
            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。/ `0 J+ z' w. {
            Shengjia Zhao
" s1 H2 f5 I* e  X                        7 h! M; D) `" m- E
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
! u) V: \% S3 s  X. _            Stephanie Lin( D6 G) p% U' Q* U) M/ o
                        
3 S* n1 z3 x; ?4 v            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。. m7 Y5 _6 i  U3 V# c" [9 ^
            Tong Mu
  m/ z8 G+ c5 {6 m: `" F                        
& Q' O' }& Y$ a            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。$ G# ^: z4 t: Q2 T; D& C
            Jeff Wu( H% y: o6 `$ A# J/ k
                        
! U1 w' p9 {2 a$ @0 {4 x            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。# v" W; |( M" ^7 g# w, j# Q
            肖凯
6 ]0 t8 ^  \  K; l                        
$ l) c( O$ X; _, |! b, `6 g7 X            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。2 o$ J$ G( X2 e, x
            Kevin Yu
% F* C9 ?$ t/ L! G* k, F                        ) }( P2 C* u% l; V  a$ M
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。3 R4 [) Z' B. n; b5 w/ J
            Haozhun Jin2 S/ P  B% ~5 ~$ H& S* S
                        " M; N/ T$ D6 e" R8 C1 S8 c# U+ W
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。7 f9 ^' v+ e2 H9 P( b( {" s
            顾世翔
4 E' B$ }" `/ I* g( b) C                        7 n* E. b% p1 `) x
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
, q2 C4 V' W5 ^. _            评估 & 分析团队9 n1 z- m( G, \' U7 s  o8 ]0 c' h
            Alvin Wang
* G8 `2 z: X+ B5 M3 g  W; v                        8 h$ I2 H9 y8 W1 g  F
            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
. q8 \2 U7 ]/ O8 a5 T            Angela Jiang
. B8 W9 i8 z5 I                        : K- T: f! a: _6 Y+ D" {
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。. d8 a' r  _( p
            Jason Wei
3 j- V( c/ D6 V3 |                        8 T( L8 G% p2 j+ Z; A5 K9 V
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。1 j- D. Z. f' n0 r2 g
            Juntang Zhuang
3 R4 s/ h$ U/ k$ m8 d                        8 I) Q) R8 q+ y' t) W
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。( H" m  {8 t) ]1 J- I* p
            Derek Chen8 V; Y) m; s) R) N) @
                        
) X, F$ m# V3 M- K            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。1 n3 a; g" h( C% {
            宋飏
- j8 b: s% X; ?$ y- S                        
; F! N7 x! h: y3 |* `: T8 }            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
3 N& |. a/ H: a            模型部署# c0 |5 r  m; L: q
            Michael Wu* {% S+ ~, m( e; G' {
                        ) ]. [' a% v/ a4 c5 _: d& V8 i! H9 \
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
) W$ P, p6 D4 E2 i/ i' X- i& i            Andrew Peng9 Y  l  a1 r& t' h
                        6 m+ k6 g- ]2 R6 ?' d5 y* J
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
1 Q2 S9 v' v/ x3 ?  ~3 e4 N            吴雪枫" |2 b) D6 A" \) ]8 F( V( v
                        
; r- N5 j3 {* R6 w            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。6 h/ [2 C7 S, f! T
            Jason Chen
1 S( [; m* m5 e% c2 s7 {8 T                        
4 ]* V/ L& t4 E1 A; b# X3 y            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。! e% f- p  s- b% E# c7 i0 x0 @& Y
            其他贡献者5 w% K! b4 G5 t6 s7 t5 O. v1 _
            Xin Hu
$ ?' w7 y; j7 ^' L& H2 L/ A                        
+ a) m% e, B& a+ `' ]2 _3 C6 K            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
0 H2 \9 r4 e$ }. ]1 w            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
  P. X8 M1 C) U' m, B+ \" w+ t' H            参考链接:0 h/ f+ U/ s3 f9 m' F0 v. y( G! J
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
" [0 w& t3 L- e5 y9 b) n& Q6 Z            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-3-25 22:12 , Processed in 0.044524 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表