|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
6 o1 x; C. P; S" z! n1 g) F% P- } 这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。4 {, y+ f0 q9 w, h3 ^7 N
一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。& y+ u" m" y& `: C H1 z! z3 O7 \7 j
但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
: t3 d& M: T8 j( S! ? / G$ @/ b4 m; n" l( g( c2 `
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
+ z+ {5 M1 L/ ?2 q: {1 g 不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。. W6 J* Q2 ?+ W3 `
在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
7 e! m7 B6 ?6 _ 研发人员占绝大多数' C+ t! h" M) {4 G# v
从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。7 P( r. J1 k; e5 j% S' D* R/ C
预训练部分的工作细分为:
) T9 J0 U$ w* o6 q9 f6 Q3 } 计算机集群扩展(Compute cluster scaling)
5 ^- ^5 E$ f* j1 \) ^' Y1 M 数据(Data)6 V$ O* M- u4 m6 G8 j. X6 x
分布式训练基础设施(Distributed training infrastructure)
( Y- m9 G' F8 Y: _* W 硬件正确性(Hardware correctness)
3 z) {4 E* u; _, U; Y# \1 z, L b 优化 & 架构(Optimization & architecture)
) i. T2 a( n+ ~1 T: j& i Training run babysitting
, \" R/ k3 U& A" D2 m 长上下文部分的工作细分为:
/ k# a* a( V8 y0 g# o7 d 长上下文研究(Long context research)
' M) X( H9 J1 S5 [2 D+ K8 [0 B8 Q 长上下文内核(Long context kernels)& j' P9 p4 h& W8 y
视觉部分的工作细分为:
2 R6 h( V$ j% O$ Y3 X 架构研究(Architecture research)5 Z& a/ p- T) V' v+ f
计算机集群扩展(Compute cluster scaling)+ }, n/ g$ s1 _ o
分布式训练基础设施(Distributed training infrastructure)
$ W3 A1 F/ B# f! q 硬件正确性(Hardware correctness)4 Q3 T: T2 v6 h3 c. h3 M% Q
数据(Data)
$ m# `. T1 V' V 对齐数据(Alignment Data)
- s% x2 A! M: c- M8 Z1 f6 { Training run babysitting8 d4 \) J* `$ ^2 d9 T
部署 & 后训练(Deployment & post-training)0 v' J7 X3 y! p7 t# E. G! p
强化学习 & 对齐部分的工作细分为:9 c& Q% F. b7 t8 @8 b, {' S
数据集贡献(Dataset contributions)* v; R) t" }/ y$ O
数据基础设施(Data infrastructure)
: J6 g5 y: ]+ ?% Y1 ?$ f r% ^% m" L ChatML 格式(ChatML format)
+ B, d4 W) `% a 模型安全(Model safety)
% \- ^) l8 J# K% z$ @ Refusals
& x, _- f0 X$ [" j8 C$ |% V1 } 基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
# I; S; q4 g" K, y' s Flagship training runs
9 r0 ]3 }: R) p s( @, F6 V 代码功能(Code capability)
# ]' u* c3 a5 ]- V7 A* N, M: ?- N1 @ 评估 & 分析部分的工作细分为:6 {5 k9 ?- K/ Y+ H. ]
OpenAI Evals 库
& r3 _; K& ]: f3 x2 P" ^5 s' B+ Z 模型等级评估基础设施(Model-graded evaluation infrastructure)2 ?2 w1 D! o3 ]# t& C3 ~4 T. O( P" ^7 a7 u
加速预测(Acceleration forecasting)1 n5 j& s) W( h, {$ o; l% N9 P' m
ChatGPT 评估9 W! j5 b! Q3 z' J
能力评估(Capability evaluations)" P9 h' Q7 h+ `1 a* Y, C) D
编码评估(Coding evaluations)5 T! O) H. L1 i8 k
真实世界用例评估(Real-world use case evaluations)0 Q/ Z8 F! G* v" B0 |3 e
污染调查(Contamination investigations)
* n7 \* e5 U8 k( E* W) L" l 指令遵循和 API 评估(Instruction following and API evals)1 J. ]- a W1 D! y
新功能评估(Novel capability discovery)
$ b; }- ?3 }) q ……
2 H$ u1 t- o9 r1 [; Q' V 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
/ {1 h- ^8 e: n' ^' M" A* F 在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
% O g# q& d w+ ?. K 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。, N. ?" |2 n, I J% V9 S. L. D
* X; ?6 I+ z9 a+ z3 ?( A 鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
& n0 m% E' C/ |# h) [" n5 o 预训练组4 r! I# d: o: g7 Y" Z- {( @
Trevor Cai
2 N% ?" W2 A0 }" Q: G Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。. E4 }9 d5 A$ J B/ U0 J3 w& D
袁启明* V! d( X# ~" H( J# X, y
6 \. D5 x2 ?( X! J( v3 }7 J 袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
E0 h7 }+ @! g: U* l Che Chang
1 A% T: T# N- `( c Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
2 q7 [' q* b$ S, e 欧阳龙# I. m+ W3 e# |- _ w2 Z1 g
欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
: B# Y/ S( w0 e) Z7 }; m 翁丽莲1 d8 L: T# d: k2 U0 D7 u
3 N2 N* Z8 W; w. w5 }" b 翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。# F8 y/ \8 U+ @3 \1 m1 n# E( z; v8 _
Tao Xu
+ P! Z9 X& e: J, o, Y+ L6 @ Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。& z0 j2 X- }4 G* @/ B
Jie Tang
& X3 L) z# {1 N8 n & |. P3 ~/ D" I1 {
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。3 f! A4 T, U3 T
Ben Wang
. O+ ]' A2 S) n& v0 j8 m* A4 h+ F: l Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。: I# Q& u( |4 n9 H% h2 h6 ]1 Q
视觉组
+ P# v O. I1 I* M# i) \ Mark Chen2 C. h1 S$ k0 L( s' n& p
8 Y& x! w1 u# I- u) a( @; d
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
0 P" @/ x# {$ d1 n, L1 ^' J Casey Chu
9 Q; F" `" z7 J! F+ L% ?5 U) }5 G; ~$ R Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
& i/ m( _1 f' i0 W ]1 l 胡绳丽
' j$ y' F. N; Z5 k3 {4 g
?9 l3 F- x9 F 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。; ]& p+ T9 f" \- {
Tianhao Zheng
! D0 a( |1 x/ \8 e1 Z Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
) d3 ~; n/ Y( S/ E8 Y. p& r 翁家翌5 M5 a; H7 U) p% y4 Z
7 A1 X) C) q P# X7 f! H
翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。& N* ~" W) ^+ |, {8 s. a
强化学习 & 对齐组: K0 k5 N! q! E8 e* Z
Chong Zhang
7 }6 ? p- ~* d8 B3 D$ E % ?. P7 I4 ^+ Q
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
. G" T; [# A, k9 O" t3 V6 e9 G Shengjia Zhao, J. j1 W1 Y, Y# K# d
/ I* K X* ^' \ Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
9 d6 N9 G* c( D, N( o( _5 Z Stephanie Lin. `, a) K4 Z, g" L5 i+ k
+ V1 t! i# t$ C: f7 ?/ l Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。/ n" R% r/ m* f, N; {5 q
Tong Mu5 h: R8 p+ A6 H; \0 f
$ z7 m8 W1 n+ l2 g! w% w4 J Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。; j5 i }+ t, l- s6 X: |; U; p8 i
Jeff Wu3 T* T8 ?; |( M
; K9 [1 p4 E; @& i$ e( ] Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。& g0 b6 u$ E5 K$ Y9 j( I s
肖凯
$ j6 {- u9 |# f+ R' M; H
+ m( X# K* n* |+ O; B, N 肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
9 w! e1 R; C2 {* c. z Kevin Yu* |) B% N. G0 h, [9 J9 E
; g0 S7 D& u' Z; d! N0 t1 x Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
3 P& } ^# @4 b) Z) b" u# K Haozhun Jin# C g2 j+ z) l3 O
p- p$ Y6 w! z' X
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。1 H2 F2 V! X! V1 ~
顾世翔4 d; Z, b! p" j' u" c2 g
# h/ Y% t7 C* w+ c: |: L4 P 顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
/ k" {8 j/ p! h3 U! W6 p5 V# c 评估 & 分析团队4 a! b: f/ t4 K& K
Alvin Wang
0 I7 v" g' z# ]: K8 X. T
) u% H O& Q6 C' B! ?) G Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。6 T( g4 l3 H, {! `4 G2 ~% I. l
Angela Jiang
( ` _8 \* I8 j/ J" a
6 [- j n* m9 B8 r Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
+ v% G! |: { ] Jason Wei
1 b7 M6 W! r& e: r! X/ }. Z" r 8 S2 S& {9 T4 \
Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。 u: }% i4 I6 a' q
Juntang Zhuang/ G) I3 J6 ]2 K! a
( K- M( _, V* l' j1 y% M Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。/ Q3 c% I) L8 J; U% i! U
Derek Chen
5 e/ V$ Q* ^( @+ `+ G
2 u" W- l' D0 C+ i E! N, I5 Y Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。' \' e# u; l- H! a7 s& s7 O
宋飏1 H! M' ]* P5 s6 @
$ B ~( D6 ?+ L
宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
* h) |- E R% h0 z& P0 J 模型部署
3 b- G) l1 n/ f3 T5 W Michael Wu7 \ k6 u5 I$ X- j
\# n6 l6 f( A. Q J& ]
Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。( v5 J' P% Q0 r5 O# z
Andrew Peng8 X! `5 m+ A3 C" D8 k! r1 y
1 f1 ?, t7 R& T Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。2 r" x& R1 J7 O& x) m+ g) U0 p# r
吴雪枫# x. Z9 ^! U ^- q" W1 g5 z
: i5 s$ {$ ?. `" C* \/ T+ n 吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。4 S# S; O# |" |
Jason Chen
, S2 w7 @* m8 e' G. A) Z
$ O0 [& E& ~$ ~% m8 n! H Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。, b7 p$ [+ L* m, Y0 o5 W
其他贡献者
, \2 z1 G; x. y6 p Xin Hu
, @% b4 y( p! |8 k) g : B' K2 j! L% c: x( J, @
Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。: ^ v. y5 a M* w) B
此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。* B4 G5 f. q+ S n! @
参考链接:
# {+ J6 \) B. @# E$ B) m4 M1 _ https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
' y3 i% \6 }" p% d/ x) n https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|