|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。, F5 O) }! Z& i* U6 R% x1 @
这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。: y( C# v* s4 n7 J! T1 A
一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。5 o+ j; ]! w$ n' e% F' M: C8 q6 l
但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。3 A* {8 q5 O' K2 o& j4 i8 l
x9 W: S' G J. G. e5 u 鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
; ^) I k0 H* }$ O% j5 X8 ]3 z 不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
F. w ]" j* N2 P 在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。$ @( v/ s- f/ R' ?$ w7 ~1 t8 \
研发人员占绝大多数
7 a8 f# _. z1 M' s9 U 从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。1 Y0 L( `/ b+ J- {
预训练部分的工作细分为:4 `8 w1 K/ [' D2 c6 ?2 S& [
计算机集群扩展(Compute cluster scaling)6 g% y6 \/ m" e, [
数据(Data)
/ K" n. [: w: s; m. D: X 分布式训练基础设施(Distributed training infrastructure)8 ^8 c5 F5 P, j3 U# w4 H8 o _1 A) R w
硬件正确性(Hardware correctness)
6 ^$ L2 E# b: _+ c- \" Y 优化 & 架构(Optimization & architecture); z) K: `" t' l" T) L
Training run babysitting( T/ R" W* t9 B/ ~+ k
长上下文部分的工作细分为:0 F" }( \% w% g' U/ A8 g9 v! X' |
长上下文研究(Long context research)
# ?" S& I. ?# o7 V+ d2 ? 长上下文内核(Long context kernels), a) b; y. d- a. `, t: u, k9 s
视觉部分的工作细分为:
$ B+ Z1 c9 N3 _7 C, y. Y5 J7 c/ n 架构研究(Architecture research)7 ~3 u: ^# b, M( z- y; g0 |
计算机集群扩展(Compute cluster scaling)
1 k5 p, B) h( a( z( d& [ 分布式训练基础设施(Distributed training infrastructure)& V8 k* F* z7 w2 O
硬件正确性(Hardware correctness)
0 |$ k3 N" w: O5 I5 ] 数据(Data)8 x$ P+ K3 E8 g& e$ o. b
对齐数据(Alignment Data)9 n4 K: C& F' h( |
Training run babysitting" Q U, U1 O; S" A
部署 & 后训练(Deployment & post-training)
) e Q# e0 |$ C2 V0 ? 强化学习 & 对齐部分的工作细分为:8 w! f, W; ~+ m* O+ M! O5 m
数据集贡献(Dataset contributions)
" B, r6 u# A4 l 数据基础设施(Data infrastructure)0 o' w6 o1 n9 x& s! g) S
ChatML 格式(ChatML format)
& v. d; ]3 C& ~3 s- Y% h6 S 模型安全(Model safety) ]* R6 R3 o4 q/ }2 f ?! F
Refusals3 ]: E# f. v5 E# e }
基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
7 T! H" ^2 x4 |: f Flagship training runs( z9 o5 l$ T- K% Q- u9 y% R
代码功能(Code capability). R/ j! H% J, l& o& s
评估 & 分析部分的工作细分为:* h5 g1 E# R. l
OpenAI Evals 库
1 K' O w5 E- V: s. f1 [ 模型等级评估基础设施(Model-graded evaluation infrastructure)* C' I7 e+ t- @
加速预测(Acceleration forecasting)
' E! p0 c7 X7 c V ChatGPT 评估% V7 ]+ h8 l! p6 h: t- e& T
能力评估(Capability evaluations)
4 [; o. z6 v' C* D/ i6 e; M9 P 编码评估(Coding evaluations)
* [# f. S( N, _( Y* v3 T5 L* } 真实世界用例评估(Real-world use case evaluations)
$ u x! Q( i2 l T8 o. a- {* u; c 污染调查(Contamination investigations)' h0 _3 x! F0 m8 n# `( S6 Q: Y
指令遵循和 API 评估(Instruction following and API evals)
) M( {+ B# E; z 新功能评估(Novel capability discovery)2 I1 V/ P+ G, @( b+ ]) d( X
……
# [+ b, x% b" H/ ]+ }9 { 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。" p! I' |3 U6 r: m) P- ~) Q
在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。3 G$ i: h0 M& a6 _
在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
& H& {- E0 d$ L+ q! ?( C
, o1 X% z) P5 ~. D( W# s# M 鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
5 _, G& s$ l+ K0 y 预训练组/ N0 i f# }& r* u6 a2 [
Trevor Cai
5 x: l# ]0 w5 A5 m& p4 H. K. ?; m Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
* k4 ^% |3 c4 x+ l: y 袁启明7 h+ l! V5 Q) \
$ G3 ?: T. q4 u5 d1 J4 n" b 袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。' @8 _& I1 Z9 W% ~+ f% Q
Che Chang* @& |: X% W& e
Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。9 K4 L% k; `' ]: @8 V- p, I$ |
欧阳龙
: l1 ?$ e% m. R- a& k4 m0 k 欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。& x \& Y% I& I6 A4 U
翁丽莲( n8 c, J2 P, I; I% U
E. E# u; `8 f$ T: r/ B8 ] 翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。" _$ i1 i6 f1 y8 \! g# T9 e) j4 ]
Tao Xu6 [6 a6 y+ @6 \# X
Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
) ]; R$ i% P# x9 p! S Jie Tang! e) Q6 l, X9 M6 j I7 \
0 o3 W9 ^# T% k& r3 Y6 T
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
$ \9 z% t% D) ?, j Ben Wang2 X$ p; j9 C5 w; R; z2 _# j2 L! f: l2 H8 R
Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。7 y2 L7 R" G/ S! j
视觉组
! N, D$ v: M: g Mark Chen& \7 m8 B/ s7 a2 V6 j* n, u3 ]7 `
4 L& @. o- |* ~6 n
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。8 ]+ K' `, p: D" n9 Y! s$ z
Casey Chu" M) q; W8 v* L+ F/ U3 N% T
Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。* v" a8 v) D7 j! B) q0 d
胡绳丽
1 I! p/ s% D2 _* r$ K E9 P0 g" e
* h# h* N! R5 r) G* a6 ] 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
0 j. k$ x6 x0 g t' t Tianhao Zheng$ c h8 \ E, B0 d
Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。3 k. F1 B4 x8 H: Z, J' ~
翁家翌
& v. K! O' B5 ^0 ?3 h: W f & ^; o8 W+ e* N2 W9 d
翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
w1 T5 ~$ R0 a4 f- x 强化学习 & 对齐组
" v& d: g9 T6 s2 A Chong Zhang6 B# U S( H8 x& }% k) o* r
& T8 v$ j5 N x
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。1 ` b e! L2 O' q. r
Shengjia Zhao% x- Y0 `2 v% s3 \/ P2 O. e
/ ?% B) A* K' b5 i& a
Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
8 ^5 G3 J- u9 L: ]& I. p$ ] Stephanie Lin
3 j, P# `& U8 H9 y
" M. n7 R: h3 A, K% N( G Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
7 E+ b, e9 k$ E2 ^6 H Tong Mu E; \% L* A G. y% ^2 G, Y5 m6 d
`% w7 v8 D; j1 _ p- H Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。( X( L6 E# l3 z: R% o& V
Jeff Wu
2 }1 f2 B3 F) u9 [- C { # b) ~+ I c) n
Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。* r0 a- g! {5 v; x) F8 ~
肖凯
0 d* e! G0 F: u$ |" _' _ ( Q: |5 g9 O7 Y$ @; y$ D- M5 U
肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。0 W$ @# |: R$ D) _, X! F
Kevin Yu! J, I. t2 u3 @0 f/ e( {
! ]6 J7 i" K/ Y$ l
Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
" y" [+ h. R; A m9 z p Haozhun Jin, j4 H2 d# Z1 W- D
( k+ A2 L% S0 U) s5 n5 v( N
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。8 k4 W4 {7 |8 y. @2 x; c
顾世翔/ m, N9 f6 J9 T3 z9 Q4 [# \: ?
6 X& F5 J* d9 I6 a# u2 X' p 顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。' V* a+ D* A( k; g/ A
评估 & 分析团队
5 c1 V& y0 |8 Q8 J/ K& {+ n Alvin Wang
7 m& s! P% p1 s# C( s @/ c% @+ x7 Y
Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。7 c- P( C% y) u: y' ]# ]; {9 G W
Angela Jiang
& U7 k3 I' M9 N: J% w ) j1 @" f D' t# z
Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。; u, M. O: h+ w W9 r
Jason Wei
8 \8 m; P$ P: Y0 }( I( {3 j 2 y; e- D) D$ c. f" v* a
Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
8 v! l% ?/ J0 h2 e7 L Juntang Zhuang
: Y4 s& C7 ]) i Q
: H, c U$ ]2 A/ E Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
) c$ r+ t1 w! k y, t V- x0 b Derek Chen
& N& J. k5 d! u4 r5 F; d1 @
8 v' P, j- I- X; T. `8 ~ Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
- E3 g- M" a: ]/ g/ G6 |2 @ 宋飏/ j/ M! y8 U, m( _
3 c7 F4 B$ C/ a" _9 w+ S 宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
1 T. @+ b3 W! F. w 模型部署# D& w0 u' `, ]) q) ~; A& k
Michael Wu) v ^7 O4 z- n& t; E+ E N/ a$ b
1 I. b1 u3 o1 c% W& N% x G Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
8 }" R) p& j/ A9 o/ J G8 }( v Andrew Peng
- @, w. M$ {5 b+ k8 {4 A9 |5 f - ~, F& q) n: T1 m
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
# t# I+ m8 h w/ m4 U" c D+ T 吴雪枫8 k& N6 v& `$ R) ]# B Z
* Y8 o( p" B- j" v 吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
; ^! W2 c' o1 B( c. b Jason Chen
1 g7 ~1 G; C5 a ) [" K$ {2 X h6 t6 W
Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。! j% {' ^# J: P! t
其他贡献者
+ [! x: E+ \+ u: i6 y! [5 U( t) x7 ]6 w Xin Hu
% a# S" e, `/ F+ }' i/ P4 j( X/ {
6 j! a1 \: K/ B6 `- h8 n- B) o7 u$ L Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
- i" u1 z$ `+ M& d: S% ~ 此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
3 G0 R! r4 O: r* t/ ? 参考链接:
" D' l) ?! o8 ]7 ~/ S- ^7 m https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd* ?# t2 g; o, g9 _) x* K7 ]
https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|