|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。' i- ~* G" w. k) C: e/ u- S- J
这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
" ? M2 v; o& B# E6 Y( B 一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。6 c/ e M; X& C4 r
但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。8 j4 L$ r1 V- ^7 I$ l
, | ?2 d* s. K: H' J% | 鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
! Z& k# a) k; Z, |* D 不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。$ K# h5 U: S& A! F0 r8 `6 ?
在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
7 }( C6 V" O7 T. @" z8 S. Q9 @ 研发人员占绝大多数+ f4 C/ W# d7 `7 e# K
从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。. ?3 F) ]5 R% c
预训练部分的工作细分为:
# A2 u. T; l. a3 U+ T 计算机集群扩展(Compute cluster scaling)
* Y b9 U, ~. N 数据(Data)1 `" ?; t# Q. [
分布式训练基础设施(Distributed training infrastructure)+ U6 H% S4 @7 ~
硬件正确性(Hardware correctness)
7 _* ~% s# c$ Y4 f9 ^" L 优化 & 架构(Optimization & architecture)
! w: }% L6 z; h, a Training run babysitting- b5 a( C: r/ ~5 J! k$ r1 M9 [4 D
长上下文部分的工作细分为:
) c% J' n% d" N+ a 长上下文研究(Long context research): Q: k: m( g4 s
长上下文内核(Long context kernels)
4 h% h: s( U( H X0 W 视觉部分的工作细分为:& \3 |: x+ o$ [; O2 c# Z
架构研究(Architecture research) a5 y) j1 C2 {: N
计算机集群扩展(Compute cluster scaling)
# I& c% u8 R3 k8 B2 v1 S- k 分布式训练基础设施(Distributed training infrastructure)
" u' f3 |, p2 p+ p, e 硬件正确性(Hardware correctness)% u& C0 @, n" q1 p" Q' z
数据(Data)
, E7 q' Z( A* q% f 对齐数据(Alignment Data). r3 f8 \2 l5 |; O' y9 ^! k; s
Training run babysitting1 P) e' {% D. ] S" {- l) l1 D Q o
部署 & 后训练(Deployment & post-training)4 n% C' ]$ m- {' O' A" N1 F
强化学习 & 对齐部分的工作细分为:) l! R6 K; G. E& b1 H; Z) S+ A1 r+ ^* z
数据集贡献(Dataset contributions)
1 e2 `% A0 d: w7 L 数据基础设施(Data infrastructure)+ w9 w5 U) \/ T
ChatML 格式(ChatML format)
7 ]0 ]! }) o- `& k9 e 模型安全(Model safety); b. Q1 X% K# C% X# h! e& J4 Z! ~* I
Refusals/ _! J: ]$ q7 }
基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work), P0 { v3 p* e
Flagship training runs, a$ r3 B+ a. l( E! S# l5 w
代码功能(Code capability)
3 E: E% I9 Z% ]. ]; Z2 ^0 r% P- n 评估 & 分析部分的工作细分为:
9 n6 T" x7 X. R OpenAI Evals 库
- l! F' [/ s8 e1 ?/ e6 K 模型等级评估基础设施(Model-graded evaluation infrastructure)
% z& H$ G' C6 L/ y 加速预测(Acceleration forecasting)& |4 s, O7 o7 X8 G& ?; |# ^
ChatGPT 评估
' K! _: B$ ~. U/ t' ~6 s0 K 能力评估(Capability evaluations)
$ T- P& i- o$ _9 G3 m" V; Y$ @+ d 编码评估(Coding evaluations); i: d0 x; `$ I+ _% P& @
真实世界用例评估(Real-world use case evaluations)* n" p4 x* _1 T8 @& V
污染调查(Contamination investigations)
& b1 R3 E6 q4 f 指令遵循和 API 评估(Instruction following and API evals)* z7 z1 G* z" `) }
新功能评估(Novel capability discovery)
" X" g& I$ u! y; a) a" x ……
1 a0 Q8 c. S: ]6 C1 x2 a4 ] 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
; D5 e5 A6 F5 y: O9 {9 |8 x 在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。4 D/ Z2 P+ o: b' u$ [
在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
! z+ H$ W b4 ^/ p% _ : U4 V/ M' \# ^: K/ m( ?) U6 C
鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。0 g+ j6 Y' F# X! D
预训练组
6 t+ ]. |$ W) g) Z Trevor Cai, N1 t# ?- S' m4 o" D& {7 J* k
Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
/ x& K9 t4 y5 J: { Z' o7 U, m 袁启明
, N% \, y, p1 r' A, d " l5 P( F. z U- r
袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。$ M: C4 {# {; R; t! H( c) @, r& w: q
Che Chang
: f) Q7 \+ H' G, e% A5 H6 \ Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。* a0 u& {* P3 L
欧阳龙5 c, G+ e/ Q0 X6 J1 k4 ? d S
欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
$ l- P, \9 e! F 翁丽莲& L8 d8 l$ D! z& A! N; J) o
/ b4 m! K$ ^: R& C4 S 翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
# h. f: s% C; P4 Y Tao Xu
& l: M: b' b- z/ W. p Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。8 ]: }4 l0 }: P, F
Jie Tang
f% ]( Y/ `; Q5 R$ j + w! v- m0 D9 g d$ y1 h) j+ ^
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。! g9 l1 N- g C2 W" u
Ben Wang- G+ w; ~& D& {+ y' B
Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
- y8 y' _. x. p- @- h9 X2 [ 视觉组
2 J$ c6 x: O J8 @: i, m! ] Mark Chen
: X' b- U9 E, J! P {' n+ d( `* h0 W& T( N) g5 `
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。" G+ s5 F# I$ g) H: w/ p, l
Casey Chu
; i5 D! }* K4 Q4 A% y/ x/ R( ] Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。8 f3 g# W" D, y8 T) s
胡绳丽
3 e$ j" B" W$ P5 J! N # ]9 E& K. @8 Y# M; y7 p
胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
6 c" c+ I- o& G2 q8 p. P1 u% h, | Tianhao Zheng
, N# E) Y% c' ~1 T' m Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
" y/ L) R+ `( @' ]& b1 v0 R% Q 翁家翌6 t! U" T; T+ a& T$ I5 j
; a& n& e, Z3 }+ f
翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
# s' g, h% b# T" b2 P 强化学习 & 对齐组/ y+ L6 g9 V3 m6 S% }) d' r# a
Chong Zhang. T" P" `! ~6 E( n. A* A5 P
4 ^1 q/ h1 _7 k+ n' j$ r7 ?: U
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。: N9 N. y! |4 t2 S, B
Shengjia Zhao- r0 V7 v6 i) n/ Y5 N4 D% s
# ]9 ?& f C8 P" w9 V& U Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
& q& B5 P( [ s& M4 u" V Stephanie Lin3 ^$ L7 k4 \3 G* v
5 x3 x; e8 @1 B% P2 K( S
Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
# {; Q8 i+ ?3 w0 p" u/ B6 F+ c6 S1 J Tong Mu$ ~! w) |1 r5 l
* e' @, r& v( S! V
Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
. W% ~7 {. ]0 `2 R5 I4 y Jeff Wu' X8 H% ^, y" d+ m3 W$ [! R* J
; s% i! y0 w; ^0 v9 b
Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。' [* [' r4 u9 I0 }
肖凯- J1 C$ s7 c+ K
3 e6 c F1 N3 c: L; l( K 肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
- ~" k) p9 H y6 x, V Kevin Yu
, q8 d# o2 L+ r7 b $ v- V$ y5 N6 I" Z
Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。: r# M I/ n$ H0 \ ~
Haozhun Jin
; q1 d$ S9 g; W9 X' {" H9 z, w 3 q q' y. p) K/ h* I2 Q! S
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。: i: t$ | G" w& G# h& U
顾世翔1 ~5 D% l& m A; W. C
% ]" f' d5 m* J) m% _# @ 顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
/ w+ R' k; M# n9 z 评估 & 分析团队+ F4 H8 N( O9 x3 }& f w
Alvin Wang
' M- g, T) o+ `, {8 l 8 V: Y6 D4 E9 m
Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。8 r% W, {; `: g, a
Angela Jiang% X5 K0 k6 v( w7 n" B( M. l
9 [4 P/ \+ `/ s Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
* t- H1 o6 Y) |6 E: v2 }5 y; c Jason Wei ~- a8 W# O( o8 V2 d# ~- f$ y
- F7 O- O' E8 E/ \4 A- A: f q& J G8 B
Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
2 l8 [, O8 g U" |. i6 o8 _ Juntang Zhuang5 E4 y3 Q" P6 l1 l3 I- g3 K& T
: _; d0 ~7 @% z* c) D# b- W
Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
$ U+ J: V! `. R0 Q0 H% I Derek Chen4 [, M& x3 g. {( Z W" V; A
" m- y! O6 J# k: \ Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。# c+ u2 G. }3 i9 A& S0 _
宋飏5 `. p- ]" q8 S( L
4 L. D9 N- B, U5 [7 w! ?
宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
5 q4 v5 u1 Q9 z+ @/ ]$ W 模型部署" k6 {( o. d# T' Q
Michael Wu" j. G0 c6 J N
7 W d6 s8 x) }6 M0 X: q Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。1 p( @+ X* j" m U, @
Andrew Peng2 E7 |3 o, Z2 T3 f
0 x4 G& l& r" [4 A+ n! b m Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
1 z# s1 @! P+ a+ e6 A/ _ R7 B+ t 吴雪枫& A( f' [: g2 T5 y. P# g$ f1 M
& U3 H/ d0 s8 f7 z$ L* ~ 吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
# O9 N. v+ ~; @. E6 t8 p Jason Chen
- y$ ?( r8 e5 j! a' Q9 w I8 b . Q' w6 A) s+ d6 Y
Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。# M: r8 d0 d7 h" ]. N6 F$ c
其他贡献者) r% C1 g: `3 E1 q; K
Xin Hu
+ o3 U! g `' b0 Z; b @2 `* y( @
& q5 ]% b- a. C) `0 J Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
; p! e0 z7 C0 d7 ^" w, m" f4 d 此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
d" k. J4 L8 Q `& `5 ^& s 参考链接:
9 W2 H! g& T4 O* Q% @ https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
# V# e- c* Y N( j# ` https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|