|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
! B" w; g# K% b7 U: k% F 这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
% z( B# h+ n1 p- |. D 一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。7 {: d0 q6 R5 A$ f
但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
1 \# }6 [0 i; c- y4 f8 _ w % a- A* v" I* L( o
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。* p# j: L( I/ e; q! ~
不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。7 C: Q7 ?/ ]! f& {$ _) s% I
在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
/ j) D- i4 x/ _+ k2 H4 n 研发人员占绝大多数, L$ @; W* q6 }! j8 b) K( S
从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
- [/ x3 W4 Y2 B7 d1 W4 ~" ^/ h 预训练部分的工作细分为:
* \( _& i' N# L* X" S+ a! o2 C 计算机集群扩展(Compute cluster scaling)1 |: v4 F7 |* D- {& b& m
数据(Data)
5 J& r+ Q& R3 o1 K1 l* v 分布式训练基础设施(Distributed training infrastructure)
, j6 x3 J* z" q q2 w 硬件正确性(Hardware correctness)
* b9 E% o( F9 j X 优化 & 架构(Optimization & architecture)
$ c; n& w0 O7 C Training run babysitting- j& E! h. P, o/ P6 Z! _! d7 ]( u+ i
长上下文部分的工作细分为:
; M9 J4 Y* I& r% i" f 长上下文研究(Long context research)- h* i4 ?8 o! m2 ?
长上下文内核(Long context kernels)
1 \- j# N1 ?) Z 视觉部分的工作细分为:# H Z6 |& j. b) l3 Q
架构研究(Architecture research)
) k6 y2 z/ Z0 c! q9 N5 o v 计算机集群扩展(Compute cluster scaling)5 F% f2 E$ c1 N: J
分布式训练基础设施(Distributed training infrastructure)* A1 J( K9 P" o
硬件正确性(Hardware correctness)# c; d" O6 G6 L5 q- v) M7 }; E
数据(Data)" f4 c% H* q; A
对齐数据(Alignment Data)
, R- {% x, ?+ M Training run babysitting
$ u( \5 \9 r# p. b0 A: y 部署 & 后训练(Deployment & post-training)
7 I: ~3 ^3 R. j" ~7 f( T7 `" ? 强化学习 & 对齐部分的工作细分为:' L5 K5 ^" o `8 V6 {
数据集贡献(Dataset contributions)( P7 V0 z5 G8 V# W$ Q% ~
数据基础设施(Data infrastructure)
4 s4 v+ B+ D# D: G. n+ h4 j9 t ChatML 格式(ChatML format)
3 v( D7 E# T! ?' A x* `3 d 模型安全(Model safety)
2 y, u0 q8 h0 c2 N Refusals0 D, V8 ]% J8 R" g, l. W
基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
) \# i; Y2 ]2 b! O3 S2 O/ H8 _ Flagship training runs
" V. `2 V- W0 s8 D/ ~( `5 Y! D 代码功能(Code capability)
0 N% q& k8 e1 f/ I% r 评估 & 分析部分的工作细分为:: M$ |% K( F2 ?! I5 R* n/ ?
OpenAI Evals 库! k; `! a! P; X* k1 r, K
模型等级评估基础设施(Model-graded evaluation infrastructure) ^/ |5 [# D z" a' C% A
加速预测(Acceleration forecasting)/ a) p( o. L M @! \: ^
ChatGPT 评估) \( w; [- S1 X# ? e
能力评估(Capability evaluations)
* z1 L$ {- O9 |* g4 m 编码评估(Coding evaluations)
0 d# v" K2 H6 d- _/ ^ 真实世界用例评估(Real-world use case evaluations)
4 }5 a8 @+ }9 x9 I+ ?, w) L 污染调查(Contamination investigations)
3 k& J4 @3 E- `: R: B! q2 E+ L 指令遵循和 API 评估(Instruction following and API evals)
: q6 N$ | l- Q: g# h 新功能评估(Novel capability discovery)9 _& I P% y# g, }$ l
……& u/ h/ G3 H' \" F, {
细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。. G+ ^$ T, A& l. Y) B
在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。" s3 q' ~2 b/ X T5 d3 w& M9 C
在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。$ X7 s) d1 ], U8 ?' m2 U
# }" e" `, N) m8 G. J
鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
& ^4 G ?0 _4 j8 S1 M 预训练组
) z9 v5 ?9 B; Q1 P6 _0 A Trevor Cai" y& [. Y, f2 P& K2 X' `; N
Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。. W; b& K2 m. I2 @; T! [8 ?7 n4 a3 a
袁启明
; t' m8 y5 v$ x8 c4 Y$ F2 O' I2 C3 l c
, K6 u; `8 ~, N7 ~3 v( J+ | 袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
; }) }# Z& {7 S4 S% q1 D$ D) |8 p Che Chang: b8 [0 P0 u! |" ^' [- N
Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。4 ]0 `+ \; N L2 ]/ K7 W
欧阳龙
+ B3 n4 g7 @" ^8 S 欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。0 I0 a; b/ z) w& g7 x: B
翁丽莲
' j# p; b7 g8 Q, W c % v4 N; h+ l4 `3 {7 D4 ?& f
翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。) Y5 D3 n# X9 h* }! g( H
Tao Xu6 o: H: b3 c4 t
Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
, U. V. s6 W' J1 d H Jie Tang
% ~% v0 P, J! i # B0 O9 ~& ^ i' o) u$ K
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
: O8 p7 r9 M- C7 C Ben Wang
: r$ y2 z: |4 k# I/ r, g* O Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
$ ]- y) `% L7 l& h 视觉组
. \* p7 z& p3 ^: x( x n Mark Chen
% w; ?7 G) \9 f( V) y$ q - R* R9 s4 c' M
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。$ A( Y, h8 I# P9 G8 M! n
Casey Chu! c2 ^- A, ?! `5 E/ |4 b3 \5 w9 Q
Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。$ \" x' E+ m% ] @9 G% X5 G
胡绳丽. k0 _" L3 K0 T0 a' Y4 O7 [4 O
. Z# I; u) M6 x3 W3 H/ T- ] 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。1 K5 @$ r* L4 q% A# e( e: M$ b
Tianhao Zheng
/ @2 O) S7 c3 `$ w7 {8 E8 p Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
. {/ ~) z( i9 ]$ ] 翁家翌
0 P+ @$ |& Q! ^! k& X$ _0 z2 D3 X 9 X$ V* I3 D6 M* j2 N2 {/ P- ~3 q
翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
+ g: N& L4 ~# w- A* ? 强化学习 & 对齐组
- B4 I$ Z& w3 q5 m1 Q; o7 E. l Chong Zhang
. K$ a( c- E5 ]
! v3 ]! _2 K5 J8 Z& a Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。: N$ _' S P/ y, S" u; C! u& N
Shengjia Zhao
2 x7 U; v9 `3 c( E# {6 d0 |# X 4 S: F6 @) R9 b, ~1 {
Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。7 }3 S9 v: D Z J; s
Stephanie Lin
( H. {7 B& L+ T4 }, f- N6 E% d
5 u& q. d0 z6 }- b% d, i% K. X Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
$ N$ S* Y& s5 f! U V3 L9 m Tong Mu
( y; e+ X8 q" q: k |$ ^+ m8 [7 G7 C* J % _, M$ Y C$ U
Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。# b) u+ [6 }/ p* A# [6 n
Jeff Wu
0 j7 p2 C: v8 R8 n! P1 e( \. z
8 D9 P3 p/ A- U& T8 W Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。6 X! i% ^$ E' q4 h4 r1 K$ B
肖凯) C3 O+ ^- s1 t7 v/ q! |# `
y" q" C/ @2 m$ W; d7 \
肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。( X0 L, I* o, t+ u7 j
Kevin Yu* I; w U9 f2 [% O1 H4 z
( i# G' n8 b; U5 f$ Q Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
, E1 J' |" G/ S6 }# k1 O+ C5 w; ? Haozhun Jin* r0 a2 p1 [* o
* o+ t- J5 f2 u4 Z: E4 `
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。% X: n# n7 I# Y1 e. k0 S* j! K' i
顾世翔- o9 C( w3 M# e3 ~8 n
( ^: V a) H( |/ R2 r1 | 顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。0 `0 B% s q9 {: R8 {" }& A* J
评估 & 分析团队* j% L9 W( W! K& N8 ^# S
Alvin Wang) w$ [$ h v& n6 A# H$ Q" V
4 l- a& H7 ~ A% g2 \& ]; l
Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
$ M! Y3 @7 R7 ~$ o! d4 P Angela Jiang
. _7 B1 e( U: X4 Q: p
& x* V/ T. ?+ V9 o6 M8 a Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。5 D+ ^# `1 x! A+ c/ n2 O. X) l+ o
Jason Wei6 R1 \$ l' u3 W. ~7 K
- J9 f6 i+ B' z
Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
" Q- E m' D1 K) b' B8 p9 j; w Juntang Zhuang
% z2 h9 a& o4 O2 n; U3 S ; Z6 `5 b& L+ c, Y& {2 F
Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
3 w4 t( ?# R3 ^% p1 q. ~ Derek Chen. {& [3 o+ g8 G' D$ u/ J, {
) o4 T, Q( D: C
Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。/ t3 L- A% C3 |8 |! `/ W" o
宋飏! Q& n7 Z3 L I/ c% }
( A# {/ u9 z/ G9 S/ A" P7 W# k 宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。$ P" d( N8 g$ Y$ F C
模型部署
" P. g$ V! h+ O Michael Wu2 s/ Z% F* \) ]
. L8 ^+ u( |; G. S: m T4 v; Y Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
& J9 |: u* f& H d! W+ | Andrew Peng' H' t" f( v1 [% Y/ }! M: u
4 N; s- b0 q( U
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
2 u+ O9 J, @- e! H9 K- I 吴雪枫8 l) B& H7 L3 I/ K
# E+ ]9 ~2 r+ H7 B
吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。& Y+ H- b: k4 v q8 {0 M
Jason Chen9 U! z) W% a+ @3 ~/ e- M
5 O* `) ?) h# Y, z N9 Z" c
Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。5 `# g% Y( o& h) m
其他贡献者! Y$ }" b4 ~1 g. \) v& n- ? o
Xin Hu- H7 X" _! M/ L& O) z0 v* w
( ?: G) r% `1 n$ r/ r- [4 o
Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。. @/ [3 r h7 R4 b8 `. o
此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。8 i3 w a4 R3 {8 p7 K
参考链接:
/ J( l- c, a) ]( E, Z https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd" o. D6 x }4 T6 h# d6 P7 b
https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|