|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
. Y% K% `; F* U) g, E% Q( @3 I1 r' C 这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。! W; g% F; h5 w: Y0 `4 w2 i
一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
9 H! |6 Q+ i, I; _9 u& B* ?/ U 但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
6 H6 p. R/ x' [6 C! h$ I" \& E. D
0 R6 T2 W3 [3 f9 g% [2 U 鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。* u) n" l3 F- { F. ?" s. m! X
不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。$ e0 q0 l* s9 y
在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
& F7 R4 ^. l8 H" f2 A' L' m6 ` 研发人员占绝大多数 e0 ]* L6 A. x
从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。 Y" }7 E% ]9 u1 d# a/ U6 Y8 R
预训练部分的工作细分为:' q5 _$ {( f" Y3 W3 D( Q7 u
计算机集群扩展(Compute cluster scaling)
- a1 d3 u8 M3 X3 c 数据(Data)3 d( y$ q. S( y' ~1 U0 P" ^
分布式训练基础设施(Distributed training infrastructure)
5 R/ |" K: K6 A* G9 f 硬件正确性(Hardware correctness)( [* ^% }6 G! V; N
优化 & 架构(Optimization & architecture)
& J$ B- x, v4 H r. n/ I5 \0 X1 A Training run babysitting
& B6 }: T$ [5 L( p' v 长上下文部分的工作细分为:3 |) D) c9 k: f( G
长上下文研究(Long context research)
9 ~) t" i. O7 c7 g+ H 长上下文内核(Long context kernels)/ T: [7 G4 k5 i1 m' q( g" T
视觉部分的工作细分为:
8 z1 ` X5 K! I" G/ ]- B 架构研究(Architecture research)" M5 k4 L! k R0 b" Q
计算机集群扩展(Compute cluster scaling)
, k; Y. N$ U H1 D! U 分布式训练基础设施(Distributed training infrastructure)
; `+ \# r1 G/ _, |. [% K 硬件正确性(Hardware correctness)1 r- q, N1 c& I; s1 w# u5 n
数据(Data) F: J: J' I6 c" B7 O2 C: S
对齐数据(Alignment Data)
/ Q7 {5 u* l" g Training run babysitting$ ^9 [, p* r4 m5 D2 x
部署 & 后训练(Deployment & post-training)& m1 R8 f' h6 D3 e
强化学习 & 对齐部分的工作细分为: \3 [, u8 X+ B1 R k( o
数据集贡献(Dataset contributions)
. M) S( T1 Q# L: `* \ 数据基础设施(Data infrastructure)* M9 E& J$ | r J
ChatML 格式(ChatML format)9 P* ?; I, l4 }0 g, Y
模型安全(Model safety)
6 a9 C( n# } n) G D/ @ Refusals
6 [$ \3 `' {; X6 J3 p# n5 H 基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)8 c7 X2 q n: T5 r# _
Flagship training runs
$ R# x4 J6 W# X0 w2 \; u7 U6 ] 代码功能(Code capability)1 R1 H0 \1 g* t' m
评估 & 分析部分的工作细分为:5 J. ]$ ?0 j) ?8 `- X
OpenAI Evals 库
5 O: Z) a1 g) E: w9 R: C# K6 u# P 模型等级评估基础设施(Model-graded evaluation infrastructure)
+ f4 w. I! v0 X" u5 l! K 加速预测(Acceleration forecasting)4 U: o6 q% j( }* S
ChatGPT 评估
% \5 S, p# i4 z: j8 {& S2 T 能力评估(Capability evaluations), \8 f! U! j) j! B
编码评估(Coding evaluations)8 Q- ^0 z& N/ o+ ^3 z! Y9 Y5 I" Z
真实世界用例评估(Real-world use case evaluations)7 b! ? m5 s9 x* J7 N
污染调查(Contamination investigations)
8 s' P0 g: d( s- ?2 ? z4 x. w. i" G 指令遵循和 API 评估(Instruction following and API evals)8 Z3 g( @2 s* Y3 z6 r
新功能评估(Novel capability discovery)( j; q9 ? a5 r- U: c# v
……
$ s$ F( t9 M# e! D1 U; X 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。9 k# D$ R2 K' \5 j
在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
/ j7 x9 y/ \% ?* `( f% d! P& { 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。5 T ] z2 G/ q- _! ^
1 W$ r8 g* o" n$ e7 p0 a 鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。4 k: e; ?* q9 \$ m5 h
预训练组# Q6 q' J; f" d* \; R1 P* V1 {
Trevor Cai
7 c, f% q C2 Y0 Z" D- ~; r, j Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
: ]! R- ]" R3 h 袁启明
/ ]& G% H( N8 M! X * R. l) x, x; f, P, J$ `$ y
袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。* W& |( B( Y2 \( [3 u8 s" p: l
Che Chang
5 t# N* u+ E2 L Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。: |: S2 Q# S2 k5 ]: n
欧阳龙; c9 ^# M# U* D
欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。1 q4 ^/ Q. h" w5 H8 U
翁丽莲4 {+ @+ v" D; |$ `
% Z% H G+ j( \& r' \) |; ?+ E
翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
: S* M5 @7 n2 h2 G Tao Xu$ j. o: O' W Y9 }4 T) Y
Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。9 {5 G; V0 D* P/ j; r
Jie Tang
i: ~) m- c3 I4 m$ V. B # N7 h3 k9 K8 [* o; w/ _
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。: b. N7 y7 W. c# `2 s
Ben Wang" W8 V" q8 q& [, T( Q. V5 y$ q
Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
) i% E( b# ~. N! W 视觉组4 A9 o7 F' v& A3 W4 B
Mark Chen
5 e7 j3 Y7 h6 A+ m3 y8 z3 e 9 H# g" {# w* f- V% ^# ~5 b: \
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
+ l+ I$ {4 k* X1 N0 d' I+ w8 H Casey Chu; b& b5 r/ z K( G9 P
Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
5 n# l7 H3 @8 E' H F 胡绳丽
3 ~; k1 w6 m6 M* I% p" t/ b ( P( x! y* K; V( I( N9 |) J
胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
( a" r* ?5 e) `0 B7 g: V6 K Tianhao Zheng
9 A) G& G! X4 O Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
! x" V8 |! m) g$ [1 | 翁家翌9 W o1 j7 S3 J! r. D( j9 t
9 `0 c* f" d7 Y' `* |0 W2 w9 ~ 翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。2 W1 x: N' Z0 m) o, X7 J( a+ H
强化学习 & 对齐组' S5 \0 E9 J( o p
Chong Zhang
6 D3 v7 D; H7 C8 h ) U, c) @% e9 \
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
* s2 ^! i7 d4 A9 w$ g. I' F; I Shengjia Zhao
' L) [8 i) f* ]1 r$ t& n2 W 8 l f& @8 h* f2 b) C( y
Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。0 N0 x- |4 s7 m# U2 u
Stephanie Lin6 O% I6 M% |2 \1 w$ Q. u8 d
3 s3 |2 q: a( X
Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。2 m% T, Q, m# o; d
Tong Mu6 z2 Q3 e9 m/ y$ A4 @% q% s
' q6 G' C( y+ u x* R6 N( }% T
Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。3 I" W' F5 o) j8 v
Jeff Wu
8 l& n4 S5 `6 X# Y# i. \ % S+ Q' s* f/ o7 {/ i# P" _$ W& G
Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
7 `: J$ n4 E* T: m0 t. U, s, u3 I 肖凯9 i7 \* `; F+ X! ?9 W5 v' ?
6 B5 `6 ~( E* ~1 _ m) s. I
肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。9 A' d5 h+ @# G9 y- d
Kevin Yu
, B9 y5 A y8 T9 d# v+ I
2 \0 x. b# ^4 J0 n/ I7 O. j Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
7 ]) S, c. v) @. @- y Haozhun Jin
. f) e. v) e- V
+ r( X& F0 a" K9 g0 |' @ Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
7 d% A) l' O. c! \7 \3 P1 X1 b. u Y 顾世翔* I# Y& y6 ]% @2 _' b, `1 A. G
7 `' R1 s; a6 y
顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。2 P1 R/ \5 }% V* o
评估 & 分析团队
: j0 A' n9 U. I* _' r Alvin Wang
7 B/ [& m! V9 s- V f( m- U$ Q7 _ 5 Y" n1 m: M! T9 o# L5 w8 V7 X/ d
Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
& C! V* Z5 t% l' e" e Angela Jiang( N/ Y) Y7 m6 N- M0 L! @7 y! e1 x- b
5 y' u7 i$ `5 H. e6 v; t
Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。/ _7 ?- H) M2 k! S; @
Jason Wei
* w+ s! n" V) V$ k. ]' C; e ; v: N" z7 j5 V3 e5 Y i: L$ X
Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。$ Q @" j6 R" h; r- g9 x! P6 I
Juntang Zhuang
6 v. M/ C1 h3 y3 r" z/ v: O4 n
% [" n1 |- p* G4 c4 p( O8 t: r- x Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。. h/ r9 t5 N1 T2 w
Derek Chen4 {2 k9 X& U* }
4 {8 h# q' a& @* n* C5 A Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。* Z% f# w" S, u8 [. R6 v
宋飏
( i% T, a( A8 M* d 7 _9 B) ^& B* d4 V P" x9 A
宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
" { V* O- B( \3 n9 N" O) o. T2 Z 模型部署
$ H$ w0 v& | C$ \" k8 ^ Michael Wu
# n3 i, m6 Q; |
9 f A1 ]3 P6 V, t Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
: N A; Z$ U) O( R/ w Andrew Peng
+ ], h j$ V5 k2 v* \ # C9 Q2 F* d; W
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
& ~' v; }2 Z! D6 \ 吴雪枫3 Y/ `5 E/ @6 ^, N! Q
! L0 g% I6 z p
吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
- ~. W# _$ q9 j0 L6 o/ a! i5 _ Jason Chen
3 z1 S# v- o4 c$ R
& i2 O, |# z1 u0 o& [ Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
+ J. z! H- o9 e9 \# J* A 其他贡献者8 z5 ~# y1 D$ Q7 K: c" i8 Q- [
Xin Hu3 h {; B- |3 j8 {5 V" f
/ w* Z/ j: J; u
Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。$ {# Z7 e" o$ O) V: `/ V
此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
% _* A8 A0 B& |: z7 l; z# x( a0 b 参考链接:
# L4 r7 B( ^2 v# _4 {/ j S+ u https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
# f+ M4 `& a2 p. a' b https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|