|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
5 F, O, T* L( p1 S( C 这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
& V% O8 T& I5 j' d ^4 y! W: Z- V9 D 一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
5 C* l+ v6 K" {- Q5 O- y 但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。4 T2 ~ m: e: Q5 U" @; d
& s9 {! {+ ]7 r
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。( ?! G. W2 j8 ?& T
不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。5 q7 Q7 w# r2 u
在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。8 Y. x% y; ^. n6 ^
研发人员占绝大多数9 a: Z$ a* g* Y0 _8 E+ }) g
从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
5 U+ W2 c5 d% d A( P& ~0 \- b: j 预训练部分的工作细分为:
6 s; C) c% C p% o! r8 C 计算机集群扩展(Compute cluster scaling)& m( h: f. n/ J. c1 H I$ M
数据(Data)
! z& \5 |1 j- B g 分布式训练基础设施(Distributed training infrastructure)
4 L/ i: N2 D; @ 硬件正确性(Hardware correctness)
; f( E- i2 M& r e: h* d4 E 优化 & 架构(Optimization & architecture)
9 B3 r S) t+ r$ U3 R Training run babysitting/ G) B- J: o+ ^
长上下文部分的工作细分为:
0 |: P }% \- A8 o$ H: |9 N. |) o 长上下文研究(Long context research)
# S9 c8 V# w: b: w) R 长上下文内核(Long context kernels)
9 Y/ S" r- S3 k# v 视觉部分的工作细分为:1 G& c& G9 L" K
架构研究(Architecture research)
! ]3 p- }- w- H( P9 W: ^ 计算机集群扩展(Compute cluster scaling)5 |9 \. s5 s+ T" `: T6 ]/ A; L" ^
分布式训练基础设施(Distributed training infrastructure)
6 ^: v' Q3 F% _2 I, V 硬件正确性(Hardware correctness)
! V; G: `# _3 Q, w7 l4 |% p$ k 数据(Data)
z$ X# F( f6 T, {0 g# O 对齐数据(Alignment Data)( b2 V$ ?* }9 h4 w; B5 `8 ~9 m. D
Training run babysitting9 G4 j: B1 o5 y' v9 h# f1 H. d
部署 & 后训练(Deployment & post-training)
! q. {3 }. s7 Z9 j9 U 强化学习 & 对齐部分的工作细分为:4 a: K4 |- P& _4 U
数据集贡献(Dataset contributions)( E+ I/ i" z) Y& A/ j
数据基础设施(Data infrastructure)! R) s4 o) n( C; C' x
ChatML 格式(ChatML format)
% r8 c6 o2 Y6 n" z% ~# i" T7 O 模型安全(Model safety)- z* D0 d4 k7 J( c: y3 f
Refusals
F; w3 G5 |8 Z; _2 w ] 基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
" _* K9 Z7 J: K- A7 n# |7 n Flagship training runs7 u- M* Z% L# G: B
代码功能(Code capability)
$ U' c: `0 P( n' }; z 评估 & 分析部分的工作细分为:6 f2 h( e% S! |; B { h O9 [: t) J
OpenAI Evals 库
6 w O# T$ s, i$ C% V 模型等级评估基础设施(Model-graded evaluation infrastructure)8 }1 b, U5 A2 v* {1 u5 R
加速预测(Acceleration forecasting)6 U. l6 G3 {1 R
ChatGPT 评估4 [6 a3 C) W. ^% t/ x: _
能力评估(Capability evaluations)
) ]3 K8 V- @! U$ \7 W e0 u. \ 编码评估(Coding evaluations)
6 y: {9 @0 A! h5 ` 真实世界用例评估(Real-world use case evaluations)) j3 B# F1 Q0 [! h
污染调查(Contamination investigations); E3 w7 T: @* o% c; R# @
指令遵循和 API 评估(Instruction following and API evals)2 k6 s* W7 \2 U& v7 q ^4 U3 h
新功能评估(Novel capability discovery)9 t9 V* e) j7 K3 x5 `
……
! Q2 f! _" G+ K$ B: o4 _& z/ {0 ?: { 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
, M$ R+ X- S1 }3 y/ B& [ 在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。- }; x9 H% Y: M! `7 _8 Q
在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
, a, C2 I' U5 b. h
7 Q& l7 p2 m& d6 Y8 {- n 鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
8 i' P* e; h5 t1 I% z8 ?9 n% X 预训练组
' \$ y" N% k! X6 ` Trevor Cai
" j. [7 T, y$ Q5 c0 @, C) G6 b9 s Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
; U4 H- e2 M! ~$ K) x& o 袁启明1 k- S" P" ?2 p
. Y4 g( k/ O- [% R/ |# _2 Y( I 袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
9 `9 N+ T; t2 Q6 |1 U" W Che Chang3 C2 P0 I) ?/ {
Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。5 D! j8 n% d( l+ ?* H: f" L0 ^+ v
欧阳龙+ S% [# G8 U" f+ |$ M% S
欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。& } d/ w! O$ t* Y9 I
翁丽莲' S3 G4 q9 y% z- K: Y* O" v: n
" o, d. h0 s% M- a% ~8 _3 Q( a- H u 翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。) `. O, g4 E4 ]; \ M
Tao Xu
) L) M7 P6 r) Z9 a p Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。1 G. m; A1 L, b2 y, F; q. {$ h
Jie Tang
8 W4 T! k9 q2 [+ h; c. s+ P1 h" V 2 c% i& m% K, G
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
/ w- l# Z v' K Ben Wang
Z' n. l/ b: N- F) P: ?7 { Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
- G0 @4 M5 z/ I$ a 视觉组
9 h0 I7 f6 S8 M6 n% n8 L9 n# Z" n% e Mark Chen, \7 u# g* o) M8 E5 Y7 @1 F: F
2 {" E- z" r2 H: t9 h Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。4 e* d3 U1 T( `( L9 s, ~1 k
Casey Chu+ ^8 D) t7 R* }7 U# k9 H
Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
4 |1 ?3 q- B3 c 胡绳丽
0 F- N$ ]7 ?! s0 A1 ]
1 w' L4 g# i) U 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
; s( P$ P& Q4 }& K- b; }( d7 k2 k3 f Tianhao Zheng
+ z* K, O0 p" e/ L! i Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
+ r/ \1 V ?) c7 E( I 翁家翌4 ?. [& y$ @6 t0 J7 R3 T: i7 N
}0 z: L) E# X i! q& J( \ 翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
' H' @) z! o6 o) d' M( L9 H 强化学习 & 对齐组. I5 I0 _! @* @
Chong Zhang
+ t# y# Q8 X" O& w2 o : ]1 y0 \0 w! J5 P% f* i+ d
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
2 z: p" F, ?' c7 V$ N Shengjia Zhao
$ }; F6 ~' F% M2 h* g
" j- s1 K; R& c0 ]7 T Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
; u l% |3 O+ E3 r* X) z Stephanie Lin
( w: k' T, ]2 E. p. F 5 v$ T9 L$ e* \8 A- N
Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。$ \4 c, [( u% t D: H
Tong Mu% m) z( L6 i5 K1 m. w4 \
+ O- j$ a% P# Y7 e/ E8 y Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。5 I# l. t" E0 S ? F H
Jeff Wu# A6 f( K( p h& j, a" d
+ L1 k. S0 c3 }& y% @7 {3 n Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
4 @( ]) D! v* W 肖凯
4 M* Y) A$ x G% f3 T
# G% b R* L7 ^; S 肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。! _- h& S+ h& m6 O3 o8 u# l# B* Y
Kevin Yu
! y( ~4 O0 d0 U! h/ G0 H
- Y: G) ^% f2 v! a/ z4 L6 H4 \7 ?5 q Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。8 L! L% u) T3 g7 ~9 O, `/ V+ N
Haozhun Jin% U7 M+ i/ [+ W' w: v: c- b* y6 Z
o0 [3 D6 K8 s) T. f" {
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
% \) {, i" O$ @3 m& S6 l9 X7 [) s/ V2 \ 顾世翔+ ]$ q# }% t8 Y6 `: ]
* J2 `( u M7 r$ a2 n) E7 k
顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。. J! g; v: [8 m- W
评估 & 分析团队
6 j' H) K6 Z& t& p0 W# d6 j7 | Alvin Wang
, e; j" E/ `& B0 {; y
7 S/ b) Q& c" Y3 Y( g0 ] Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。) C% |! X y8 L5 m
Angela Jiang% {0 S/ n6 ~2 @ D4 @7 E7 E& T
7 J5 x* z2 Z' |, b; J2 c4 `' G Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
0 ?- s. x4 C, H; K' F Jason Wei
) f1 J- P6 @" _/ I/ w) v
# j; L& [2 E1 g$ y" {4 Y0 A Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。# p0 v2 E' s/ \
Juntang Zhuang
1 H J1 C) X+ A8 z % A' v9 M5 ` Y' m+ p1 ]# }
Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。* C' g8 [9 e& P5 J9 p0 ]) E6 N o2 o
Derek Chen
3 Q! L" \4 U" I% {; ~8 V " W! n4 G# k2 c y0 A$ H# o& {. f
Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
" d4 L; L4 e5 Y! Y2 t. R 宋飏7 O' K* \5 n' J! @+ `0 U+ I9 |! U
4 ?( L6 Z1 c3 Z8 w+ F5 o
宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
6 Z6 M& M8 f5 d3 ? 模型部署* n/ e, ^8 a2 t3 o
Michael Wu
+ @. ^7 i2 @8 @" p$ A$ h9 @& A
0 T$ T# N& c) J# ^0 G7 o Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
* K: q% P! [& ~+ u1 S2 g3 j Andrew Peng! m' W% L' z B9 B" q$ Z
: e2 b& [0 L/ R* m* |2 U2 d
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
. h; h1 \6 Y* [8 R7 b$ d 吴雪枫
! }! M, a! x5 @9 M 6 {2 Z* H. K/ [7 X8 L
吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。- @) F) p* h# H4 J7 {* c+ f/ f
Jason Chen/ ?0 Q! u* M" t4 T, l9 W% I3 T/ Z
/ ~. H: t/ s! K3 w2 p/ u1 A
Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
* R) H; Y. L, Z0 l 其他贡献者
7 B6 z- I/ g/ n5 P$ _ Xin Hu8 J" f: _- {- O, O2 c
2 U2 ^' f3 p, F; v( |. Z Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。; n. a" u" u+ |) X2 l' I
此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。# v$ a0 D0 q3 T' P! R
参考链接:
; s( l8 x0 [9 f, r u [7 K0 v9 G https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd6 n* I# I( Q$ O L% G2 p
https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|