|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
# z2 \: Z$ ^1 U. K6 } 这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。* \) d5 J3 S. c0 g# V; p# f! `
一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
! h$ {2 g$ z& [0 h 但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
! r- W; c; ]5 j# j. F' E0 |, D ; r8 [& F$ h2 q* u; @, q; f
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。, _* o3 M- [ h# O
不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
s- f6 x6 l1 Q; E C+ t 在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
. `5 } S: P% {# @1 q 研发人员占绝大多数
: j" `5 Q, ?: O) _- }; ~ 从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。' n/ \& O: O% C0 |
预训练部分的工作细分为:4 D. g& Y' c( Z4 s ] k4 L
计算机集群扩展(Compute cluster scaling)# ?9 w2 n4 Z1 L
数据(Data)* H' y M% R2 C$ c$ [) l. y
分布式训练基础设施(Distributed training infrastructure): F* E& ]7 s7 l8 i* O
硬件正确性(Hardware correctness)
1 u4 A* u0 g" w* ~% e6 i4 w( M 优化 & 架构(Optimization & architecture)
% K; g; D, k" w" B [3 k2 U Training run babysitting
) c l& X' X9 B3 x6 v# }, E q 长上下文部分的工作细分为:" F' Z. ^4 {- h; X- M' K) v
长上下文研究(Long context research)4 g( V3 B5 w8 X
长上下文内核(Long context kernels)
, k& P1 [9 @6 K( R6 @, e" | 视觉部分的工作细分为:
* o9 g/ }/ l2 G 架构研究(Architecture research)
2 I3 J& D+ `; s1 p i 计算机集群扩展(Compute cluster scaling)
; I, I6 p4 h- e' y; H6 l; l s 分布式训练基础设施(Distributed training infrastructure)
) S( \" N' O# Y8 ^$ Z2 C 硬件正确性(Hardware correctness)9 k- B) g& ?! u& x$ [3 r0 i$ }
数据(Data)
2 j. W. \0 D- U: { 对齐数据(Alignment Data)
' y' O" e. y8 L3 O I" F D Training run babysitting, H- W& U3 {( ~, k0 b5 k! n2 U( V
部署 & 后训练(Deployment & post-training)
- h+ Q9 V4 R( U# Q 强化学习 & 对齐部分的工作细分为:
" w5 _1 Y; ~5 G/ S# v) a 数据集贡献(Dataset contributions)
7 m; ]4 A3 h2 z' J. m2 J' c+ O 数据基础设施(Data infrastructure)) ^. _3 T8 ]. s/ y
ChatML 格式(ChatML format)
2 P6 m9 i( E8 v. l# v 模型安全(Model safety)( B% j3 N# m5 a: t$ y
Refusals
' p+ E/ j4 ]; _, ~$ {) S 基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
& u" m' N( [# x n# U- Y4 T Flagship training runs% R; U$ i$ s3 L! S2 u' B
代码功能(Code capability)( e! m! u! u8 L: y/ @
评估 & 分析部分的工作细分为:
5 c0 d' I( `3 W S! x OpenAI Evals 库
3 c% e0 a) Z1 I E+ ]1 m 模型等级评估基础设施(Model-graded evaluation infrastructure)9 J$ S9 d6 N* p' p7 W Q
加速预测(Acceleration forecasting)/ d8 A/ Z! b6 v7 g
ChatGPT 评估4 \1 e S6 ~0 p6 F a7 X2 j3 v$ r" l* M
能力评估(Capability evaluations)+ P- `; M: B! Y q$ C$ r/ B
编码评估(Coding evaluations)9 i4 u- O4 Y1 D2 g
真实世界用例评估(Real-world use case evaluations)
" [' V- J" C( r: X 污染调查(Contamination investigations)
) J, D( g2 m" ~3 D/ U 指令遵循和 API 评估(Instruction following and API evals)8 x, t# r1 C8 B1 ]) m
新功能评估(Novel capability discovery)5 D, ]9 t' I/ g. K3 j
……
) `2 v- {7 a& R1 K0 k 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
8 ~* n; A9 q( ~8 m 在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
' f" P' d1 k; H 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。2 {% D2 G _6 }1 v+ }, T
9 J1 N8 ^/ j3 P& k7 ?$ A 鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
9 e& V! Q+ B* Y' [+ [7 K% j 预训练组5 T T) h" w- f8 z9 K) l
Trevor Cai, u( w* t9 J. {9 M( @* {( F3 Q
Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
: z$ q9 U, U% P" u0 Y! @ 袁启明
0 Z7 I; r; W! Q1 R }1 t# }
0 _0 z' {) E! B$ z8 F7 W6 K3 y; l 袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
2 v: e* X5 ?& l+ X( @! t$ P2 v Che Chang5 y1 a: X7 J% t: s
Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
/ } b! f3 U; U, u 欧阳龙1 o) L) c( l! v6 B& r3 J8 @4 g/ L
欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
4 C8 ]; P P( X Q6 l: _ 翁丽莲
, `* Z4 b4 ]% E 9 A# N1 h2 m3 b; N( p
翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
9 }6 g. l4 R, E2 ^ Tao Xu
9 P: q" s6 c& S( V/ c* ~ Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
. l" p% M# Y$ l0 @9 P8 e0 B Jie Tang
8 k0 x3 z8 v' {: |: T2 k. p
3 j" |) p1 `" i( T# n% j Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
2 t, N; O3 M4 D, ?6 d Ben Wang
0 P9 o Z% v% e; H- L" q Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。$ ~9 K; d+ |* s+ [) x
视觉组0 E7 |4 _+ f+ ?7 f% N2 H+ Y4 }
Mark Chen3 G4 q" ~* L$ P3 x6 Q
( v" K$ }) E$ n, t
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
6 D6 @/ H3 |: g4 x, `9 O8 \- w3 Q Casey Chu/ `9 J$ r. g5 u9 Y- Y5 [
Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。* U# {7 m) }( w7 B2 V0 U
胡绳丽
- I! z& \) }8 ^* b$ D8 @ 9 e$ R. l6 ^4 v v( N9 \0 F4 v7 `
胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。' g9 k% R0 L* G% c0 ?4 T* m! A! @6 N
Tianhao Zheng+ w2 y8 ^' [/ ^+ V9 z- d
Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。! [) R6 l+ L0 G2 }0 N9 Y3 W! M
翁家翌
. e- Y& W! s* {3 j$ N% p; v) K ; }$ z8 m, [: r# h+ m+ h
翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
. g+ f( T( a; A. ~+ G. [ 强化学习 & 对齐组
2 x, P4 q( Q1 m3 v& I Chong Zhang/ C$ u* K% F6 d( ^, z$ _
* @, m% p( p- N Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
2 ?" w+ Q, q; e& e, x4 m Shengjia Zhao
8 J9 K) U0 @) s 4 Y. M6 y& i* c W
Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。' }5 F( {/ @) Z, {
Stephanie Lin5 j) _+ n7 p/ @; U. |3 Q
% r3 t8 i2 o0 X' ?+ {
Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。- l5 }; `1 @1 X
Tong Mu
# m8 z) C4 H. Q
7 M; G1 ]* N% }1 K$ H2 q Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。/ W) N, P+ V5 ]5 T* T
Jeff Wu) ]0 V# [% k5 ?
1 C7 n2 Z, }: T! U& `2 G# c8 W9 V* D
Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。 y: a+ D* d; J
肖凯
( W8 e6 D7 u. u' j " ]& O" ~# W( ~& ?( v% C
肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。. Y% n8 i( {" V$ w. o# ], b
Kevin Yu. S0 l( J; g/ f
2 q* \4 Q* W% _/ A! s Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。# j! T t& A' S8 ?! M: e# S+ J! R
Haozhun Jin! ^6 ^" g. @1 N" J
- o- P: ]$ t& p7 r& m0 z
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。! |6 { \4 h6 }1 }' ~9 C
顾世翔( s; d0 j7 z2 M
0 a* i0 u. I$ `8 ?( t! i" W
顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。. _ W8 c/ W$ T( y
评估 & 分析团队
7 n- q* F/ D& W2 @/ h2 p0 E Alvin Wang
5 {( @* u5 ? W! n 1 m9 U' p) {* m+ E7 w+ D
Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
, g) u! b, P `1 n A4 |* I+ i" v, { Angela Jiang
3 a* E: ~7 j. y. H( O1 C 3 w/ p# }9 U/ V/ a, }
Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
$ P; M' W. p9 b7 D4 y( M Jason Wei) N0 t* `0 e% ?" }7 [) d
V4 R9 B8 k% h% _0 h Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
* [& ^% F% t. [: k( l; s( e t Y Juntang Zhuang9 W l. |- y( J5 X4 O
# u: W( B. ~+ S5 | Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。; d. p% Z) t5 E" c6 {! y/ X: c
Derek Chen
& O N2 d& O* i1 E p2 O2 j
6 O# S, i3 [5 \2 i% _ Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
( J" O6 s* u1 V8 E; x 宋飏
6 J; a- S/ e7 ?5 m( R9 Q
5 n6 v* e) F+ C& Z; ` 宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
4 f2 X. a1 s) \& ~3 L: A/ L n 模型部署, o4 g/ T9 g& i( R, \1 ^* V
Michael Wu
; m. T# B% @9 Y- e2 | 4 u! r, r3 a, X; a2 }1 K8 b
Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
, l2 a! {2 x7 T+ m5 D Andrew Peng
! V( \# l+ G4 E: j ! H% U2 {% }( Z' q
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。- }0 _" c1 b8 @; T! o0 b1 u" g
吴雪枫
. Q6 ]+ F5 s6 B+ L0 F
B% Z; k5 e9 u7 I. ^. W 吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。$ b' V( O' \! f# n0 Q/ P) l
Jason Chen, D% j. y; c* F% j
" z4 ?$ d. @! f! T) e Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
0 U1 P# p& H5 Q/ ~( Z# Z 其他贡献者
8 t, K0 j8 L- v+ I5 M( Z Xin Hu$ T# k. u# A. h$ |# y' h
8 Y1 Q/ ^( {9 z: S
Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
2 I& C( y3 g0 B+ R 此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
/ D. W% @4 a2 d( P8 ]4 _! n 参考链接:6 x( S1 i5 [( q# _
https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd! i, h& L' C9 O. b a, [& r3 e) {4 l8 F
https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|