|
|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。$ v) M2 k4 r' H5 z2 B, [+ M8 I# Z
这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。! ~1 x& r5 `% u3 O1 O
一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
6 `- O4 Q6 _" u8 ^ 但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
! E0 {0 c# d; L) T$ T" r + p1 W; L J) X* q- v
鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。- Q. b1 c9 s6 Z/ P3 ]6 z) q
不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。4 }1 r5 h3 r9 f. [3 X6 M
在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。8 K0 ]1 P x0 j2 W
研发人员占绝大多数
) d9 t' {4 J- Y% P( q4 m 从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。0 k6 b" _ n' g
预训练部分的工作细分为:
! B3 C; _; ?! D: G 计算机集群扩展(Compute cluster scaling)8 n6 q7 o# T) q" _, z
数据(Data), [5 b) o) c# v' O: ~2 l4 U
分布式训练基础设施(Distributed training infrastructure) Q' u# l$ v# C2 D* X9 T; ?
硬件正确性(Hardware correctness)) H4 y m( R; U* J
优化 & 架构(Optimization & architecture)
8 v# v+ K. m! A0 \ A% ]1 W: y' y Training run babysitting, A d) x0 p0 d1 ?3 v- {4 ^
长上下文部分的工作细分为:! |8 [0 y- {4 k/ D/ @
长上下文研究(Long context research)
2 v! z) W4 V' v' B0 j6 h 长上下文内核(Long context kernels)
" Z$ g1 e1 ~, u% z2 M# f3 x [ 视觉部分的工作细分为:& @( b# T9 i/ Y" q- j, u& R, }, ^
架构研究(Architecture research)
5 m( M- y" y+ f; I3 ~ 计算机集群扩展(Compute cluster scaling)- Z3 U7 ~+ R! _. v v+ ^
分布式训练基础设施(Distributed training infrastructure)
9 G6 w5 O% {/ @, q 硬件正确性(Hardware correctness)1 h0 C/ S8 @9 k9 W% Z9 p
数据(Data)
: G& h7 e( p( U 对齐数据(Alignment Data)4 S+ v4 } }0 ~. H
Training run babysitting
! m8 \) ]9 E b: g; p8 Q 部署 & 后训练(Deployment & post-training)
6 j: [/ ]- F- A. k* {- V 强化学习 & 对齐部分的工作细分为:5 e. W+ n6 @! i" e
数据集贡献(Dataset contributions)
" n- B2 d) U) X- a) x0 c6 R 数据基础设施(Data infrastructure)
G9 B& k( L! O+ [- x5 x0 a ChatML 格式(ChatML format)
- P, i0 n1 a( P5 i 模型安全(Model safety)# r! ] E: q$ r8 N$ m7 T
Refusals/ J& Y- y3 |- w
基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
# f, r) V7 \; n% o; F& }: ` Flagship training runs& I3 p+ j9 i6 L3 B* Y0 r5 d
代码功能(Code capability)
; S K( a3 u: n' n8 ?5 s; P 评估 & 分析部分的工作细分为:
8 S% t+ G6 K6 g$ g OpenAI Evals 库0 s/ {+ S) |; k* ]3 ?
模型等级评估基础设施(Model-graded evaluation infrastructure)
! ]% ^2 a4 D0 w4 ] 加速预测(Acceleration forecasting)# A0 z- O- ]- E/ u" m2 t. ]
ChatGPT 评估
% r( u4 l! D+ e0 L: K( ? 能力评估(Capability evaluations)
0 G, x# e2 V7 |6 s% Y 编码评估(Coding evaluations)
; x. ` Z6 k& K4 t 真实世界用例评估(Real-world use case evaluations)
5 d9 c4 Y% n5 b0 |! Q- M 污染调查(Contamination investigations)4 o) r. J5 v( h9 g; {! l, d
指令遵循和 API 评估(Instruction following and API evals)
, y* p" z1 l! S: n 新功能评估(Novel capability discovery)
2 Z N; m8 j8 ~6 N" _8 b) N ……
5 D; c) ?" B$ y+ a ] 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
, @& i/ z1 H4 V$ K+ n: r 在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
7 [( ?% o; O1 S. i! ~4 d6 U 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。. W" G4 b1 \* J
* B( Y/ Z" z6 y7 r; }4 U 鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。2 o' z# w' C. C& m4 s, E/ g
预训练组
6 X; E- W' z Y$ c* ? Trevor Cai' [5 [4 k( c" |$ v# _
Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
; n; O8 g: t, e 袁启明
6 x7 g7 L2 J/ i6 F O' f ' c8 W9 Q: p2 s0 i, E
袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
7 i1 \) D5 h6 U1 @1 W) p" m Che Chang
/ m2 X, U/ W0 m8 {9 V/ R0 s Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。1 H5 c) o/ j8 @& ^6 `' Q. @% k
欧阳龙
4 v4 L, e) Z0 `; X, A {. } 欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。4 D: p( }& x3 L# t3 [
翁丽莲
9 D+ y9 r4 Y- a' C- w8 u 4 s- p* l+ f9 f$ _. M4 ^
翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。( X) d( K. P, ~6 Q: v/ c# n+ e z
Tao Xu. r& h$ S/ A' r! l% D& X
Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
, A( a& H5 H/ t% S8 i Jie Tang ]$ F6 |: p) d6 R W
- K" Y @% g: P9 M8 k3 H( N
Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。/ d. ?! ? ^/ c" J/ a& u
Ben Wang
/ L0 V- W& U, H& s& a+ M Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
j4 I8 Y' z; [2 j% e. P3 o 视觉组5 l! v0 n+ n1 {4 ?
Mark Chen" e( G7 d6 i/ y! W t% S" L& R1 x
; T4 N2 R# B- W/ F Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
1 P7 O$ ~4 m- C6 q Casey Chu# s3 z( s8 |! g7 O) ^
Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。+ W8 j* f' p$ b F, y" z8 L/ v/ W
胡绳丽
- x/ J) h$ F* V* Q' J r+ a8 k $ g9 h i5 ]1 `, N
胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
- x# H, E+ ~& T1 F1 A0 I Tianhao Zheng
' L0 s0 R9 O2 D% S Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
5 z5 V/ P7 Z# v* T/ f 翁家翌
, | K7 w$ R( E T* u
1 {+ ]; {' P0 h2 k! ?" F3 z5 B 翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。4 J) G: \9 d( R* V l2 T6 K4 ?( k
强化学习 & 对齐组
2 I& K9 E( o: Z& H5 i$ O Chong Zhang) b- C* q7 c! ]
6 b9 ^7 ?- s- B: p0 K4 p
Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
$ {% j7 Z! D% }9 o' `* ]4 V Shengjia Zhao
, K: b+ s& ^3 o8 m# J6 p % T( B% ]4 s8 }/ f; e* X! ~
Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
r6 h6 k l5 j' n, W* h2 X Stephanie Lin; z. |8 X2 D% z* `4 v
# _) l; n1 G# |2 o. J1 n6 I: h9 A. b Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
" O" H* K3 @4 M0 t# e& f" T! o( D Tong Mu/ h9 J. ?$ s7 [* E
! i6 U6 `/ z: {3 r$ c Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。* p, Y( P% |! W4 B- i+ ]6 B
Jeff Wu
# W: P2 K2 z$ N% Z# R% |/ _ % z* }9 l0 C9 q) C6 m. O2 D
Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
( L3 K' J/ M( s2 Y 肖凯2 o5 x. H( O3 W1 s1 C
: e- l# E- w' T; X' b" [ 肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。' p9 Z" p6 ]) F N" Z
Kevin Yu
; y2 O( R9 o; R3 b6 s2 W
4 \9 f, p( S3 W" b Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
( @3 M9 p: f; ^4 Z$ o3 f, ~ Haozhun Jin
; L, U! U& s6 `$ e " ~/ P g5 R& |' A0 A
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。) P7 l+ z9 n' m7 ]3 z3 o. _
顾世翔) {2 z; H v: l/ A7 M2 s6 D' ~
0 p8 e T7 L: i( ?8 g2 v
顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
9 ]" j" W. @' v# e G 评估 & 分析团队0 I% E3 l1 G \/ E! P
Alvin Wang! v6 b1 T8 `2 q9 \0 h( c# `
0 f) X4 q5 h) D0 O; J$ O. Z& d* C" v
Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。+ W. x9 V2 B! A& P* Z8 k; v
Angela Jiang
) j; E- x6 d( l. e : Y7 z7 W, I" D K
Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
6 H1 u8 G) x u- N, k) E4 X4 y Jason Wei( b1 E4 b9 J/ C$ l* B( S
' R( y$ X5 w& W% L' p1 f Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
m" `+ n1 ^! F& e. d; L Juntang Zhuang0 @4 S7 c, J: G1 t- s' y
( o( ^& E% \' M$ c. q: H# Z! }* r% O
Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。! B" q$ y4 z# u/ k$ |, a* S# d
Derek Chen
! J& E) p# ^. `( @ / t( `+ m% D' o
Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
) C/ l' f: m4 d! y1 F 宋飏
- ?) @ p1 Q' n
, B4 B$ m; Y i) u 宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
3 J; V' ^1 A/ D$ o; I* h 模型部署
; a) `0 ?" y( {8 n" D: b1 o Michael Wu
. Y& Z% X8 {' y W) c) m
4 [6 j% h! \$ O4 o Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。% ]5 t$ Y2 x4 T; J/ ?8 }) f
Andrew Peng
; X& z6 Y" D& J& c2 ? ; ^# {1 P! ]0 d$ n% L! {7 T
Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。! g4 f0 x5 ?7 c6 L; r4 w
吴雪枫
6 u L; r0 x1 F+ R # Q. o& {% i2 c; }6 Z0 C! ^
吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
$ I3 A0 D$ @$ D+ v Jason Chen
Z+ X7 }- s' Q
" h' R) s/ c% C) Y+ R" i Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
* J" c) y6 V" K& G6 h7 J* f 其他贡献者
5 t0 \# s9 n( D6 r, \# S Xin Hu5 u0 ~5 w2 O. |& i$ C7 X; e
& f, x8 V8 L, g9 F8 Y Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。2 [0 K1 p& m) j9 \6 R0 {
此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
' g' m) V* Q: z: G 参考链接:; {# j( ]0 H [$ l
https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
+ p9 r; B$ b- }0 j0 v5 B" q" P https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|