|
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。2 C1 f& ?& }2 E& N
这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
2 _0 y/ q) x0 _- k* a9 f! [ 一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
9 |4 A9 h+ ]' T8 C) n8 Z 但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。' d( l: E- [4 I
; P0 i9 |. `0 ` K) m 鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
" z. a" u! A+ Z' E 不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
5 ~5 h8 B8 h. H 在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。/ p) B# R) I% T6 G7 B0 b3 v! b
研发人员占绝大多数& W( v8 H; V3 @, F$ @- _$ r0 d
从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。6 g/ C( { t) N
预训练部分的工作细分为:4 d- v m4 D5 M# w: n
计算机集群扩展(Compute cluster scaling)5 t5 ^5 Z9 p* I. C
数据(Data). \4 [6 K+ _: T G, d$ y
分布式训练基础设施(Distributed training infrastructure)" Y5 v' t, V K# x2 |% L+ h
硬件正确性(Hardware correctness)# O5 O% _8 v; s
优化 & 架构(Optimization & architecture)
! O* k# P0 G7 ?/ x Training run babysitting a, b: q `2 q% n0 d9 o; v5 r
长上下文部分的工作细分为:
) @1 M" A, V& q, n4 N/ S 长上下文研究(Long context research)5 M- [4 R( U) t" @
长上下文内核(Long context kernels)
4 R# ^9 {& M4 U. y0 b. f 视觉部分的工作细分为:* h" F' c! ^/ x! P( d
架构研究(Architecture research)9 A. }0 V1 @1 `1 K3 u- l
计算机集群扩展(Compute cluster scaling)$ ]! I! Y0 S# s3 O3 h) P
分布式训练基础设施(Distributed training infrastructure)9 w. _4 H$ k# A+ f5 P4 Q: J
硬件正确性(Hardware correctness)8 b p$ Q! e5 i, ]/ W. K
数据(Data) B+ c( ^- Z1 U9 M% ?2 o* C3 s
对齐数据(Alignment Data)
/ u+ Y* i0 P, Z1 G Training run babysitting
+ j( S- i; ^+ H 部署 & 后训练(Deployment & post-training)
8 P* ?* k; f! Y8 ]/ W4 _ 强化学习 & 对齐部分的工作细分为:' P% ]- B2 f1 j) ]; B- p9 O/ @
数据集贡献(Dataset contributions)
' ?/ Y( g6 B( x+ h: U# j) h; d 数据基础设施(Data infrastructure)! V% D" l0 |0 A* e* }, O3 ^9 j
ChatML 格式(ChatML format)
# F6 U8 |! N8 ]6 \& w# T 模型安全(Model safety)
( }4 S7 Q! ]/ w* a- k9 g, z. m Refusals8 ?" l. b1 w6 v z' A
基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)& D9 Z5 R, m; V& `
Flagship training runs
+ B$ x# H$ a0 F* X& P# d g9 N' I 代码功能(Code capability)8 |0 X% m. m5 v& `1 m, H1 Z" [
评估 & 分析部分的工作细分为:5 ]2 a1 ]9 \% r$ _0 S
OpenAI Evals 库
: C# J3 [7 E) X 模型等级评估基础设施(Model-graded evaluation infrastructure)) v5 u. |- x6 d& w2 {
加速预测(Acceleration forecasting)
" T* w9 ]- i, ~ ChatGPT 评估6 V5 {% W; H; K* Q5 a' F7 O
能力评估(Capability evaluations) r: r1 h* t/ \; e
编码评估(Coding evaluations)# D5 E$ J( g f; E4 g! X; T
真实世界用例评估(Real-world use case evaluations)
9 h ?! r) m. d3 W+ u3 I& ~ 污染调查(Contamination investigations)' l0 B4 u" A- ~1 ?
指令遵循和 API 评估(Instruction following and API evals)$ S# }# I! {2 V! c' X# _
新功能评估(Novel capability discovery)8 m$ K! H$ o. E- \( |
……
+ N$ E5 T v8 T1 C$ |& y 细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
. A- S& w! w ~+ N: u7 A) R 在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
, O5 t6 `% u2 P" k! f9 C, P, o3 V 在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
! \, R9 k8 R# L$ {8 { % q) L9 f0 Y1 a6 K& I O: K6 |
鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
' R6 I- V1 k, o3 o 预训练组) ?& c4 ]7 Y' k2 ` f5 Y0 z" j( E
Trevor Cai
" }, y! l' Z3 Q6 @' }+ _% r1 L6 P0 o9 ^% \ Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。2 K+ l% j/ g: e7 r6 B2 E" z
袁启明5 V* ]3 U: K \2 ~$ Y) b; B, Z
4 J1 _6 N0 q$ C h3 h s 袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。! k. h8 @( o1 f- j( f% F
Che Chang
$ s8 B: l) e: P2 M( E Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
5 {4 J) t9 o7 h$ J) {3 O( x _2 B 欧阳龙
1 F. ~0 H+ N3 y7 ?- l% I8 j3 u 欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
# Q- D/ m- D: T/ F, |; O 翁丽莲
0 E' L0 z, k+ Z4 j7 i+ S
6 ?* n' @! g7 ` @. E, N 翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
2 B4 b* s5 c" S! n" J Tao Xu! w% L9 U& G; b2 F3 y- b
Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。4 r( t9 J6 a4 Z1 ?/ M8 z! E. Q
Jie Tang: v) \. R( B; J0 v1 J( {" _8 e
4 G# k) V" h+ n& Q8 A8 m5 U. F `* N Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。1 h2 D$ l5 L: |' R9 N; i7 D8 t
Ben Wang Y" q2 x3 O: m9 I5 h' Y
Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。1 W$ g" c* L+ J% W( p
视觉组( F2 T" f% Y7 l5 k3 k6 C! m9 l- ~* M
Mark Chen
3 x& g# Z3 t9 V0 P% ^ 8 T+ ?, I" Z) w6 v3 v2 E
Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
4 e) B9 U$ G3 j# c, i Casey Chu
7 y }7 x1 ~% B" s% N5 d$ z& b Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。$ P' @1 ]7 S9 M% \4 G$ B
胡绳丽3 @* R& b# A3 f) B+ d
: x/ A. U0 j) r( g7 ]( I6 S8 P7 v, a 胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。9 J' G5 G3 j7 N, _0 j7 s9 P' E
Tianhao Zheng
5 D; C% ?- R5 T8 i Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
5 Z2 }7 T* I6 m; ~( y% X 翁家翌
) x/ r/ W9 U; v1 g2 P8 f' n4 N- Y: y- A 0 k+ T7 ~, U0 W! X
翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
! n) ^" `1 z0 k; r0 X& O 强化学习 & 对齐组4 D, J1 e# b. }* s ~4 }2 d9 G! r( Q
Chong Zhang
3 }6 t$ D6 Q' c
/ m9 d8 ]7 M+ K( w; N/ h Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。) P# K* w) i' m3 j& V
Shengjia Zhao
& O9 z' Y) O0 T9 v) k: N 3 D8 P% g5 i# Y2 ^* @! A) B
Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
% s; n. d' A% o2 \ Stephanie Lin
9 S! z* d' |- z1 L6 }1 I/ U; d/ }
% l( H$ C$ d# L$ @0 l q Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。" ?( g& ^8 t" ]: y" i, Z! H
Tong Mu/ v) S! I9 t2 U$ Z
+ c1 ^% s+ j$ O- ~: \ Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。9 m1 y2 r, a4 g
Jeff Wu
! _1 R; F. u' U- X 2 ]* w$ s6 I9 q' C7 Q7 ?, [
Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。3 m( ?3 ]4 b v
肖凯" q1 J/ g- E( x" B! [
& Y/ C& E; _ X, I
肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
% Z- X4 b6 A' P. K Kevin Yu' |$ S3 R2 s8 B% A
: q( T4 u+ E6 U" _ Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。 Q D4 V% L# z
Haozhun Jin+ d' C1 E3 J* T+ ?1 X
+ f1 o. \! g- }+ ]
Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。7 k0 k! m$ e8 |
顾世翔
9 i+ P% r" u0 S
0 P. m5 K5 a! a- m 顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。
0 l& C# L* k/ S& C5 C5 B 评估 & 分析团队: d' m+ E; t. ], x# `
Alvin Wang
c6 r; A& W& w" G* h1 x
% M% J# W" M1 C( X5 X% g Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。 z" p; E& f9 J j' `- y8 ^
Angela Jiang: a0 y6 a3 p1 B: Y3 X' ?6 y8 B8 P% m; c
8 U9 k. b, f2 r5 V m8 P5 k Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。$ K# k% k" D7 x% d: } x
Jason Wei4 k" X* p. z# U
4 @# q$ L5 `( h0 d
Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。, ]. G; c" T! j; G9 h5 c7 E4 R6 k% [
Juntang Zhuang
$ l" G6 a) e4 j% V 0 u% G/ M: z N; P0 W2 }6 T2 e; P8 _
Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
! ^% x4 {, Z/ i$ D Derek Chen
+ ^, D7 s' s8 x5 d 0 c$ t' |9 ^# B# D% L' E1 n
Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
/ \1 |$ p L/ O; ^4 S' G 宋飏2 P" T! U, z6 n% G
% z6 c! M/ M; V& ?
宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。/ ]: `- f5 r4 ?. X% }' a
模型部署
2 N" X8 v9 O6 Y) r3 | Michael Wu k9 m4 r6 g4 X7 t
0 f0 P& @. r; P1 c N1 Q9 t% c Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
% E$ j: N- B/ ~. x c z& U0 n Andrew Peng
: L' R4 ^( N& D4 k( i* D
5 w' M9 {) c7 W# { Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。7 Q2 x V5 d" X7 ^" I
吴雪枫& C2 S/ \+ ]/ c) t2 Y. l
; Z1 ?7 D% o7 t, D% o) K5 ~! h
吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
/ z2 _4 t6 \: V Jason Chen5 ~ _% \& K# P) r
7 Y8 j2 j u0 y2 l
Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。' X2 ]; H- R! T5 y
其他贡献者0 x1 X6 R1 M$ X& q
Xin Hu
1 t3 t& w; _% I$ L * E8 z6 m' O6 q; P
Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
2 U. d) T$ p/ l6 ^$ ?0 t 此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。3 D0 P9 W- I: p
参考链接:
: c3 P' ^; W$ F3 T1 T& ` https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
/ A. U2 @+ I, r, u6 Q1 q. Q; p https://cdn.openai.com/papers/gpt-4-system-card.pdf |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|