京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 923|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。. y& `, x; |# {' l" d# N* \
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
: T) ?) q5 X+ I+ X* a            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。: A0 p0 @" q6 |5 h' p, p
            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。. ?- n& W6 f! v
                        
0 V0 x) y6 R* X- U, E( x            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
. u! m8 M) w7 I- x            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。# |% z! o7 ?/ F# Y+ ~2 O! s6 n2 t
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。: {0 y% d1 y4 |; F# ~
            研发人员占绝大多数
4 K/ Y$ H3 D0 O            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。4 ?2 c% U2 u0 P1 Q& `6 ~
            预训练部分的工作细分为:; T0 F! T. P- a0 h
            计算机集群扩展(Compute cluster scaling)
* g" q+ n* M( \5 R, r9 h) U) z8 \            数据(Data)/ L: ~" P& C' e8 y1 K. S$ k
            分布式训练基础设施(Distributed training infrastructure)- s4 q6 g( W) ]0 g! ?+ t* S
            硬件正确性(Hardware correctness)3 Q2 S$ M4 ^& w* X, ^
            优化 & 架构(Optimization & architecture)0 E% k( L, e6 q- L
            Training run babysitting: u" n1 \" F* Q( H/ W
            长上下文部分的工作细分为:
: g# s$ D3 t: K            长上下文研究(Long context research)
/ ]" ^4 P5 T3 e+ m) ]  c            长上下文内核(Long context kernels)
* a- K3 n! a, ?$ ]" r            视觉部分的工作细分为:% \# |8 H* Z2 j! A. s
            架构研究(Architecture research)6 k3 x$ ]$ F0 q' J; b
            计算机集群扩展(Compute cluster scaling): G- R& T6 b: B; P" U7 G9 y  s
            分布式训练基础设施(Distributed training infrastructure)
. C0 ]8 F! ~; o            硬件正确性(Hardware correctness), i+ H/ g4 ~5 e7 Q9 {4 Z+ @
            数据(Data)
3 a% ~0 u9 \, S) a' Q8 P2 B. I5 Z4 O            对齐数据(Alignment Data)1 ]3 r7 c$ ]; Z# V' H% f8 `1 g: Z
            Training run babysitting
6 K( o/ k6 t; n* e            部署 & 后训练(Deployment & post-training)
( c& P" C; Z& M2 Y. Y# j. A3 x            强化学习 & 对齐部分的工作细分为:
, _0 F8 k# ?3 m$ j            数据集贡献(Dataset contributions)2 Z) Y' E7 k+ o/ A
            数据基础设施(Data infrastructure)0 a' S7 t7 E3 J+ }* l
            ChatML 格式(ChatML format)
/ R( l2 B1 k' }8 ]; M& d. U            模型安全(Model safety)4 f$ p$ C. }/ p8 Q6 X# I
            Refusals
4 X: M4 m6 `: L            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work). Z) U/ [+ [8 m1 O5 w5 [
            Flagship training runs; ?. G) `" p' G( i- f/ T
            代码功能(Code capability)
/ E2 @2 n# L! C! }5 }7 J5 W& x            评估 & 分析部分的工作细分为:
/ a5 ^3 J  d2 k            OpenAI Evals 库% S" \+ `# E3 d. X& n3 X
            模型等级评估基础设施(Model-graded evaluation infrastructure)4 y' r4 K) d2 L! Q3 `" |: H
            加速预测(Acceleration forecasting)
5 m! H) V+ F3 G3 q+ P. P) u% V. F! P            ChatGPT 评估
4 r) _& S+ _7 ?0 _4 r            能力评估(Capability evaluations)
) a$ D/ U4 w8 f4 T            编码评估(Coding evaluations)1 ?( ~+ `% P* T0 c) G/ _0 j
            真实世界用例评估(Real-world use case evaluations)2 V9 i) _# Q3 \: i7 T. T, G3 |
            污染调查(Contamination investigations)
: m+ Z( z2 n) J' e            指令遵循和 API 评估(Instruction following and API evals)8 v- P5 K5 j2 g* O+ {. }$ B# c# u
            新功能评估(Novel capability discovery)
2 f: c' `5 M% `8 A            ……
4 q. @* q+ H+ b) C; u6 p* n" A( p) ~            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。0 o- `8 W/ x3 _! _# j- T6 w" V
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。! ]5 I4 \+ i# ^; ]
            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。0 z, H) }9 x# o$ W, U, K
                        % q7 q  B/ [: X( T: y
            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。0 D7 |7 b% R4 x6 a
            预训练组
6 l) B0 V. N' J+ g6 Q. D            Trevor Cai8 Q+ z9 Y0 P0 F! M
            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。6 g% j+ g! `( _& n' [6 R
            袁启明
; j/ ~' T6 U% ~# _) C                        " L$ `3 r3 j, ^8 W8 R" B, y- Y& Q
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。/ M7 K; j1 \# G! X. O& N6 }5 Q7 B( \# P
            Che Chang$ ~! ~- z3 U' z0 Y* {* M
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
5 g6 Z. G/ N# t" {6 o+ s' Q) w            欧阳龙. j# ~+ E9 ^8 T5 J% c
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
$ n6 k* D8 a) s9 U" @            翁丽莲
4 d+ H& l5 r) u7 z                        & R6 b  w  o8 S
            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。2 U  }( q3 ^; P8 ~
            Tao Xu
4 N+ {. k" [0 I2 e) W            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
9 m- h+ J3 A* D; O2 c- W7 O            Jie Tang! [3 V4 h6 V9 J: o- y
                        
6 H# x% C6 u. M5 {& ?  X            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。, X& o9 e# i5 f$ r  y; D2 ?
            Ben Wang: |( U% n" g: m" d
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
8 w% A# c( P& e# a+ S            视觉组
' U6 m: m+ P; U  l            Mark Chen  C5 o1 k0 v5 w2 b' i, V/ `+ K
                        ! c# b; n$ l% t- B6 L
            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。' E7 i% A  w; K1 ]" l7 G
            Casey Chu
3 |1 X  T, K* l3 d            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。. s' K# W1 z# f; K
            胡绳丽' d+ f% X" `5 z( ~( W1 y
                        8 a. E! W6 s7 V
            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
3 U" |# q' h( q) \0 e' S9 j: H            Tianhao Zheng4 q9 `/ \4 y  }  Z$ l
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
6 ?! l1 y0 |9 t  }2 J% f6 J            翁家翌( |- ]! G1 x2 n, p+ T3 s) U
                        4 X* L: i: C3 ^9 I4 f# S* o
            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。, b4 c5 k, s; v1 C: I, W
            强化学习 & 对齐组( w4 o* |- v) Q: ], e& l" j
            Chong Zhang( N- w5 J. y0 ]; X8 }/ m5 y' {% d/ t: z
                        9 [/ i5 \3 |3 M
            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。/ h! \% D. M/ {1 p. d1 ?+ d
            Shengjia Zhao" R! l% M) T, W' Z3 D+ t2 d- |
                        
$ y; W1 B4 I+ [5 v* ?/ x            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
( f$ Y7 d, H9 M8 A" Z% F! h& P0 G            Stephanie Lin/ H1 B  N" y% X
                        . j# w5 @) I' d& h2 T
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
  x  [" J, `( V" F! r            Tong Mu5 ~3 @/ a8 |& c* O9 Q! p7 k
                        
9 D; }1 H( K- j3 \) r            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。, A8 z! K; I& i. \
            Jeff Wu
( T, _  e* ~2 W1 `/ a6 T5 o                        - H) F! ?: |& v. O
            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。$ [3 `! Z6 M5 G0 t/ N5 \
            肖凯# b0 b7 L3 V: K/ m9 g, g9 O
                        4 M6 @, H1 O5 ^5 X/ q. I1 @
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。: @& v. ]' V3 g
            Kevin Yu
# x& r2 _! I3 N( F$ ?/ ?, g                        3 w& F( r$ J' a
            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。
% N7 g% C' q& X8 l            Haozhun Jin2 _$ Z2 O0 J, |$ ]' U5 H) ~
                        
8 O$ w# a" o8 q* j- H$ Q% s            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
+ T- Y% p% _  X  u8 {7 ~            顾世翔
' r  v. e# x  G5 t* l+ u7 m                        
% u' s+ r9 f" J# _& I" w            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。' Z. u* r$ O1 D7 P' F! b3 E. R
            评估 & 分析团队
' `# F. _1 n! `% p1 j$ K            Alvin Wang! t+ f( E+ Y. N" [% _2 \: _: {
                        
( o. T& h$ }, E! k            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
2 X/ a" o) Y. h; G% |* O; @: W            Angela Jiang
4 U0 H4 ^% I! s; E; ~* T                        
$ J7 b+ [% n8 v* ]- g2 s            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
1 n0 B( ^. X: |9 `            Jason Wei
, U, Y) W, V  p. i                        $ R2 q% ^  |4 W
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
& ?8 S) Y' L) i9 P9 S            Juntang Zhuang
1 L& l+ h2 K' u+ Q. G+ A5 I; g4 H! Q                        
( _& I& g- @1 e  L8 n# P            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
" r" c$ s9 l( o! q            Derek Chen9 h+ G+ Q( x1 N, J! f
                        
( l* I8 I% [& ^- M2 d9 S, Q* O  ^            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
; q% e4 O( E' j3 V8 e/ n$ `            宋飏% `( D* K! }/ w. F) p# B
                        
; x8 W9 Y; x- y( l/ R2 [            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。) Y* t  p3 D2 G+ M  q0 m: p
            模型部署
- ^% p. n& l& t' M7 y            Michael Wu- G  d+ ?& X" S& P7 w
                        3 }. v/ C+ _. O4 V
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。& D* G: A) ?6 U5 n0 j4 l
            Andrew Peng
: j0 Z2 X1 u3 p! W/ p                          B, t1 K2 T+ `- Z- b
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。4 m3 \$ v$ [7 P: t
            吴雪枫
: n1 Y3 V0 |- Q8 K8 Y                        
0 @: g" w$ w; O  F7 l            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。( _- r; b5 W9 P0 w. P5 [; N
            Jason Chen4 |: z, [2 E$ _( H. a& U
                        7 I6 G: H) F, y9 n( s, X, U
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
4 p: N/ `8 F5 n! V1 |6 Y/ K            其他贡献者
  d) M+ X0 F2 U3 j) {; q0 j4 O            Xin Hu2 r; H6 F9 N+ J8 K, f/ n6 ?$ C
                        . N3 L9 V4 }. d& R+ z( l8 H9 G
            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
$ ?# w4 e/ a- O0 ~4 R            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
" P3 g# t1 s( p            参考链接:
1 N! Q/ l2 L8 m  y% g            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd1 v- U/ {* U5 Q% v1 F% J
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-26 03:03 , Processed in 0.060628 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表