京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 816|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。# p: N) w2 U, S8 I
            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。# j! F- |, Y! H( V8 e
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。; X; u" V7 e3 Y
            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。2 J3 T# l2 f2 L% A, R1 ]# k
                        ' n! I; |1 P% ?: ?! ]* r0 c
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。
0 d/ y# p9 q7 F0 Y; C- r6 \) w            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
9 l. `6 I  x3 t+ g            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
. L4 n3 B! H9 @8 v0 Y+ y$ ?            研发人员占绝大多数
) v; X0 D2 \8 ]" q            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
% `( e( x( F7 D& `1 w8 [0 k. `8 q            预训练部分的工作细分为:
" l9 n5 Y) Y/ \4 x            计算机集群扩展(Compute cluster scaling)
- `  s- ^/ k7 B4 ^            数据(Data)
7 |+ X3 _. N; s            分布式训练基础设施(Distributed training infrastructure)
% |9 v8 m6 B. S& ~: t            硬件正确性(Hardware correctness)
4 F, O! i3 X, K* j3 L# D' ~            优化 & 架构(Optimization & architecture)) x$ j9 M5 m; @& @/ W
            Training run babysitting4 ^5 }: k: i* o; g4 [9 c
            长上下文部分的工作细分为:
! S. D; A; \9 Y1 ?            长上下文研究(Long context research)
* z' e8 @2 o0 e" X            长上下文内核(Long context kernels)" ^4 {/ a6 M6 q
            视觉部分的工作细分为:9 V( `5 `7 a8 U4 H9 `
            架构研究(Architecture research)
% d0 l" i; o9 Q0 g/ n" K3 Z            计算机集群扩展(Compute cluster scaling)
0 h  ~! E6 O, W8 l/ r. C$ x" ~            分布式训练基础设施(Distributed training infrastructure)
: X$ w- o9 }5 a! B4 S9 [+ W            硬件正确性(Hardware correctness). {( M6 C) h! C( E, l+ y$ m
            数据(Data)9 n! @0 D+ }! @/ r* m
            对齐数据(Alignment Data)
. F; P0 A- l+ }' B- i, b            Training run babysitting, K' N# J1 ~9 r3 ^3 `! B4 J
            部署 & 后训练(Deployment & post-training)
; c$ u3 ^$ I* |            强化学习 & 对齐部分的工作细分为:2 a5 x% V2 i/ ?) C  V0 \# Z
            数据集贡献(Dataset contributions)
% f4 B. H& a9 H5 U" f! a2 X            数据基础设施(Data infrastructure). K, p: X' Q8 l  f
            ChatML 格式(ChatML format)
$ t3 `- D! R' c0 i$ p            模型安全(Model safety)
+ u& e1 z, ~4 C1 S            Refusals
0 l7 S! n! k% u3 J) Q            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)4 x) E8 l8 o4 j1 t  T
            Flagship training runs
" ?6 s3 p5 v# e7 |( f7 ?            代码功能(Code capability)
  ]+ [. k4 Z% |8 e% F- G/ |7 K            评估 & 分析部分的工作细分为:/ P2 C% u  s6 v0 G! L
            OpenAI Evals 库' j( o7 s3 v' w1 j
            模型等级评估基础设施(Model-graded evaluation infrastructure)
7 v1 E3 A! W) ~, `* Y) K: G1 d  \            加速预测(Acceleration forecasting)* m6 p9 t* Y8 K
            ChatGPT 评估  i( \7 a; S' Q3 R+ k- y
            能力评估(Capability evaluations)" u" p, \. h, R' {0 R
            编码评估(Coding evaluations)
' p' C* J6 [  c. }3 o            真实世界用例评估(Real-world use case evaluations)
6 G3 I4 ^9 E, J5 ]8 w+ k+ b4 m            污染调查(Contamination investigations)" R6 V" @, q% `% y& m2 n" y
            指令遵循和 API 评估(Instruction following and API evals)
+ a) K% K" [1 o$ Z( D9 O9 ]  ^, O            新功能评估(Novel capability discovery)1 ^+ q/ h/ M) I9 {7 M
            ……
4 p2 ^* z# r% e  K# ]; {! I            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。, i+ H8 W& U/ _" S3 C( C
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
2 ^+ [  Y- A" Q+ W9 K5 s. G            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
- Z# R1 f8 }$ J' S) ~                        
' r0 e; D# N' l) U% q            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。) e! d) R. l( A7 N. Z
            预训练组
# Q, e4 B; ]; f& x7 o  o            Trevor Cai
, ~  j5 {7 ^6 B9 ~            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
) L* r) E# g3 q- }7 q  g8 J            袁启明
( F9 X2 E3 o5 g8 m$ ]$ X% M6 H                        
; e2 s; G5 }/ z' T! E. a2 g; U2 r            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
2 T7 C; G* j( r8 U* u/ E            Che Chang; I+ H/ D( I7 y2 z& C5 ~; E
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。- x0 F6 R. b: r: S0 o6 P# ~' C- w2 F
            欧阳龙
$ ]+ i0 A) l9 n            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
/ S1 _, ]# i, O) M6 ]            翁丽莲$ i) F9 j$ ~/ W( z  e- S' @- t  ~' ~
                        
7 o4 M, Z- `+ u6 _$ W0 \            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。  c% j3 F; d$ ^2 Y1 {  H& m5 K
            Tao Xu1 ~) E( Z7 y6 E0 I3 u* z+ |
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。! P/ D0 e; H! g
            Jie Tang
2 `0 {1 U6 M( `' ~/ J: w                        
$ |$ L1 ^" ^" W- ~3 J            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
' D" O6 v8 w$ e! G' }& m            Ben Wang, @  h0 u2 R/ L) o9 j. j
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。. Q1 `* N6 Y  G$ Z  b
            视觉组
. g4 L& m8 W& z            Mark Chen
7 ]3 }& n1 d  _- J* Y  x, h: v                        : r: y- k: y; t7 v; N
            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
2 H! V% G+ Z' N: Z* J            Casey Chu
- x% ~5 @5 N3 D            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。7 [' J, C* o+ S1 M, }1 o
            胡绳丽
" Z1 Q6 P2 g7 ?, c) s                        
& I( Y1 B, O$ D+ L, l7 }. C            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。( S7 n  b6 ~& ]* R
            Tianhao Zheng
5 v& `; q" ^& _' m; {; @) R" N. W            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。' N: x* u+ O; `( B7 @
            翁家翌
! A0 q2 \$ b* J' X' V' N7 E: W                        
7 @7 ~: F2 B7 A, h            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
8 ]+ B. M) s8 Y5 W; K            强化学习 & 对齐组
! _! t7 J2 m3 ~+ {- V! T- U" S            Chong Zhang
8 q2 q2 Y- d4 o% T5 e8 A% I0 v                        ; ~, W" _3 S9 c
            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。* p  o$ K; @. C- v. {
            Shengjia Zhao# _* Z% x& y/ |& ]: o" u5 w
                        1 {- c. J8 e$ u0 g
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
4 z- r! n2 v% N            Stephanie Lin
* ]3 ~9 U2 w4 A: _9 i; B                        ( p' f; ]1 p: q. x
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。; k3 {/ P' ]& ]& q6 W2 [1 H7 V7 o
            Tong Mu
2 [) C' D, ?" {( j                        5 M  |$ f* Q5 H- A# z  F
            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。/ E7 k2 H4 J) T2 n, {' g5 s
            Jeff Wu4 ~( `: U3 Z" O
                        ( E4 I8 A; j3 d7 Y# l* d
            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。( L/ ~6 X( s1 y" k' p
            肖凯
, h$ [2 \4 ]9 `6 J5 H                        8 N  v4 M0 h8 o. Y
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。
, d/ p9 k8 p8 h            Kevin Yu% }0 U3 E7 w$ D# Q
                        
, p* u3 E" c& C' g9 N! r            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。' N5 i8 k9 @! H# ^# E" d% _# l
            Haozhun Jin1 I6 i( u0 r: X. k+ O
                        
$ [0 z! q/ s$ T0 ]1 |% h1 G$ y- y            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。! d' G; i4 K. L# W" }9 {% e  ]
            顾世翔
' f2 I" l! J- \$ O0 [8 u: Y                        
" h2 j% z, ~/ [- ?- S& `* L7 j/ C8 \            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。3 W5 ]4 s3 i. o" L# A
            评估 & 分析团队# D0 x- }- b: R" O5 P9 G7 X( A8 V
            Alvin Wang
/ {5 n6 _6 {1 |) W  ?: i, V/ w                        
. c9 S9 M( B7 Q; z0 ], V# ?            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
8 `0 B) M" v0 s. a# `+ L+ I' |            Angela Jiang
  n5 j( b/ z3 n3 ?, H% z                        
  m0 h; {0 s" T7 m            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
) |* I( M- A( A9 G5 @2 B            Jason Wei- f, {' ~# i$ s0 H. q/ c
                        # D6 P: i) b; Z: Y( y
            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
5 f8 R- }! X! T3 [9 F            Juntang Zhuang
; h, o5 ]$ G" Z% Z/ p                        
' W2 i6 S# |$ y6 q! Q            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
" B9 d5 {7 u. U. N+ T. R, V( E: b! o0 m            Derek Chen- o0 t+ L! s$ H4 J3 r
                        7 k4 J/ R* C) O4 O0 w0 y* D. x
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。% w) r% N* d: A" E" V$ Z( K6 x: D9 ^* \
            宋飏
+ ~' a5 A8 B( \1 I  I" B- r3 L( ~                        
( A9 y0 l6 B) n* J9 }/ {            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
2 X/ P/ u( d8 y            模型部署  ?3 i4 X, h- a( J/ H
            Michael Wu0 p+ u9 n. H/ ?' M7 ?
                        
# |$ X. D1 P6 \  |" o4 A            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
9 t+ U1 y6 R& q/ [/ v* N- g            Andrew Peng7 _  ]# G0 W8 w9 @
                        ; |. n3 l# J; S7 H$ z( E
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。- @& B8 [; X& D+ J
            吴雪枫9 g! \' w3 i' ]! h: W$ ^0 u
                        ; Z+ L, m. v! I4 n; i* Y5 m& r
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。
5 f; J2 M- |. ^: V* E8 q1 E            Jason Chen; z0 N: e+ T/ A5 y4 k% a8 n' |
                        ; D) b0 Z5 Q) _7 y: Z# o
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。. r+ ]; e$ g& o; P& f
            其他贡献者) }9 r1 s4 y( j
            Xin Hu
6 F2 l+ B4 {) n! U* d8 p0 X0 e' H  s                        
3 c% Q, M5 }/ l, b& u! e7 k% `) J            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
7 Y) H' c2 x: w" }$ \4 W/ f7 B9 d/ d            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
& O) _3 M7 d* m/ J5 O5 F            参考链接:
2 E- |# z1 B1 ?- Z+ F# c" x5 H# |            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd7 Z; j& G0 @; `5 Y4 @& O5 v
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-22 14:23 , Processed in 0.050169 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表