京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 819|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
# z2 \: Z$ ^1 U. K6 }            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。* \) d5 J3 S. c0 g# V; p# f! `
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
! h$ {2 g$ z& [0 h            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。
! r- W; c; ]5 j# j. F' E0 |, D                        ; r8 [& F$ h2 q* u; @, q; f
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。, _* o3 M- [  h# O
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。
  s- f6 x6 l1 Q; E  C+ t            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
. `5 }  S: P% {# @1 q            研发人员占绝大多数
: j" `5 Q, ?: O) _- }; ~            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。' n/ \& O: O% C0 |
            预训练部分的工作细分为:4 D. g& Y' c( Z4 s  ]  k4 L
            计算机集群扩展(Compute cluster scaling)# ?9 w2 n4 Z1 L
            数据(Data)* H' y  M% R2 C$ c$ [) l. y
            分布式训练基础设施(Distributed training infrastructure): F* E& ]7 s7 l8 i* O
            硬件正确性(Hardware correctness)
1 u4 A* u0 g" w* ~% e6 i4 w( M            优化 & 架构(Optimization & architecture)
% K; g; D, k" w" B  [3 k2 U            Training run babysitting
) c  l& X' X9 B3 x6 v# }, E  q            长上下文部分的工作细分为:" F' Z. ^4 {- h; X- M' K) v
            长上下文研究(Long context research)4 g( V3 B5 w8 X
            长上下文内核(Long context kernels)
, k& P1 [9 @6 K( R6 @, e" |            视觉部分的工作细分为:
* o9 g/ }/ l2 G            架构研究(Architecture research)
2 I3 J& D+ `; s1 p  i            计算机集群扩展(Compute cluster scaling)
; I, I6 p4 h- e' y; H6 l; l  s            分布式训练基础设施(Distributed training infrastructure)
) S( \" N' O# Y8 ^$ Z2 C            硬件正确性(Hardware correctness)9 k- B) g& ?! u& x$ [3 r0 i$ }
            数据(Data)
2 j. W. \0 D- U: {            对齐数据(Alignment Data)
' y' O" e. y8 L3 O  I" F  D            Training run babysitting, H- W& U3 {( ~, k0 b5 k! n2 U( V
            部署 & 后训练(Deployment & post-training)
- h+ Q9 V4 R( U# Q            强化学习 & 对齐部分的工作细分为:
" w5 _1 Y; ~5 G/ S# v) a            数据集贡献(Dataset contributions)
7 m; ]4 A3 h2 z' J. m2 J' c+ O            数据基础设施(Data infrastructure)) ^. _3 T8 ]. s/ y
            ChatML 格式(ChatML format)
2 P6 m9 i( E8 v. l# v            模型安全(Model safety)( B% j3 N# m5 a: t$ y
            Refusals
' p+ E/ j4 ]; _, ~$ {) S            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
& u" m' N( [# x  n# U- Y4 T            Flagship training runs% R; U$ i$ s3 L! S2 u' B
            代码功能(Code capability)( e! m! u! u8 L: y/ @
            评估 & 分析部分的工作细分为:
5 c0 d' I( `3 W  S! x            OpenAI Evals 库
3 c% e0 a) Z1 I  E+ ]1 m            模型等级评估基础设施(Model-graded evaluation infrastructure)9 J$ S9 d6 N* p' p7 W  Q
            加速预测(Acceleration forecasting)/ d8 A/ Z! b6 v7 g
            ChatGPT 评估4 \1 e  S6 ~0 p6 F  a7 X2 j3 v$ r" l* M
            能力评估(Capability evaluations)+ P- `; M: B! Y  q$ C$ r/ B
            编码评估(Coding evaluations)9 i4 u- O4 Y1 D2 g
            真实世界用例评估(Real-world use case evaluations)
" [' V- J" C( r: X            污染调查(Contamination investigations)
) J, D( g2 m" ~3 D/ U            指令遵循和 API 评估(Instruction following and API evals)8 x, t# r1 C8 B1 ]) m
            新功能评估(Novel capability discovery)5 D, ]9 t' I/ g. K3 j
            ……
) `2 v- {7 a& R1 K0 k            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
8 ~* n; A9 q( ~8 m            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
' f" P' d1 k; H            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。2 {% D2 G  _6 }1 v+ }, T
                        
9 J1 N8 ^/ j3 P& k7 ?$ A            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
9 e& V! Q+ B* Y' [+ [7 K% j            预训练组5 T  T) h" w- f8 z9 K) l
            Trevor Cai, u( w* t9 J. {9 M( @* {( F3 Q
            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
: z$ q9 U, U% P" u0 Y! @            袁启明
0 Z7 I; r; W! Q1 R  }1 t# }                        
0 _0 z' {) E! B$ z8 F7 W6 K3 y; l            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
2 v: e* X5 ?& l+ X( @! t$ P2 v            Che Chang5 y1 a: X7 J% t: s
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。
/ }  b! f3 U; U, u            欧阳龙1 o) L) c( l! v6 B& r3 J8 @4 g/ L
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。
4 C8 ]; P  P( X  Q6 l: _            翁丽莲
, `* Z4 b4 ]% E                        9 A# N1 h2 m3 b; N( p
            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
9 }6 g. l4 R, E2 ^            Tao Xu
9 P: q" s6 c& S( V/ c* ~            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。
. l" p% M# Y$ l0 @9 P8 e0 B            Jie Tang
8 k0 x3 z8 v' {: |: T2 k. p                        
3 j" |) p1 `" i( T# n% j            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
2 t, N; O3 M4 D, ?6 d            Ben Wang
0 P9 o  Z% v% e; H- L" q            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。$ ~9 K; d+ |* s+ [) x
            视觉组0 E7 |4 _+ f+ ?7 f% N2 H+ Y4 }
            Mark Chen3 G4 q" ~* L$ P3 x6 Q
                        ( v" K$ }) E$ n, t
            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。
6 D6 @/ H3 |: g4 x, `9 O8 \- w3 Q            Casey Chu/ `9 J$ r. g5 u9 Y- Y5 [
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。* U# {7 m) }( w7 B2 V0 U
            胡绳丽
- I! z& \) }8 ^* b$ D8 @                        9 e$ R. l6 ^4 v  v( N9 \0 F4 v7 `
            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。' g9 k% R0 L* G% c0 ?4 T* m! A! @6 N
            Tianhao Zheng+ w2 y8 ^' [/ ^+ V9 z- d
            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。! [) R6 l+ L0 G2 }0 N9 Y3 W! M
            翁家翌
. e- Y& W! s* {3 j$ N% p; v) K                        ; }$ z8 m, [: r# h+ m+ h
            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
. g+ f( T( a; A. ~+ G. [            强化学习 & 对齐组
2 x, P4 q( Q1 m3 v& I            Chong Zhang/ C$ u* K% F6 d( ^, z$ _
                        
* @, m% p( p- N            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
2 ?" w+ Q, q; e& e, x4 m            Shengjia Zhao
8 J9 K) U0 @) s                        4 Y. M6 y& i* c  W
            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。' }5 F( {/ @) Z, {
            Stephanie Lin5 j) _+ n7 p/ @; U. |3 Q
                        % r3 t8 i2 o0 X' ?+ {
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。- l5 }; `1 @1 X
            Tong Mu
# m8 z) C4 H. Q                        
7 M; G1 ]* N% }1 K$ H2 q            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。/ W) N, P+ V5 ]5 T* T
            Jeff Wu) ]0 V# [% k5 ?
                        1 C7 n2 Z, }: T! U& `2 G# c8 W9 V* D
            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。  y: a+ D* d; J
            肖凯
( W8 e6 D7 u. u' j                        " ]& O" ~# W( ~& ?( v% C
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。. Y% n8 i( {" V$ w. o# ], b
            Kevin Yu. S0 l( J; g/ f
                        
2 q* \4 Q* W% _/ A! s            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。# j! T  t& A' S8 ?! M: e# S+ J! R
            Haozhun Jin! ^6 ^" g. @1 N" J
                        - o- P: ]$ t& p7 r& m0 z
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。! |6 {  \4 h6 }1 }' ~9 C
            顾世翔( s; d0 j7 z2 M
                        0 a* i0 u. I$ `8 ?( t! i" W
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。. _  W8 c/ W$ T( y
            评估 & 分析团队
7 n- q* F/ D& W2 @/ h2 p0 E            Alvin Wang
5 {( @* u5 ?  W! n                        1 m9 U' p) {* m+ E7 w+ D
            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
, g) u! b, P  `1 n  A4 |* I+ i" v, {            Angela Jiang
3 a* E: ~7 j. y. H( O1 C                        3 w/ p# }9 U/ V/ a, }
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
$ P; M' W. p9 b7 D4 y( M            Jason Wei) N0 t* `0 e% ?" }7 [) d
                        
  V4 R9 B8 k% h% _0 h            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
* [& ^% F% t. [: k( l; s( e  t  Y            Juntang Zhuang9 W  l. |- y( J5 X4 O
                        
# u: W( B. ~+ S5 |            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。; d. p% Z) t5 E" c6 {! y/ X: c
            Derek Chen
& O  N2 d& O* i1 E  p2 O2 j                        
6 O# S, i3 [5 \2 i% _            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
( J" O6 s* u1 V8 E; x            宋飏
6 J; a- S/ e7 ?5 m( R9 Q                        
5 n6 v* e) F+ C& Z; `            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
4 f2 X. a1 s) \& ~3 L: A/ L  n            模型部署, o4 g/ T9 g& i( R, \1 ^* V
            Michael Wu
; m. T# B% @9 Y- e2 |                        4 u! r, r3 a, X; a2 }1 K8 b
            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
, l2 a! {2 x7 T+ m5 D            Andrew Peng
! V( \# l+ G4 E: j                        ! H% U2 {% }( Z' q
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。- }0 _" c1 b8 @; T! o0 b1 u" g
            吴雪枫
. Q6 ]+ F5 s6 B+ L0 F                        
  B% Z; k5 e9 u7 I. ^. W            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。$ b' V( O' \! f# n0 Q/ P) l
            Jason Chen, D% j. y; c* F% j
                        
" z4 ?$ d. @! f! T) e            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
0 U1 P# p& H5 Q/ ~( Z# Z            其他贡献者
8 t, K0 j8 L- v+ I5 M( Z            Xin Hu$ T# k. u# A. h$ |# y' h
                        8 Y1 Q/ ^( {9 z: S
            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
2 I& C( y3 g0 B+ R            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。
/ D. W% @4 a2 d( P8 ]4 _! n            参考链接:6 x( S1 i5 [( q# _
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd! i, h& L' C9 O. b  a, [& r3 e) {4 l8 F
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-22 16:13 , Processed in 0.043804 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表