京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 873|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
1 t3 W) Y6 ^8 ~8 I            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。' z% }3 M1 a3 M# I) `
            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。6 j# V# D1 m& l0 f. w
            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。: I' {/ Q) q- U: U
                        ( w7 c' e( k4 I, l
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。7 }5 o0 Z8 r! E# F% L$ G+ m% `# }
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。0 _9 }: T/ s6 f, a7 V6 {+ ]1 \) |- c2 @
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。
* Q* j# v& t% t6 Q            研发人员占绝大多数6 D4 y" V6 A- F2 j1 u
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。8 y- t  B8 e3 L4 T; y! ]0 \1 l) B
            预训练部分的工作细分为:% W  w7 s) B3 @' S' y
            计算机集群扩展(Compute cluster scaling)
! n' |: [+ o7 e5 i            数据(Data)) ]! `, G# H) {( j8 V* q  _
            分布式训练基础设施(Distributed training infrastructure)
: J# R& I4 Z3 y8 ~            硬件正确性(Hardware correctness)
8 _8 e# q  x1 n. I. S, l            优化 & 架构(Optimization & architecture)# f0 D6 [! R) W# F* e
            Training run babysitting
: T9 B- m& [6 @5 P            长上下文部分的工作细分为:9 K1 I3 o2 }0 e5 p$ o) E
            长上下文研究(Long context research)2 L: n* Y+ |  U$ ^
            长上下文内核(Long context kernels)0 e& V) `# F3 q: w0 [
            视觉部分的工作细分为:
. m) Z! ~7 h9 }! ^: C. z            架构研究(Architecture research)1 `' S& j. j. M0 y0 @  L0 |" l
            计算机集群扩展(Compute cluster scaling)5 {' m. S3 l. R
            分布式训练基础设施(Distributed training infrastructure): v4 E7 E5 c3 ]* l& ]
            硬件正确性(Hardware correctness)$ ?: Y- Q) p6 V" H1 g6 ^0 Y
            数据(Data)) e% ~& A2 ^- k% w# R+ _; M
            对齐数据(Alignment Data)$ B6 R0 W9 N" H" U  C& D
            Training run babysitting
0 P/ B! F" K% U4 j            部署 & 后训练(Deployment & post-training)0 U  t& l6 Q% h1 G
            强化学习 & 对齐部分的工作细分为:/ b5 `' F9 T7 M8 A9 u
            数据集贡献(Dataset contributions)
/ F; p0 x- n/ y  U- X6 c4 Y4 H+ |( l; q            数据基础设施(Data infrastructure)
: H: r6 D: S1 d3 n            ChatML 格式(ChatML format)
4 o! g9 I5 y1 i8 n, n: Z6 q            模型安全(Model safety)
' o/ N; P3 V/ h. l/ ]            Refusals
  J1 `: q" @; D! O4 u5 X4 _+ S            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
7 r9 S3 a' r1 x! ^% b% P8 R            Flagship training runs! k  s; a6 m6 q; ^7 o
            代码功能(Code capability)7 U/ O7 M* F% N5 d& M
            评估 & 分析部分的工作细分为:
, X  I& c' K$ ]2 O; ]            OpenAI Evals 库4 m# L4 K% W9 _
            模型等级评估基础设施(Model-graded evaluation infrastructure)+ O! c% O& E* K: [, P6 U" I
            加速预测(Acceleration forecasting). w8 q+ j5 {' R) Q8 E7 M) L5 N# m
            ChatGPT 评估2 ]+ A! L0 x. P* q9 k
            能力评估(Capability evaluations)
, `/ v& @: }3 g# @+ e            编码评估(Coding evaluations)
  V' G  }4 ]4 \: b            真实世界用例评估(Real-world use case evaluations)
8 c! j4 Y0 v, t            污染调查(Contamination investigations)
/ Q% U; ^( B8 \, A" v            指令遵循和 API 评估(Instruction following and API evals)
8 n, S- g4 s( q$ B8 Z            新功能评估(Novel capability discovery)$ K+ T- {$ B6 M0 R' ~& j! ^! {
            ……- ~1 t8 p! w2 Z9 c/ L9 [, {# n0 T
            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。1 \9 J' e- S3 X! T( F
            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。
5 _# o( D3 Z" L: ?) g; `            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。. w& p3 X' k8 ?# ~( q) z* }- q
                        
4 F/ _- Z4 S8 _' `            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。2 U7 s& e3 K1 m" C, m/ G9 I$ e
            预训练组) l+ l% l/ l; N+ Z- n: j7 i
            Trevor Cai7 |, H* c; X- j+ P
            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。2 C) U( A; j, V
            袁启明( S2 ^4 ^8 Q# v3 A, e
                        % @, O  U; r2 s  X
            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
  v2 s& [! B2 G# C; S            Che Chang: K6 B2 N" b: b8 N: ?
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。6 n$ j7 J: @/ u4 ^( ]( q$ E3 Q
            欧阳龙
. P' r: n& f& k  ~  _            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。) r5 ?0 O0 e. H: z: F+ L
            翁丽莲9 p- W8 T: |+ |, S
                        
9 A+ [' H1 t+ \" u            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。
9 x) r* q6 Y/ O7 K            Tao Xu* O4 }( }5 t2 N, D: B
            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。/ P, {6 I! W8 _
            Jie Tang
! Q. i$ c  M5 j7 X% w7 X% E. u                        # H2 \# ~1 {9 U* z! U/ v
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。) H, v$ I; o/ \! s
            Ben Wang7 s4 d# ?0 H3 e6 y( z0 Z: H# f
            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
7 i* Q& u5 J8 Z- @. O9 g            视觉组/ O  t8 k% n2 i' f* o$ p/ C2 _
            Mark Chen, V+ }& {- E9 ?6 q
                        
4 |2 f2 Q) m/ J            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。$ [& C" O* A, m2 D- h  |
            Casey Chu
4 ~8 ~5 r9 B' ^: x' I5 Q/ Q9 _/ x" a; J            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。+ n, p7 k3 u6 c1 ]% h1 B
            胡绳丽9 ]; A( H/ X" a6 Y' r% s+ x
                        
- B1 V5 d5 m9 J3 J! C  e4 y$ l            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。8 h8 ]1 Z4 ~  g1 E$ d$ ?. U
            Tianhao Zheng
' W  L6 i  D9 M4 \5 S  a4 n            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
/ {3 w7 e7 w. L- U6 e% B! t1 ^            翁家翌3 x9 ?" s7 |& ?% W$ }. }9 X
                        
: y1 `' y% {: ?6 x/ ]            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
+ Y5 _/ f5 E( P/ D6 ~            强化学习 & 对齐组
( E; R! i2 f% K$ |) I5 ]5 W7 f) r            Chong Zhang
1 B" v, t* E. c8 H; Z! X1 X' M; c                        ( \+ ~) o8 r) l/ f, f& p& j
            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。2 V2 [% m4 q" n. V& h  `' f, }$ G' U
            Shengjia Zhao
4 a* H6 W, K8 a, Q                        
! x  f# U$ \3 V( L, g            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
$ D- e1 d1 p* j3 A            Stephanie Lin. v' y! o# n2 [. m
                        
! p5 E. M! L5 U8 U" D, U# O            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。
+ k! X* K( R- r8 @            Tong Mu
+ y( E: j; v- v+ `6 X                        
& i" c" B: m- r( c. W6 z# z- F            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。
7 a/ k9 s& t' `0 q            Jeff Wu5 |" b  c4 t+ X9 r. K' d$ d
                        / H5 a7 ?$ ^) E: j  {! ^! ?" f
            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
, a- s2 @1 r5 W) ^% V& [            肖凯' w0 c& H: G2 \5 c( x3 B2 @( L
                        ' z! F6 X4 f2 \% v
            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。3 a; A' S' H; Q$ k, e$ I5 B
            Kevin Yu
' \! V9 ]" S% ~' [: m                        
1 X) }% C% O" B2 `& B' E# U1 s            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。; B4 A: R0 Q; s
            Haozhun Jin
8 O1 Z5 r( Z7 Y                        
" `3 D9 @5 ^, p+ f4 }. I) M            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。2 f7 x3 l+ j+ ]# Z5 E1 L1 h
            顾世翔& K0 q* c: k$ B% z( E- ?
                        
; A! q3 t, Q& m$ y- @            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。+ e. Z/ x) p. c2 v. N+ G$ p, b
            评估 & 分析团队
+ _- G  j7 B7 F# J& g# W            Alvin Wang: _5 R! N7 T1 h$ D; u5 Y/ h( ]
                        
/ o6 J. N1 n8 A% w" s) l            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。
2 b/ r/ v# s) n0 y. u            Angela Jiang
4 j; z! i/ J; N! b                        ! n- W, X( o/ X$ W! ?$ z' O6 d
            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
$ O' W6 A4 n. `3 ?            Jason Wei+ B8 N7 S% p; @3 r' Q5 u/ Y
                        
3 [* d" c1 R& ~  Y$ n  U            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。
: u, t* }1 ~8 t/ R5 k) p" ~% t            Juntang Zhuang
- ?- U, }$ _: g; Q                        " M4 ~( U: y0 O' T6 q' o
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。
- r6 F6 g6 S9 M% t0 s- N* v( w( r            Derek Chen
( p: ^7 m/ @( I& f, P1 `                        5 A: X, f& ]0 V  O0 e
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
  {# ?. A) \' C            宋飏
/ a5 t4 j2 ^" V, d. P) R                        
8 e: K! u; m& h$ @            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。# x9 C5 |5 f! W) g4 h
            模型部署
9 w( t6 C& `' X- u- c' K            Michael Wu: D, t9 ?. f* ?: G' l2 r; p4 n$ M
                        
, v" B- g8 B4 ^& L2 H9 I  v            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。, L( F6 w7 S0 Z: n& R0 l8 `
            Andrew Peng/ ^& e, k: n( O5 V. r; ?0 N
                        5 a5 e& l) A' R) B5 j3 ~( M- u/ {! I
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。' M# u/ s+ {" z1 v5 k4 H
            吴雪枫
, U( k7 [8 m. T! |$ F* D                        2 Q( @' Q- s+ D) I4 _8 x
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。* m! X; X. Q0 n6 `9 O5 J+ u' P
            Jason Chen/ H+ O( _/ i+ A
                        
# T# A$ i4 }/ c1 _            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
8 }/ I1 C5 K( g+ t) l- y0 j            其他贡献者
6 q+ r6 t( I, I$ I, a3 O            Xin Hu
7 G. `. Y- w5 O* a" c+ A* m                        
7 ]' ?4 u' d! a/ X6 W& i. g0 e1 p            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。
" F" d1 I# [3 ?) {; s( [            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。/ S! t! n. r& S/ i2 R/ i5 g
            参考链接:# e( p* w( T+ k& `# t
            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd
  k/ @8 P) B8 s            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-3-25 20:16 , Processed in 0.037783 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表