京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 920|回复: 1

GPT-4背后的开发者:七大团队,三十余位华人

[复制链接]

1647

主题

726

回帖

6767

积分

论坛元老

积分
6767
发表于 2023-3-19 00:17:29 | 显示全部楼层 |阅读模式 来自 江苏苏州
始于谷歌,发迹于 OpenAI,这是很多 GPT-4 贡献者的职业轨迹。
5 F, O, T* L( p1 S( C            这个星期,OpenAI 大模型 GPT-4 的发布让全球科技圈的技术竞争进入了白热化。几天之内,ChatGPT、必应搜索和 Microsoft 365 相继接入 GPT-4,微软的 AI 应用瞬间比竞争对手拉开一个身位,甚至有人说,新的工业革命开始了。
& V% O8 T& I5 j' d  ^4 y! W: Z- V9 D            一方面我们被 GPT-4 的效果所震撼,一方面我们也迫不及待的想要了解背后的技术,好奇它的训练方法、使用的算力等。
5 C* l+ v6 K" {- Q5 O- y            但遗憾的是,OpenAI 并不 Open。在公开的论文(其实更像技术报告)中,OpenAI 明确地说,GPT-4 模型使用 RLHF 精调外,不会公开任何技术细节。4 T2 ~  m: e: Q5 U" @; d
                        & s9 {! {+ ]7 r
            鉴于 GPT-4 等大型模型的竞争性与安全影响,本报告不包含有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等更多详细信息。( ?! G. W2 j8 ?& T
            不过,在此报告中,OpenAI 详细列出了贡献者及其负责的工作内容。这值得我们细致研究。这几百人的贡献者名单与分类,能让我了解到 GPT-4 的成功背后包含了哪些部门、技术分枝的努力。5 q7 Q7 w# r2 u
            在这篇文章中,我们对有代表性的贡献者进行了盘点,期待能为读者带来启发。8 Y. x% y; ^. n6 ^
            研发人员占绝大多数9 a: Z$ a* g* Y0 _8 E+ }) g
            从组织架构的设置上看,GPT-4 幕后的研发团队大致可分为七个部分:预训练(Pretraining)、长上下文(Long context)、视觉(Vision)、强化学习 & 对齐(RL & alignment)、评估 & 分析(Evaluation & analysis)、部署(Deployment),以及其他贡献者(Additional contributions)。
5 U+ W2 c5 d% d  A( P& ~0 \- b: j            预训练部分的工作细分为:
6 s; C) c% C  p% o! r8 C            计算机集群扩展(Compute cluster scaling)& m( h: f. n/ J. c1 H  I$ M
            数据(Data)
! z& \5 |1 j- B  g            分布式训练基础设施(Distributed training infrastructure)
4 L/ i: N2 D; @            硬件正确性(Hardware correctness)
; f( E- i2 M& r  e: h* d4 E            优化 & 架构(Optimization & architecture)
9 B3 r  S) t+ r$ U3 R            Training run babysitting/ G) B- J: o+ ^
            长上下文部分的工作细分为:
0 |: P  }% \- A8 o$ H: |9 N. |) o            长上下文研究(Long context research)
# S9 c8 V# w: b: w) R            长上下文内核(Long context kernels)
9 Y/ S" r- S3 k# v            视觉部分的工作细分为:1 G& c& G9 L" K
            架构研究(Architecture research)
! ]3 p- }- w- H( P9 W: ^            计算机集群扩展(Compute cluster scaling)5 |9 \. s5 s+ T" `: T6 ]/ A; L" ^
            分布式训练基础设施(Distributed training infrastructure)
6 ^: v' Q3 F% _2 I, V            硬件正确性(Hardware correctness)
! V; G: `# _3 Q, w7 l4 |% p$ k            数据(Data)
  z$ X# F( f6 T, {0 g# O            对齐数据(Alignment Data)( b2 V$ ?* }9 h4 w; B5 `8 ~9 m. D
            Training run babysitting9 G4 j: B1 o5 y' v9 h# f1 H. d
            部署 & 后训练(Deployment & post-training)
! q. {3 }. s7 Z9 j9 U            强化学习 & 对齐部分的工作细分为:4 a: K4 |- P& _4 U
            数据集贡献(Dataset contributions)( E+ I/ i" z) Y& A/ j
            数据基础设施(Data infrastructure)! R) s4 o) n( C; C' x
            ChatML 格式(ChatML format)
% r8 c6 o2 Y6 n" z% ~# i" T7 O            模型安全(Model safety)- z* D0 d4 k7 J( c: y3 f
            Refusals
  F; w3 G5 |8 Z; _2 w  ]            基础 RLHF 和 InstructGPT 工作(Foundational RLHF and InstructGPT work)
" _* K9 Z7 J: K- A7 n# |7 n            Flagship training runs7 u- M* Z% L# G: B
            代码功能(Code capability)
$ U' c: `0 P( n' }; z            评估 & 分析部分的工作细分为:6 f2 h( e% S! |; B  {  h  O9 [: t) J
            OpenAI Evals 库
6 w  O# T$ s, i$ C% V            模型等级评估基础设施(Model-graded evaluation infrastructure)8 }1 b, U5 A2 v* {1 u5 R
            加速预测(Acceleration forecasting)6 U. l6 G3 {1 R
            ChatGPT 评估4 [6 a3 C) W. ^% t/ x: _
            能力评估(Capability evaluations)
) ]3 K8 V- @! U$ \7 W  e0 u. \            编码评估(Coding evaluations)
6 y: {9 @0 A! h5 `            真实世界用例评估(Real-world use case evaluations)) j3 B# F1 Q0 [! h
            污染调查(Contamination investigations); E3 w7 T: @* o% c; R# @
            指令遵循和 API 评估(Instruction following and API evals)2 k6 s* W7 \2 U& v7 q  ^4 U3 h
            新功能评估(Novel capability discovery)9 t9 V* e) j7 K3 x5 `
            ……
! Q2 f! _" G+ K$ B: o4 _& z/ {0 ?: {            细读贡献者名单,不难发现,GPT-4 项目团队的成员通常「身兼数职」。对于希望追赶 ChatGPT 的科技公司来说,OpenAI 提供的部门架构样板提供了一些可以学习的思路。另外,它对于 AI 领域人才的未来发展方向或许也有一些启示。
, M$ R+ X- S1 }3 y/ B& [            在 ChatGPT 发布之后,OpenAI 在人才招聘方面也做出了一些调整,招募了数十名前谷歌和 Meta 员工来创建人工智能聊天机器人。- }; x9 H% Y: M! `7 _8 Q
            在 OpenAI 上,谷歌作为「硅谷黄埔军校」的名头算是坐实了:根据 LeadGenius 和 Punks & Pinstripes 的数据显示,该公司的 300 多名员工(数据截止到 2023 年 1 月)中有许多来自谷歌和 DeepMind 的母公司 Alphabet。数据显示,OpenAI 目前雇佣了约 59 名谷歌前员工和约 34 名 Meta 前员工,同时包括几名苹果和亚马的前逊员工。
, a, C2 I' U5 b. h                        
7 Q& l7 p2 m& d6 Y8 {- n            鉴于 OpenAI 在 GPT-4 发布的第一时间就公开了所有贡献者名单,机器之心整理了一部分参与工作的华人学者。如果遗漏,欢迎补充。
8 i' P* e; h5 t1 I% z8 ?9 n% X            预训练组
' \$ y" N% k! X6 `            Trevor Cai
" j. [7 T, y$ Q5 c0 @, C) G6 b9 s            Trevor Cai 是 GPT-4 项目中吞吐量团队的负责人。Trevor Cai 本硕毕业于南加州大学,2022 年 3 月加入 OpenAI。在加入 OpenAI 之前,Trevor Cai 曾在 DeepMind 工作近 5 年,担任软件工程师。
; U4 H- e2 M! ~$ K) x& o            袁启明1 k- S" P" ?2 p
                        
. Y4 g( k/ O- [% R/ |# _2 Y( I            袁启明(Qiming Yuan)是 GPT-4 项目数据集来源和处理团队的负责人。袁启明本科毕业于清华大学,硕士毕业于得克萨斯大学奥斯汀分校,2018 年加入 OpenAI。此前,袁启明曾在微软工作近三年。
9 `9 N+ T; t2 Q6 |1 U" W            Che Chang3 C2 P0 I) ?/ {
            Che Chang 作为 OpenAI 的副总法律顾问参与了 GPT-4 的研发,他博士毕业于美国西北大学,2021 年加入 OpenAI,此前在 AWS 领导了人工智能 / 机器学习和市场业务的法律团队。最近一段时间,OpenAI 的法律团队还在招聘 AI 产品顾问。5 D! j8 n% d( l+ ?* H: f" L0 ^+ v
            欧阳龙+ S% [# G8 U" f+ |$ M% S
            欧阳龙 2019 年加入 OpenAI,担任研究科学家。Long Ouyang 本科毕业于哈佛大学,博士毕业于斯坦福大学,曾在斯坦福大学任博士后研究员。欧阳龙也参与研发了 ChatGPT 相关的技术项目,他还是 InstructGPT 论文的第一作者。& }  d/ w! O$ t* Y9 I
            翁丽莲' S3 G4 q9 y% z- K: Y* O" v: n
                        
" o, d. h0 s% M- a% ~8 _3 Q( a- H  u            翁丽莲(Lilian Weng)是 OpenAI 人工智能应用研究的负责人,2018 年加入 OpenAI,在 GPT-4 项目中主要参与预训练、强化学习 & 对齐、模型安全等方面的工作。) `. O, g4 E4 ]; \  M
            Tao Xu
) L) M7 P6 r) Z9 a  p            Tao Xu 2019 年加入 OpenAI,先后毕业于北京大学、康奈尔大学。Tao Xu 曾在微软的必应机器学习研究组工作四年。1 G. m; A1 L, b2 y, F; q. {$ h
            Jie Tang
8 W4 T! k9 q2 [+ h; c. s+ P1 h" V                        2 c% i& m% K, G
            Jie Tang 在加州大学伯克利分校获得计算机科学博士学位,导师是 Pieter Abbeel。加入 OpenAI 前,他曾在初创公司和 Dropbox 工作约四年时间。Jie Tang 本科就读于哈佛大学,2008 年获得计算机科学和经济学学士学位。
/ w- l# Z  v' K            Ben Wang
  Z' n. l/ b: N- F) P: ?7 {            Ben Wang 目前是宾夕法尼亚大学本科生,2021 年加入 OpenAI。Ben Wang 参与了 GPT-4 项目的预训练和长上下文方面的工作。
- G0 @4 M5 z/ I$ a            视觉组
9 h0 I7 f6 S8 M6 n% n8 L9 n# Z" n% e            Mark Chen, \7 u# g* o) M8 E5 Y7 @1 F: F
                        
2 {" E- z" r2 H: t9 h            Mark Chen 2018 年加入 OpenAI,任研究科学家,毕业于麻省理工学院(MIT)。他参与了 GPT-4 项目中视觉方面的工作。4 e* d3 U1 T( `( L9 s, ~1 k
            Casey Chu+ ^8 D) t7 R* }7 U# k9 H
            Casey Chu2020 年加入 OpenAI,毕业于斯坦福大学计算数学专业。Casey Chu 的主要研究方向是多模态 AI 系统,他在 GPT-4 项目中主要参与视觉方面的工作。
4 |1 ?3 q- B3 c            胡绳丽
0 F- N$ ]7 ?! s0 A1 ]                        
1 w' L4 g# i) U            胡绳丽(Shengli Hu)2022 年加入 OpenAI,她硕士毕业于复旦大学、博士毕业于康奈尔大学。她的研究兴趣在于社会科学、计算语言学、计算机视觉和语音的跨学科研究。胡绳丽曾在自然语言处理、计算机视觉、语音和应用统计方面的顶级会议和期刊上发表过多篇论文,包括 CVPR、ACL、EMNLP、ECCV 等等,并获得过最佳论文奖提名。
; s( P$ P& Q4 }& K- b; }( d7 k2 k3 f            Tianhao Zheng
+ z* K, O0 p" e/ L! i            Tianhao Zheng2022 年加入 OpenAI。他本科毕业于清华大学,博士毕业于得克萨斯大学奥斯汀分校。再加入 OpenAI 之前,他曾先后在英伟达、谷歌、Twitter 工作过。Tianhao Zheng 在 GPT-4 项目中主要参与了视觉方面的工作。
+ r/ \1 V  ?) c7 E( I            翁家翌4 ?. [& y$ @6 t0 J7 R3 T: i7 N
                        
  }0 z: L) E# X  i! q& J( \            翁家翌(Jiayi Weng)2020 年在清华大学计算机科学与技术系获得本科学位。本科在朱军教授组学习期间,主要参与了强化学习算法库 Tianshou(天授)的开发,该项目已获得 5.9K GitHub Star。CMU 硕士毕业后,翁家翌加入 OpenAI 任研究工程师。
' H' @) z! o6 o) d' M( L9 H            强化学习 & 对齐组. I5 I0 _! @* @
            Chong Zhang
+ t# y# Q8 X" O& w2 o                        : ]1 y0 \0 w! J5 P% f* i+ d
            Chong Zhang 2010 年就读浙江大学计算机系,2014 年在加拿大西蒙弗雷泽大学获得学士学位,随后在谷歌、苹果公司担任工程师。2019 年就读加州大学洛杉矶分校,2021 年获得计算机硕士学位后,在 OpenAI 工作至今。
2 z: p" F, ?' c7 V$ N            Shengjia Zhao
$ }; F6 ~' F% M2 h* g                        
" j- s1 K; R& c0 ]7 T            Shengjia Zhao2016 年本科毕业于清华大学,2022 年在斯坦福大学获得计算机科学博士学位,师从 Stefano Ermon,随后加入 OpenAI。
; u  l% |3 O+ E3 r* X) z            Stephanie Lin
( w: k' T, ]2 E. p. F                        5 v$ T9 L$ e* \8 A- N
            Stephanie Lin 本科和硕士期间分别就读于麻省理工学院和佐治亚理工学院。加入 OpenAI 之前,她曾是牛津大学研究学者。$ \4 c, [( u% t  D: H
            Tong Mu% m) z( L6 i5 K1 m. w4 \
                        
+ O- j$ a% P# Y7 e/ E8 y            Tong Mu 本科就读于加州大学洛杉矶分校,后在斯坦福大学获得博士学位。2022 年加入 OpenAI。5 I# l. t" E0 S  ?  F  H
            Jeff Wu# A6 f( K( p  h& j, a" d
                        
+ L1 k. S0 c3 }& y% @7 {3 n            Jeff Wu 本硕均就读于麻省理工学院。他是初创公司 Terminal.com 的第二名员工,该公司被收购后,他曾在谷歌工作约 2 年的时间。2018 年,Jeff Wu 加入 OpenAI。
4 @( ]) D! v* W            肖凯
4 M* Y) A$ x  G% f3 T                        
# G% b  R* L7 ^; S            肖凯(Kai Xiao)在麻省理工学院获得了学士学位和博士学位,曾在微软、DeepMind 等机构实习。2022 年 9 月加入 OpenAI。! _- h& S+ h& m6 O3 o8 u# l# B* Y
            Kevin Yu
! y( ~4 O0 d0 U! h/ G0 H                        
- Y: G) ^% f2 v! a/ z4 L6 H4 \7 ?5 q            Kevin Yu 在加州大学伯克利分校获得物理学学士学位及神经科学博士学位。2022 年加入 OpenAI。8 L! L% u) T3 g7 ~9 O, `/ V+ N
            Haozhun Jin% U7 M+ i/ [+ W' w: v: c- b* y6 Z
                          o0 [3 D6 K8 s) T. f" {
            Haozhun Jin2013 年本科毕业于清华大学计算机系,2015 年获得斯坦福大学硕士学位。2015 年到 2018 年,他在 Meta 担任软件工程师,2023 年 1 月加入 OpenAI。
% \) {, i" O$ @3 m& S6 l9 X7 [) s/ V2 \            顾世翔+ ]$ q# }% t8 Y6 `: ]
                        * J2 `( u  M7 r$ a2 n) E7 k
            顾世翔是出生于日本的加拿大华人,曾是谷歌研究院研究科学家,研究领域包括深度学习、强化学习、概率机器学习和机器人技术。他拥有剑桥大学和马普所智能系统研究所的机器学习博士学位,在多伦多大学获得了工程科学学士学位,论文指导教授为 Geoffrey Hinton。. J! g; v: [8 m- W
            评估 & 分析团队
6 j' H) K6 Z& t& p0 W# d6 j7 |            Alvin Wang
, e; j" E/ `& B0 {; y                        
7 S/ b) Q& c" Y3 Y( g0 ]            Alvin Wang2022 年 8 月加入 OpenAI,为评估 & 分析团队核心贡献者之一。此前他曾在 VMware、Tesla 等公司工作过几年。2013 年本科毕业于南加州大学。) C% |! X  y8 L5 m
            Angela Jiang% {0 S/ n6 ~2 @  D4 @7 E7 E& T
                        
7 J5 x* z2 Z' |, b; J2 c4 `' G            Angela Jiang 于 2021 年 11 月加入 OpenAI,在微软和谷歌有过短暂的工作经历,她本科毕业于西北大学,于 CMU 获得博士学位。
0 ?- s. x4 C, H; K' F            Jason Wei
) f1 J- P6 @" _/ I/ w) v                        
# j; L& [2 E1 g$ y" {4 Y0 A            Jason Wei 于今年 2 月加入 OpenAI,主要研究 ChatGPT。此前他是谷歌 Brain 的高级研究科学家,在那里推广了思维链提示,并共同领导了指令调优工作。他在谷歌和 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文。# p0 v2 E' s/ \
            Juntang Zhuang
1 H  J1 C) X+ A8 z                        % A' v9 M5 `  Y' m+ p1 ]# }
            Juntang Zhuang 于 2022 年 4 月加入 OpenAI,此前曾在谷歌实习四个月。他本科毕业于清华大学,硕士毕业于耶鲁大学,并在耶鲁大学拿到博士学位。他的研究主要是为生物医学应用开发新的机器学习技术。* C' g8 [9 e& P5 J9 p0 ]) E6 N  o2 o
            Derek Chen
3 Q! L" \4 U" I% {; ~8 V                        " W! n4 G# k2 c  y0 A$ H# o& {. f
            Derek Chen 于 2021 年加入 OpenAI,是一名技术安全分析师。他毕业于美国东北大学,此前在谷歌工作过不到一年的时间。
" d4 L; L4 e5 Y! Y2 t. R            宋飏7 O' K* \5 n' J! @+ `0 U+ I9 |! U
                        4 ?( L6 Z1 c3 Z8 w+ F5 o
            宋飏(Yang Song)目前在 OpenAI 担任研究员,并将于 2024 年 1 月加入加州理工学院电子系(Electrical Engineering)和计算数学科学系(Computing and Mathematical Sciences)担任助理教授。宋飏本科毕业于清华大学数理基础科学班,2022 年获得斯坦福大学计算机科学博士学位,师从 Stefano Ermon。他的主要研究方向是机器学习,包含深度生成式模型(deep generative models),概率推理(probabilistic inference),人工智能安全性(AI safety),以及人工智能方法与其他科学领域的交叉(AI for science)。他是扩散模型(diffusion models)和分数匹配生成式模型(score-based generative models)的主要奠基人之一。他发表在 NeurIPS 2019 的工作首次在图片生成质量上实现了对生成对抗网络(GAN)的超越。博士期间他的一作论文获得了 ICLR 2021 杰出论文奖,相关研究获得了苹果奖学金、摩根大通奖学金,以及 WAIC 云帆奖。
6 Z6 M& M8 f5 d3 ?            模型部署* n/ e, ^8 a2 t3 o
            Michael Wu
+ @. ^7 i2 @8 @" p$ A$ h9 @& A                        
0 T$ T# N& c) J# ^0 G7 o            Michael Wu 2021 年加入 OpenAI,主要的工作是人工智能应用研究。Michael Wu 毕业于 MIT,是 GPT-4 项目的推理研究负责人。
* K: q% P! [& ~+ u1 S2 g3 j            Andrew Peng! m' W% L' z  B9 B" q$ Z
                        : e2 b& [0 L/ R* m* |2 U2 d
            Andrew Peng 2022 年底加入 OpenAI,他曾经在微软工作两年。Andrew Peng 毕业于加州大学伯克利分校,主要参与 GPT-4 API 和 ChatML 部署方面的工作。
. h; h1 \6 Y* [8 R7 b$ d            吴雪枫
! }! M, a! x5 @9 M                        6 {2 Z* H. K/ [7 X8 L
            吴雪枫(Sherwin Wu)2022 年加入 OpenAI,主要的工作是人工智能应用及 API 开发。吴雪枫毕业于 MIT,在 GPT-4 项目中主要参与 API 开发和 ChatML 部署方面的工作。- @) F) p* h# H4 J7 {* c+ f/ f
            Jason Chen/ ?0 Q! u* M" t4 T, l9 W% I3 T/ Z
                        / ~. H: t/ s! K3 w2 p/ u1 A
            Jason Chen 本科就读于麻省理工学院,2007 年到 2014 年期间在谷歌担任软件工程师,2014 年到 2019 年任职于初创公司 Apptimize,2019 年到 2023 年 2 月任职于 Argo AI,2023 年 2 月加入 OpenAI。
* R) H; Y. L, Z0 l            其他贡献者
7 B6 z- I/ g/ n5 P$ _            Xin Hu8 J" f: _- {- O, O2 c
                        
2 U2 ^' f3 p, F; v( |. Z            Xin Hu 于 2022 年 6 月加入 OpenAI,主要负责开发用于云安全、k8s 安全、认证 / 授权和访问控制的安全服务和平台。; n. a" u" u+ |) X2 l' I
            此外,在 GPT-4 的开发上 OpenAI 也对微软表示了感谢,特别是微软 Azure 服务为模型训练提供了基础架构设计和管理方面的支持,微软必应团队、安全团队也对 GPT-4 的部署等工作作出了贡献。# v$ a0 D0 q3 T' P! R
            参考链接:
; s( l8 x0 [9 f, r  u  [7 K0 v9 G            https://openai.com/contributions/gpt-4?continueFlag=ee0eebd278339fc5ba428add63b4b4fd6 n* I# I( Q$ O  L% G2 p
            https://cdn.openai.com/papers/gpt-4-system-card.pdf

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1592

主题

730

回帖

6661

积分

论坛元老

积分
6661
发表于 2023-3-19 01:17:59 | 显示全部楼层 来自 江苏苏州
有华人在很嫉妒吗
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-26 01:23 , Processed in 0.041711 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表