|
|
4月8日,由中国人工智能学会主办的“人工智能大模型技术高峰论坛”主论坛在杭州萧山启幕。论坛上,京东集团副总裁何晓冬、华为云人工智能领域首席科学家田奇现身发表演讲。, M+ ?' t' a/ b6 B% |& L
' ]+ Y2 y6 y( _3 Y1 r( y& Y* _0 f
0 l# A4 A' i- f, d% Y, R6 e, ^# z
图片来源:视觉中国-VCG41N1351090691
" \- L8 @3 l h4 ~; i京东集团副总裁何晓冬:京东将在今年发布新一代产业大模型# T0 t; N2 n# H2 y. B; ^
据证券时报,何晓冬表示,针对真实的产业需求,京东将在今年发布新一代产业大模型,言犀是“京东版”ChatGPT,言犀大模型预训练参数达到千亿级,品类覆盖3000+,人工审核通过率95%+、生成文字30亿+。
& F7 x- g- [- h+ b; Q2 _何晓冬认为,ChatGPT是深度学习不断发展的结晶,是第一款真正意义上的AI原生产品。由于ChatGPT能实现人类意图来自于机器学习、神经网络以及Transformer模型的多种技术模型积累,可以说ChatGPT升级了AI创新范式。
# d7 j# f2 h. d% S* ~- T+ c, s3 ]1 V此外,何晓冬指出,在以往模型的基础上,现在的ChatGPT模型有了多方面的显著提升,如更大的语料库、更高的计算资源、更加通用的预训练、更高的准确性、更高的适应性和更强的自我学习能力等等。4 s7 ~# \# \) g) f; |) v
伴随着参数规模增速的不断提升,算力和训练成本仍存在瓶颈,大模型的性能天花板远未到来。同时,算法需要根据硬件优化,包括芯片级优化,数据中心架构、机器学习分布式架构在内的软硬件调优等算力创新将成为破局关键,转动起AI算力-AI应用的产业飞轮。
; z/ u2 W: n7 m( c# y1 D华为云AI首席科学家田奇:大模型是未来AI生态的核心* P# G7 T4 R- e* L) K% h0 i- |
今年以来,人工智能持续在全球升温,在这轮新的人工智能浪潮中,田奇称,人工智能发展,已经从局部探索,走向千行百业。AI正在走进企业核心生产系统,开始创造更大价值;人工智能行业渗透率提速,2026年将达到20%。4 m/ L- q4 C8 L" C0 ]3 H$ }# W0 o
" s+ ~3 S G3 o( V; q8 c, Y$ h$ {+ [! H
图片来源:人工智能大模型技术高峰论坛
' ?7 N, R; n, i: f: R1 n) Q3 x在田奇看来,人工智能发展趋势呈现两大特点:首先是从小模型到大模型;其次是人工智能与科学技术的交汇。
0 h- u5 M( P, o" a据介绍,大模型成为应对AI领域应用碎片化的一种方式。这种方式下,提高了模型泛化能力,减少了对于领域数据标注的依赖和模型微调;模型复杂度(参数个数)持续爆发,不到半年增长了10倍,达到了1750亿。$ F* O! F2 v9 p6 G. t. g
同时,大模型有可能收编高度定制化的小模型,导致市场向大模型集中。这主要是因为,开发大模型资金门槛高,开发和训练一次,需要1200万美元;技术门槛高,具有对AI框架深度优化和超强的并行计算能力。9 ~7 c8 C5 m s2 ~; s* p2 E6 H6 X
另外,大模型正在改变AI产业的规划与格局。比方说,牵引AI产业快速收敛,构建AI产业的底座;汇聚和沉淀行业生态及开发者生态,形成产业生态黏性。# q! B. t0 d/ H9 A- h! l6 N: l2 m
AI在哪些科学计算场景能发挥“尖刀”作用?“工业、气象、能源、生物医学等众多领域,都受到了人工智能的深刻影响。”田奇称,大模型是连接技术生态和商业生态的桥梁,是未来AI生态的核心。2 N" x# r( G" T0 a
每日经济新闻综合自证券时报、人工智能大模型技术高峰论坛 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|