京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1094|回复: 2

对话写作猫:小公司,做出大模型

[复制链接]

1708

主题

694

回帖

6814

积分

论坛元老

积分
6814
发表于 2023-4-14 12:02:24 | 显示全部楼层 |阅读模式 来自 山东
1 w5 \; q* Y7 u0 _6 P2 Y

6 `* K3 b- V/ a1 ^! C) |" L, H+ t" m互联网大厂聚光灯之外,对话式AI创业的现实与未来。
/ L1 b: {. U1 N0 Y# @9 H( a7 n8 |9 O- F. ]# i, H6 J
文 | 园长& I, K# B6 ~0 k: ~
编 | 石灿4 f( ]) q& o& e
“对话式AI,是这轮AIGC变革中应用落地的核心。”
( }/ _1 }+ ~/ U! s* Z/ }' {王益为(ID:王一快)是AI创业公司“秘塔科技”的COO。在百度“文心一言”推出的前几周,秘塔科技就先行一步,推出了国产AI对话产品“对话写作猫”。
* y2 Q8 p1 O/ z* J8 |2 D& n( p9 G7 H1 Q& {# @+ u; @4 _/ b

# C5 y2 i9 D+ ^9 P8 Z% G  t刺猬公社与对话写作猫对话
6 h+ ~# V& ~) H7 [过去的几个月,我们看到Open AI以令人眼花缭乱的速度,接连推出Chat GPT及其后续的GPT4等系列AI对话产品,一次次刷新人类与AI交互智能化的上限。当自然语言成为了能够直接与机器对话的工具,在人工智能的支持下发挥出前所未有的创造力,维特根斯坦的那句名言“语言的界限,就是我世界的界限”,正在被飞速更新的技术所验证。
/ z0 N2 ]" {* D1 D正因如此,以Chat GPT为代表的对话式AI,成了AIGC落地应用的核心,也让这条赛道上的变化显得格外引人瞩目。不论是百度推出文心一言,还是Open AI推出的GPT4,还是Google的Brad,这些对话AI生成的每段对话,都有可能影响一个超级巨头的股价,也不断引发着人们的讨论:大洋两岸,对话式AI产品技术差距到底有多大?
, t' r5 q8 Q6 M4 M* Z  n4 m除了百度的文心一言,国内还有不少AI对话产品,共同组成了国产对话式AI的创业生态。类似对话写作猫这样的创新者,虽然在大厂的聚光灯之外,但同属这个生态的一部分,同样值得我们关注。
) o! q4 V: u8 `/ H2023年春天,刺猬公社(ID:ciweigongshe)去了一趟秘塔科技公司位于北京的办公室,和王一快聊了聊对话式AI创业的现实与未来。
3 d: e% M2 y# R2 T9 T7 M  e2 Z% A* n) j' \) X7 y. O, l8 c, _
创业公司,也能做对话式AI
3 L- @0 ^+ R# i3 _8 H! r( I2 u( j/ `* z2 u" k% X" E% \& r8 q; u
第一批在国内做出对话式AI产品的,并不是BAT级别的大公司,而是以秘塔科技为代表的中小创业公司。这里需要特别指出的是,他们并不是简单调用ChatGPT的API接口的“套娃”产品,而是实打实地去自主研发大语言模型,其原理和Open AI别无二致。
1 K/ m' f6 t( C$ ?/ r1 k3 @在2021年左右,秘塔科技就在研究如何用AI去生成内容;再到2022年12月,先是拿出了AI生成文字和图片的能力,并且在这之前,就已经在让机器去进行多轮对话。为了早日拿出对话写作猫,过去几个月,秘塔科技的几乎所有研发人员把全部精力都投入在了这上面,近期也在不断进行完善。
+ @  F2 S3 {" n5 a  _在对话写作猫之前,秘塔写作猫就是一个比较成功的文档产品了,拥有近千万用户。“这不是我们能力的全部,我们还能做得刚好。”王一快说,“不是说看了人家做了,我们马上就做,我们一直有技术积累。”; D  B, a' e: p
谈到为什么能这么快地做出对话式AI产品,王一快还提到一点,那就是不一味追求模型的大——动辄千亿、万亿的参数量,和创业公司的能力规模也不匹配。此外,模型也不一定“大就是好”,还要看AI生成对话的质量,以及AI是否真正理解了多轮对话的上下文,理解了对话者背后的意思。$ p3 `" Z+ q1 a" S: p

" ?$ B0 E' ~* C, }' w# ^
0 m2 }2 S8 Z# }2 P生成效果
* o) \" z) N1 E4 e' \! `目前,对话写作猫一方面可以实现AI对话,一方面还可以根据用户的指令生成文字内容。比如当用户输入“写一个小红书笔记”,它真的可以模仿小红书的内容风格,写一段美妆产品的评测。此外,还可以实现图片等内容的生成,具有相当的多模态能力。从这个角度上看,对话写作猫的AI能力其实和国内大厂的产品相差不大。
" g8 p1 q4 l. [8 a, z" s6 X/ v: ~相比国外同行,对话写作猫在中文输出方面也有一定的优势,比如在改写文章、生成文章等方面,甚至比Chat GPT做得还要好。至于多轮对话能力,还是和Chat GPT有一定差距。“可以期待半年之内达到和ChatGPT‘平替’的效果。”王一快说。9 |$ o6 y' [3 [8 e
6 y% O# U- H( x% h
大模型,自研的才放心
) b. ]8 d& e8 o+ A  {* p4 o2 ~7 V6 b) f) x
在国内的不少对话式AI创业项目中,相当多的团队不会“硬啃”大模型,就连小冰CEO李笛也曾断言,“大模型在今天这个时代,还不是创业公司可以玩转的”。比如,用户体验还不错的“Inspo”和“Aski”,都是基于GPT模型开发的。
7 H" h- h  ^, z
. B7 M) F& X5 H( ?# Z* G; z但如果每个创业公司都是在Open AI模型的基础上修修补补,这种创新的含金量到底有多少?质疑的声音,同样也没有停止过。% e/ V- C! M# F; o, D8 t$ w
对话写作猫就没有使用开源模型,或者调用API接口,而是走自研的路子。
% `/ a' j- M, L1 }1 _这也是一条相当考验技术的路子。仅仅从语料的角度看,中文语料就要比英文语料复杂很多,语料的清洗和质量控制的难度都更大。
- z  W2 b6 L3 R# t' T7 d' X9 Z相比英文,中文的变化更多。比如,语言文字还会受到语气等多种因素的影响,同样的词汇,在不同语境中的意思就不一样。再加上流行梗和不断产生的新词汇,机器理解的难度就更大了。因此,如何处理好海量的工程细节,是打造中文对话式AI过程中最大的难点。; z1 I$ [5 c, ~
但这也正好是愿意自研大语言模型的创业公司的机会。王一快告诉刺猬公社,首先,目前开源的大模型主要是以英文为语料库进行训练的,中文部分较少。为了适应中文而去做调优,本身就有“先天不足”,比如有的时候其输出的内容,并不符合中国人的文字习惯。5 m, \' l1 G7 i2 E& }8 P8 N
另外,已经开源的技术往往是上一时代的技术。一些团队愿意开源,是因为他们已经掌握了更先进的技术,才会把上一代技术开源出来。而其他开源技术的使用者,不论如何也没法追赶最先进的水平。
6 C2 b1 K% }$ J7 @/ c7 H2 H更重要的是,创业公司也要保持技术的自主性,一方面国内在自然语言处理方面的研发能力并不差,具备相当积累;另一方面也要避免被“卡脖子”,比如号称“AI竞赛心脏”的英伟达A100芯片停止对华出售,就是一个前车之鉴。* @2 p5 @+ T: R$ _' m
. |# Y, ^  O4 c# F4 O7 n7 L% z
大模型的未来:“黑镜”式的商业化?
9 K3 h# R. l9 C3 t0 J
, u* }8 G5 [! m7 k. E! N科幻剧集《黑镜》描绘了这样的一幅图景:人们可以将亲人生前的社交媒体资料“投喂”给AI,训练出一个可以模拟亲人语气和思想对话的App,可以聊天、可以打电话,甚至可以借助机器人将失去的亲人带回身边......2 \# W# @* M) W  l

. z+ y/ g. g1 g% s- v
$ s7 U% U% ~9 j9 c8 ^+ |; Q《黑镜:马上回来》剧照
5 g; A$ k) b" N4 x0 a. h) k- v现在借助大语言模型,这个即便在前几年仍然被认为相当科幻的场景,其“内核”部分几乎已经成为现实。王一快就向我们透露了最近接触的一个需求:
, p) x1 m" }( e. M! I. K% @某机构给一位已经去世的老学者打造了一个数字人形象,让人们可以继续看到他的音容笑貌;在这个基础上,还想把他的论文和学术观点“装”进这个数字人的大脑,让数字人也能继续按照这位学者原本的思想模式,模拟出学者生前的样子,继续和人们进行多轮对话。. J( ?3 U  @$ ^! Z
“让数字人有了脑子,这件事本身就有意义。”王一快说。他还举了一个法律行业的例子,大语言模型可以与律师的数字人形象结合,作为一个真人咨询之前的程序处理客户的问题。虽然还不能取代高端的律师服务,但比较初级的律师,将在知识储备量和同时服务的能力上无法相比。
8 H! Y1 R; \# u' W  _9 I在商业化上,对话式AI的想象空间还有很大。在ChatGPT验证了对话式AI作为一种新的人机交互的方式之后,对话式AI很有可能作为一个统一的出口,把其他的AI能力都打包起来统一输出,成为整个AI产业落地的主力。5 F/ @& N+ v0 \, \) L0 s: Z
比如对于秘塔科技的文档产品——秘塔写作猫来说,文档的起草、修改等都可以借力AI能力做得更好。目前,秘塔写作猫已经有了教育、互联网等行业的客户,其中的主要付费用户为企业B端客户。而对话写作猫的落地,也有可能借助“先行”的秘塔写作猫,抓住同样的客户群体。. G8 P' P8 f+ O, Y/ ^9 e) W7 ]& O" T
就在2023年3月下旬,秘塔写作猫进行了一次更新,用户只要输入双斜杠,就能呼出指令框,在文档内直接生成方案、周报、工作总结、提炼精华等不同形式的内容。从这里也不难看出,对话式AI的商业化,还有相当多的故事可讲。
, E$ L+ D% I' K5 p6 }(本文头图由计算美学产品“画宇宙”AI生成)3 o7 w0 V& C2 O& t* ^+ B
媒介合作联系微信号|ciweimeijiejun( {" W5 ]9 `* L4 P+ U1 p7 Q1 `2 j0 Y
如需和我们交流可后台回复“进群”加社群

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1694

主题

712

回帖

7240

积分

论坛元老

积分
7240
发表于 2023-4-14 12:32:43 | 显示全部楼层 来自 山东
有意思,期待
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1586

主题

739

回帖

6687

积分

论坛元老

积分
6687
发表于 2023-4-14 13:02:34 | 显示全部楼层 来自 山东
主要表现猫的性格特点,从长大的猫性格古怪回忆起满月的猫淘气可爱.通过具体事例,抓住猫的动作行为来写.再加上作者拟人化的写法、亲切风趣的语言,处处流露出对猫的喜爱之情.
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-20 05:39 , Processed in 0.048323 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表