合作咨询

合作咨询
请完善以下信息,云知声期待与您的合作!
我们如何联系您
公司名称:
您的姓名:
手机号:
邮箱:
选择咨询的内容

首页

云知学院

核心技术

平台服务

PaaS

AI开放平台

AI芯片应用开发平台

智算平台

SaaS

知识图谱平台

Agent聚合平台

云听-智慧办公

云贝-智慧营销

智音-智慧运维

蓝藻AI配音创作平台

智慧物联

智能家居

智慧酒店

智慧社区

智慧园区

智慧交通

智慧车载

智慧文旅

智慧医疗

语音电子病历系统

智能病历质控系统

单病种质控系统

智能医保审核系统

导医机器人

智能随访系统

山海

关于我们

了解云知声

联系我们

加入我们

使用场景具体描述
取消
提交
云知声联合创始人李霄寒:AI演进呈现三大规律,企业将走向通用、垂直两种路径
2023-04-03

ChatGPT的横空出世,在业界掀起了惊涛骇浪。

在过去两个月,太多问题涌向我们的大脑:GPT-4真的会带来认知智能的爆发吗?我们的AI和ChatGPT有多少差距?中国版OpenAI会诞生吗?中国AIGC产业会是“大厂赢者通吃”还是“百花齐放”……


230403-演讲01.png


前不久,GTIC 2023中国AIGC创新峰会在京举行,超20位产学研大佬汇聚一堂,围绕上述议题展开技术交锋、观点碰撞。云知声联合创始人、副总裁李霄寒受邀出席活动并发表《从理解到生成,云知声的AGI之路》主题演讲。

深耕人工智能产业多年,云知声一直密切关注AI前沿技术,并积极推动技术产业化应用,包括2012年的深度学习算法升级和产业化应用,到2016年Atlas智算平台、知识图谱和全栈AI技术应用,再到现在基于ChatGPT框架的AGI认知技术升级——目前,云知声正以医疗为切入口,构建ChatGPT医疗行业版。


230403-演讲02.png

▲云知声联合创始人李霄寒受邀出席并作主题演讲

 

现场,云知声联合创始人、副总裁李霄寒基于过往在人工智能领域的技术探索与经验积累,深度分享了云知声通往AGI的实现路径。

以下为分享精华,我们做了整理,谨供学习:

 

PART 1

回眸:AI历史回顾与规律总结

 

回顾整个人工智能产业发展史,第一件重大事件无疑是1997年IBM深蓝击败了世界围棋冠军卡斯帕罗夫;2012年,AlexNet横扫ImageNet榜单,则让人们充分认识到深度神经网络的力量,也就是在这一年,云知声将深度神经网络应用在语音方面,并且获得了当时普通话的最佳水平;2016年AlphaGo打破人类围棋不可战胜的神话,而在那一年云知声完成了过去几年比较基础的技术积累,并且在那个时间点形成了一直延续至今并发展壮大的两大业务——智慧物联和智慧医疗。

最近OpenAI推出的ChatGPT,一方面让我们感受到了压力,另一方面也很欣喜——从业这么多年,我们终于有机会看到AGI在未来几年成为现实,这是非常令人兴奋的一件事,云知声也在积极融入到整个大模型浪潮之中。

回顾历史,我们总结了一些规律:

规律一:以算法为中心到以模型为中心

早些年的专家系统基本都是规则,到了上世纪90年代,统计学习模型兴盛以后,模型逐步开始占较大比重,拿典型的语言识别关键词检测任务来讲,代码大小和模型大小基本在同一个量级,现在看起来就像一个玩具。而随着深度学习模型的引入以及到最近预训练模型的引入,整个模型占的比重越来越大,这就导致我们的投入——资源、人力、硬件,比例跟以前完全不一样了。


230403-演讲03.png


规律二:从小而美到大工程

在五六年或十年前,找几个人搭一个班子,买一些服务器数据就可以做一个AI产品,面向某个特定场景解决一些特定问题。而在未来,这件事情已经不可行了,AI真正变成一个大工程。可能还会有人想找一个非常小的领域去做AI,但问题是,当这个大模型解决完所有通用的问题之后,只需要在上面延伸出一个垂直的功能就可以把原来辛辛苦苦做的东西颠覆掉。现在再做AI如果没有一定的积累,未来又没有大规模投入的话,会是比较困难的一件事。

规律三:中间任务的凋零

过去解决一个复杂问题时,会把这个任务划分成一系列子任务,会把它串起来,这样一来,前一个子任务的输出可能只是为了下一个子任务的输入,这是所谓的中间任务。

2000年前后有一个功能特别流行,手写识别,在手机上用手写输入,从一张原始图片里提取出相应的特征,这个特征再输入到后面的分类器里就可以达到很好的水平,现在没有人那么做了,都是用端到端的方式来做,未来会用大模型来做,这种中间任务慢慢没有人做了,或者没有存在的意义。类似的中间任务还有分词、实体识别、指代消解、特征工程等,这些都将弱化或消失。

PART 2

解读:ChatGPT的影响

 

一、对技术路线的影响

在2022年及以前,国内很多公司都是在做大模型,不论是基于开源的还是自有的技术,只不过大家没有那么强的信心,认为这是一个线性输入-线性输出的过程,甚至最后会产生边际效应。但ChatGPT验证了这条路的可行性——只要你线性地持续地去投入,当模型参数达到一定规模时,就有可能出现涌现效应,实现非线性的、爆炸式的输出。它使得所有人都相信,大模型是一个必经之路。

二、对社会分工的影响

我们将项目经理有关项目进度的一封邮件交给ChatGPT重新组织了一下,发现ChatGPT组织后的文本文笔更流畅、更精简,结构更鲜明,且重点突出,这也就自然而然产生了一个问题——项目经理这样的角色,未来还会不会存在?

我的思路是,我们要看他是为什么负责,项目经理是在为项目的进度在负责,他并不是为周报在负责,周报只是一个中间任务,它被替代掉没有关系。所以大模型的输出最终会去服务于项目经理,而不是替代项目经理。

程序员亦然。程序员并不是为输出代码负责,他负责的是功能的正常的集成、集成以后的正常运行,他为debug负责,代码只是一种中间任务。

未来,在云知声内部的开发体系里,产品经理、项目经理、架构师、编码、集成、运维……每个人都将获得大模型的辅助,这将很快成为现实。



230403-演讲04.png


而像有一些以简单的输入输出为主,不必承担重大后果的岗位,例如,文稿的撰写和纪要、实习程序员、客服、儿童陪伴等,哪怕工作内容很复杂,他都有可能会被替代。

三、对AI企业的影响

未来AI企业生态会有两种模式。

一种是基于通用大模型提供服务的公司。它们通过通用大模型底座对外提供服务,从而获取规模性的用户。这种服务的成本会很低,导致售价也非常低,形成模型的飞轮,进而形成一个壁垒。当这些壁垒形成以后,后来者的大模型哪怕做得再好,也会因为“白菜价”的存在,很难快速获取巨量用户群体来反哺大模型的投入,形成可持续的商业模式。

另一种是基于垂直场景大模型提供精细化服务的公司。我们坚信通用的大模型并不能解决各个垂直领域的所有问题,哪怕他在技术上解决掉,他在真正的应用过程里会有很多的know-how,很多行业的壁垒。这些壁垒必须有专业的公司去进行服务,且不能通过通用大模型去解决,那通过什么呢——

垂直的,但还没有那么大的大模型。可能一开始不会到千亿参数,但一定会在几百亿规模。然后,再形成规模性的客户,获取到足够的数据,在获取数据提供服务的整个过程里,这个场景会非常注重它的可控性,这种可控性不仅仅是数据本身的可控性,也有服务的可控性,最后会形成一个面向垂直场景来提供服务的公司,这类公司可能在每个垂直领域都会有几家,这也是广大 AI从业者的比较好的一个机会。

 

PART 3

理性看待:ChatGPT的进步与局限

 

云知声认为,ChatGPT的出现,让AI真正进入了CGG时代。

所谓CGG,第一个是会话式AI。ChatGPT让我们有机会告别人工智障,这给我们带来了非常大的兴奋点;第二个是生成式AI,语音,文字,图像,视频皆可生成;第三个就是通用人工智能。我们有幸看到在未来几年,AGI真正可能成为现实,然后从这个时间点往后,巨量的投资也好,或者AI企业的人员投入也好,都会集中在AGI层面。


230403-演讲05.png


ChatGPT当然也存在一些局限,我们关注这些局限不是为了挑毛病,而是去反思在我们所从事的领域如何解决这些问题,避免这些问题。

首先是“幻觉”,就是所谓的一本正经地胡说八道;

其次是知识更新的速度和自动化的程度,当我们去做垂直场景的时候,存在大量的行业知识,这些行业知识在不断地产出,我们也需要迅速地吸收,让它被搜索到;另外在to B场景中,我们需要赋予客户本身一定的能力,让其能够自己“灌知识”,而不是所有事情都依赖服务公司。

第三是推理资源的微型化,也就是私有化。

第四是伦理和价值观的问题,这个问题通过前置或者后置审查,相对可控。

最后是ChatGPT学习及处理的仅仅是人类世界从现实世界翻译来的符号化知识,缺乏与物理世界的互动。这个问题是相对比较长远的一个方向,但它也是我们解决上述问题之后,必须面临的下一个问题。

 

PART 4

展望:云知声的AGI路径

 

成立于2012年,云知声拥有自研的技术架构,包括自建的智算中心、全栈式算法,以及海量的数据,云知声基于此打造云知大模型——一开始是用AI1.0的方式在做,现在正将其进化到预训练大模型。云知声下游覆盖智慧物联与智慧医疗两大场景,未来会从智慧医疗入手,应用我们的大模型,面向医院、医生及医管部门,提供AI医学大脑。

那么,ChatGPT在医疗场景有哪些用途呢?ChatGPT的回答是:医疗问答、聊天机器人、疾病诊断、医学文献检索、患者跟踪等,归根结底,它也是在做虚拟医生。

云知声对ChatGPT做了比较长时间的分析,并根据我们积累的行业知识做了一些推导,发现除了上述一些通用的局限之外,ChatGPT在垂直领域还有进一步的应用局限:

1.在某些问题上可以给出一个很好的答案,但它没法对自己作出的回答援引资料进行背书,没法对自己可能出现的错误负责,医生较难为模型的错误买单;

2.在医疗领域的生成文本,难以保证可控,可信和可靠——场景更关注短板而不是长板;

3.尚不能整合电子病历、影像、基因组等多模态医学数据;

4.难以导入医院内部数据和知识;

5.难以及时更新最新文献结果;

6.使用成本尤其是监管成本的问题。

云知声的主要工作重心就是解决大模型在垂直场景落地的这些具体的局限。例如,我们会做行业知识的增强以解决“幻觉”的问题,会做企业检索的增强、API的增强、微型化以及IO审查,所有这些问题都是可解的,都会在有限的时间内解决。

在这个基础上,云知声会推出面向医疗行业的行业版大模型,并在行业之上,面向客户提供企业定制版大模型。

从16年进入医疗行业以来,云知声经过多年积累,在数据层面、在大模型以及知识图谱方面都取得了一定的进展和成效,有一个非常好的起点。

云知声的愿景,就是从医疗版着手,逐步覆盖到其他专业版,最后把各个专业版联合起来,基于MoE(Mixture of Experts)技术做模型集成,训练得到通用增强版。

从业那么多年,这是第一次感觉AGI距离我们那么近,以前用AI技术去解决某个场景的某些问题,一旦涉及到业务本身如何真正赋能行业时,就会遇到各种各样的应用层面问题。今天这个时间点给了云知声一个新的机会,我们可以真正通过AI的方式把我们原来的愿景和梦想真正落地。


返回列表