近期,以“生成式人工智能”(Generative AI)为核心技术的聊天机器人ChatGPT火爆全球。什么是ChatGPT,它强在哪里?会对未来世界带来哪些颠覆性影响?围绕网友普遍关心的话题,科大讯飞副总裁、研究院执行院长刘聪接受记者专访。
科大讯飞副总裁、研究院执行院长刘聪
(资料图片)
ChatGPT可自主、快速、不间断地学习各领域专业知识并达到人类专家水平
ChatGPT本质上是一个由浮点数参数表示的深度神经网络大模型,属于深度学习的框架。ChatGPT的推出是深度学习提出后又一个里程碑式的技术革命,将为以自然语言处理为核心的认知智能技术发展提供新的“历史机遇期”。这次ChatGPT引发全球学术界和产业界的热议和关注,关键原因是ChatGPT通过至少以下五个维度能力的显著提升,实现了初步的“智慧涌现”:(1)海量高价值信息的全量在线记忆能力;(2)自然语言输入的任意任务和多轮对话理解能力;(3)复杂逻辑的思维链推理能力;(4)多角色多风格的长文本生成表达能力;(5)即时新知识学习应用与进化能力。此外,因为引入了代码作为训练语料,ChatGPT还额外产生了自动写代码和理解代码的能力。
综合来看,ChatGPT的能力之强已不仅是停留在单一场景的人机对话,而是一个同时具备多种能力的通用“对话式AI系统”。与传统认知智能需要针对各领域任务定制对应的系统不同,它不仅能完成多个场景、多轮的相当自然的人机对话,更为重要的是以自然语言交互式学习的“类人”新范式,能在多轮交互中以“类人”的方式交流、学习和进步,并可以自主、快速、不间断地学习各领域专业知识并达到人类专家水平。
作为长期深耕人工智能领域的一名科研人员,“求真务实”和“躬身入局”是我们面对人工智能发展的正确态度。我们不仅要结合实际效果和技术原理客观理性地分析ChatGPT现有技术水平,还要进一步思索未来的技术发展方向。
类ChatGPT模型的持续发展将推动产业变革与模式创新
ChatGPT的初步突破带来的影响和未来想象空间是巨大的。在技术演化的基础上,以自然语言处理为代表的人工智能算法有可能重构互联网和移动互联网的产品形态,促进教育业、医疗业、汽车业、金融业、消费业、媒体业、服务业和制造业等众多产业的升级,最终带来对应商业模式的变革。我们认为类ChatGPT模型的持续发展未来至少会从以下4个方面推动产业变革与模式创新:
一是改变现有人机交互模式。未来人们可能用自然对话的方式与智能产品交互,ChatGPT通过精准理解用户意图,调用系统的各种软件或服务来满足用户需求,提高交互效率与任务成功率。这种人机交互模式的改变将可能改变当前的APP等应用的使用方式,例如多个功能的软件能力被整合,甚至出现“大一统”能力的超级通用APP;
二是改变信息分发获取模式。基于认知智能技术可实现更高效的信息整合和知识推荐等。以搜索为例,传统搜索引擎根据关键字匹配内容,使用者需要在海量搜索结果中筛选出有用信息,而ChatGPT加持的必应直接给出答案,并提高了问题与答案的匹配精准度,大大提升用户体验。信息分发获取模式的改变将影响流量的分布,并改变流量变现的商业模式。
三是革新内容生产模式,提高生产力。作为AIGC(人工智能生成内容)技术的典型代表,ChatGPT一经上线便被大量应用于公文写作、邮件编写、代码编写等,ChatGPT的编程能力将极大拓展普通人利用电脑和网络进行创新和创意的能力。未来ChatGPT被集成到word、excel、ppt等工具软件后,将提升内容生产效率与丰富度,变革人们的办公方式,成为新的全行业生产力工具。ChatGPT还将带动图像、音频、视频等形式的AIGC技术与产业发展,使得AIGC的内容既有“好看的外在”,更有“丰富的内涵”。
四是加速“AI for Science”的发展。对于科研人员,ChatGPT不仅可以辅助生成论文摘要与文献综述,随着其学习的科研数据越来越多,未来有可能提供专业的研究建议甚至主动探索发现新的理论,带来整个科学研究范式的全新变化,把“AI for Science”推上一个全新台阶。
这次ChatGPT所带来的革命将会深刻地改变当今世界的生产和生活方式,重构产业格局,是人工智能领域推动工业乃至社会变革的重大战略机遇,是未来发展兵家必争之地。
有信心实现ChatGPT类似的技术阶跃进步
在ChatGPT引发的AI技术新一轮热潮背景下,科大讯飞基于认知智能全国重点实验室,已在核心算法、行业数据、算力支撑及团队组建等方面建立了优势保障。
在Transformer深度神经网络算法方面,科大讯飞语音识别、图文识别、机器翻译等已达到国际领先水平;创新提出了知识与大模型融合统一的理解框架X-Reasoner,有望弥补大模型的模糊记忆技术短板,并在认知智能技术领域,2022年累计获得了常识阅读理解挑战赛OpenBookQA等13项世界冠军;开源了6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万,在Github平台获得星标数位列同类中文预训练语言模型第一名。
在严格遵守适用法律法规前提下,我们在多年认知智能系统研发推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据,也为基于大模型的创新应用研发和试点推广提供了场景保障。
科大讯飞自建有业界一流的数据中心,为大模型训练平台建设奠定了很好的硬件基石。此外,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。
结合我们多年来在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累,通过最近两个多月的系统分析和快速验证,我们非常有信心实现ChatGPT类似的技术阶跃进步。
为了进一步提高大模型在细分行业的实用性,我们计划采用“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。例如,通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式AI系统,打造“每个医生的AI诊疗助理,每个人的AI健康助手”。
此外,我们也非常希望基于认知大模型与各行各业的伙伴们在企业数字化、行业内容生产等方面开展深入合作,形成智能化定制解决方案。我们的技术底座和行业积累合力共赢,将助力合作伙伴跨越认知智能技术壁垒、提高产品竞争力、实现协同创新,共同加快行业转型升级发展。