人工智能(AI)技术的迅猛发展对当今世界产生了深远的影响,特别是伴随着实际应用场景的AI系统的推出,已对一些行业产生了实质性影响,如DeepMind公司开发的AlphaGo、AlphaZero、AlphaFold等系统,IBM公司开发的WatsonStudio、WatsonDiscovery、WatsonAssistant等系统,科大讯飞公司开发的iFlytekVoice、iFlytekInput、iFlytekMeeting、iFlytekEducation等系统,正对教育、游戏、金融、医疗、汽车、消费品、工业互联网等行业产生巨大影响,这些系统的共同特征是基于深度学习的人工智能技术。
2022年年底横空出世的ChatGPT,是继Alpha、Watson和iFlytek等系统之后在极短时间内引爆全球的又一个里程碑式的人工智能深度学习系统。与Alpha等系统在短期内仅涉及部分行业不同,ChatGPT在面世后不到两个月的时间即影响到众多行业,其中对教育、咨询、数据分析和搜索引擎等行业或细分行业的影响尤其显著。尽管至今ChatGPT以及Alpha等系统对会计、审计等行业的影响仍未能充分显现,但这类系统所具有的颠覆性能力和令人期待的应用前景已受到一些会计专业人士的密切关注。本文试图通过对ChatGPT技术特征和会计行业应用特点的分析,探索类似ChatGPT的人工智能系统及其底层的机器学习算法在会计领域广泛应用的可行性,并进一步探讨它们对会计行业可能带来的深远影响,最后就会计人员如何应对人工智能系统带来的挑战给出一些建议。
一、ChatGPT及其技术和应用特点
ChatGPT是OpenAI公司于2022年年底发布的基于GPT模型的通用人机对话系统,是一个大型的语言模型和一款具有较高智能的多语言聊天机器人。ChatGPT中的GPT是英文Generative Pre-trained Transformer的缩写,含义是“生成式预训练语言模型”。ChatGPT一经面世,即受到全世界各行各业的普遍关注,并迅速产生实质性影响。
ChatGPT的核心技术是生成式AI(Generative Artificial Intelligence)。著名信息技术研究和咨询公司Gartner认为,生成式AI可通过各种机器学习方法从数据中学习要素,进而生成全新的、完全原创的、真实的工件(一个产品、物品或任务),这些工件与训练数据保持相似,而不是复制。简言之,生成式AI是一种可以利用现有文本、音频文件或图像创建新内容的人工智能技术,它可以检测与输入相关的基本模式并生成类似的内容。
具体而言,ChatGPT是一种基于文本的生成式AI系统,它能够通过收集网络上大量的文本数据,并采用深度学习的算法从中学习和理解人类语言交流中所使用的领域知识和语法规则,进而生成符合人类习惯的对话结果(即工件)。
与传统的搜索引擎仅响应单个问题,并一次性给出多个答案让用户自己选择的服务模式不同,ChatGPT能根据聊天过程中的上下文,精确地捕捉人类每一次问话的意图,并基于预先训练的海量语料库,用文本形式智能地生成一个符合人类习惯的答案。借助这种人机对话模式,ChatGPT可高质量完成论文、邮件、故事、计划书、程序代码、视频脚本、行业分析报告等文本的撰写任务以及语言翻译、文章摘要等任务,甚至能在人类协同的情况下完成一些复杂的文本分析和逻辑推理任务。为了学习人类的知识体系和语言规则,ChatGPT借助人工和自动爬取的方式收集了数以十亿计来自新闻媒体、政府机构、学术团体、社交网站、百科全书等网络渠道用世界上各种自然语言记录的文本数据,经过严格的筛选和清洗,采用无监督的预训练策略进行深度处理,并基于人工反馈的强化学习方式对训练结果进行优化和调整,最终形成庞大的语料库,以保证对话的结果更加无偏见和符合人类的预期。
与大多数现存人工智能系统一样,ChatGPT的发展历史并不太长,它的核心技术起源于2018年诞生的GPT系列自然语言处理模型,在短短不到5年的时间中,OpenAI公司就陆续发布了GPT-1(2018年6月)、GPT-2(2019年2月)、GPT-3(2020年5月)等若干版本的模型,供预训练的数据量从最初约5GB左右,迅速发展到现在的近百TB的规模。当前的ChatGPT系统是基于GPT-3.5版本模型开发的,且正在快速迭代升级之中。基于以上分析,结合笔者与ChatGPT系统的多次对话体验,本文尝试对ChatGPT的特点和不足做以下归纳。
1.ChatGPT是近期OpenAI公司推出的基于自然语言处理的智能通用人机对话系统,是当今世界生成式人工智能发展的重要成果之一,它能够运用多种语言以类似人类交流的方式快捷地回答来自不同领域的问题。
2.ChatGPT采用文本形式进行交流,且支持连续多轮对话。对话结果可覆盖回复用户提问、撰写研究报告、构思学术论文、编写发展规划、草拟电子邮件、创作视频文稿和编写程序代码等内容。其最被关注和常用的功能是帮助研究者流畅地写作。由于ChatGPT仅提供唯一答案,且未能提供参考信息的来源,可能会降低答案的权威性和透明度。
3.ChatGPT目前仅提供文本处理的结果,无法处理声音、图像、视频等信息,因而无法满足人类对多媒体信息的需求。未来ChatGPT可能会与其他支持视频、音频处理的生成式人工智能模型联合使用,甚至与ERP和RPA系统有机集成,从而创造一些新的应用场景。
4.为实现高效的人机对话,ChatGPT必须事先收集大量高质量的文本数据,在有效筛选和清洗后,对这些数据进行预训练,并通过深度学习算法产生符合人类交流习惯的大型语料库,最终供生成对话结果时使用。
5.ChatGPT回答问题的准确度与语料库的质量密切相关。当前的版本由于数据收集渠道和数量的局限,导致对一些行业以及非英语类问题的响应能力有限,其主要表现是答案过于简单且准确性较差,可能会出现“一本正经地胡说八道”的现象。
6.2022年年底发布的ChatGPT版本,其数据收集截至2021年,且不支持实时网络搜索功能,这意味着系统无法在线吸纳最新的知识,只能基于2021年所拥有的数据集进行回答,导致对最新发生的事件,系统无法有效响应。
7.ChatGPT会质疑用户提出的不正确的问题,也会主动承认自身的回答错误,并随即优化答案,系统还会承认自身的无知(即对领域知识的不了解)。此外,尽管系统可以通过一定的算法适度过滤并驳回类似于种族歧视和性别歧视等方面的问题,但还是缺少人类的心智特点,缺乏独立的“人格”。
综上所述,ChatGPT是一个超级强大的人工智能对话系统,尽管当前的版本还存在一些不足,但随着系统的不断迭代,未来系统的开发者肯定会通过改进来弥补系统的局限性。通过与ChatGPT的数轮对话,笔者了解到目前OpenAI公司的研究人员已经提出了一些改进模型的方法和技术,例如:(1)引入多模态学习能力,即未来ChatGPT可以结合图像、音频和视频等多种模态的数据进行学习,从而提高其对非文本数据的处理能力。(2)提升领域适应和迁移学习能力,即未来ChatGPT可以通过在特定领域中的预训练和微调技术,以及跨领域迁移学习的方法,提高其对特定领域和任务的适应能力。(3)加强语义理解和推理能力,即未来ChatGPT可以通过使用知识图谱和常识库等语义信息来进行推理和逻辑推断,从而提高其对抽象概念和逻辑关系的理解能力。(4)可通过进一步改进模型结构、优化算法和提高数据质量等方法来提高未来ChatGPT的性能和应用范围。
(未完待续)