过去的一年里,OpenAI开发的ChatGPT掀起了大模型的热潮,使人工智能在多个领域取得了惊人的突破和变革。然而我们发现,市场上的通用大模型虽功能强大,但似乎并不能完全满足不同企业的个性化需求。
十年来,云问科技在企业知识管理方面积累了丰富的经验,深知企业对于知识管理的需求。因此我们提出了企业私有化知识大模型的概念,旨在为企业提供更贴近自身业务需求的人工智能解决方案。
我们深入研究了国内外的基线大模型,结合企业业务数据进行了大量的微调训练,推出了「云中问道」企业私有化知识大模型。解决了本地知识库结合大模型可能出现的难点问题。
同时,针对生成式模型的合规与幻觉问题,进行了大量的优化,并在生成之前对输入数据进行过滤筛选,生成之后对输出数据进行合规与事实性的检测,基本实现了全流程的可控生成。
同时在大模型国产化方面,云问科技与华为西安未来人工智能计算中心一起,在基于华为NPU的LLaMA适配开源项目中实现了从模型到应用,从软件到硬件全方案国产化,让企业用起来更加安心。
如何让大模型真正在企业中落地?是我们一直深刻思考的问题。所以很长时间以来,云问都在研究如何将大模型与企业现有的产品结合,为企业提供更高效、智能的知识管理和服务解决方案。
我们设计了一整套大模型产品矩阵——Y-ASK(云问),包括ChatYun-云中问道企业私有化知识大模型、AIgalaxy-AIGC应用、ServiceAI-智慧营服以及Know+-知识智能。
我们希望能够带给用户像天上的繁星一般多样化的应用,可供用户在有需求时,及时选用这些根据其企业自身场景设计的应用,并且诸多应用之间有链接和呼应,能够最大限度在企业各类场景中发挥价值。
但传统大模型坐落地应用,需要的开发和部署都涉及十分复杂的技术要求,需要对深度学习、自然语言处理等领域有深入的专业知识。普通用户或非技术背景的用户难以玩转,从数据预处理、模型训练到部署等环节都是非常耗时的过程,需要耗费大量的时间和人力。
针对这个情况,云问将专属的行业数据微调大模型和针对性的AIGC应用融合提供。基于这套系统,每个人可分分钟手搓一个大模型快速应用,不需任何开发过程和繁琐的配置,通过简单的配置即可上线使用,大大节省了应用创建的时间,快速实现落地。
我们将AIGC应用平台的应用分为简单应用与综合应用。简单应用主要面向不依赖大模型以外的数据即可完成的单任务应用,综合应用面向需要综合多个外部系统或者应用的复杂类任务。
目前该平台已经提前在多个客户落地试运行。如某客服中心可利用该平台,根据管理者表达的重点诉求,直接调用多个客服中心系统数据,自动生成综合运营报告。
基于大模型发布,本次问答系统在许多方面都有升级改进。云问利用私有化知识大模型对原来的客服机器人进行系统升级,引入改写式问答、文档生成式问答功能,这将极大地提升问答体验。
改写式问答能够将用户提出的复杂问题拆分成多个知识点,然后从已有的知识库中汇总相关信息,通过大模型进行融合,以简洁明了的方式回答用户。这种问答方式不仅适用于场景问题,还可以根据用户的不同需求提供多种角色选择,使回答更加贴切和易于接受。同时,还优化了上下文理解能力,支持更丰富的获取方式。
针对没有 FAQ库的企业,云问提供了基于私有化知识大模型的文档生成式问答,用户提问后,可从提供的产品或政策文档中定位相关内容,并通过大模型加工,找到合适的回答。这种方法不仅可以从单篇文档中找到答案,还能支持跨文档的知识点。
此外,还可以实现双语问答以及多模态问答,无论是图片还是表格,都可以从文档中找到相关内容,并为用户提供丰富多样的问答体验。
如果一个企业能够把知识加工得更加精细,那么其消费者的问答体验肯定会更好。
因此在ServiceAI智慧营服这块,我们也有知识的构建功能,通过FAQ抽取、相似问的生成及场景的搭建三大方式构建客服的话术库。例如在FAQ抽取方面,大模型自动生成问题答案,随后人工审核入库,提高话术库的准确度。
首先是画像抽取,通过大模型实时从用户以往的服务记录中提取出用户关注的重点,为客服提供巨大的帮助。此外,我们发现在客服和销售中心中常常存在类似专家角色的人员,他们的服务记录和话术都是企业宝贵的资产。通过大模型分析,可以帮助生成这些优秀话术,用于未来培训和其他人的话术辅助。
其次云问开发了流程话术抽取工具,能够快速根据服务记录生成企业的历史服务记录流程话术。在实践中,我们对不同类型的客户进行了分析,包括技术工程和化妆品消费,提取出不同领域的流程话术。这些流程话术可以引导不同角色用户参加我们的活动,显著提高效果。
第三是工单抽取功能,可以通过大模型快速提取客服在服务过程中所需填写的信息,比如用户年龄、地址等,可以用于快速总结服务事件。
最后客服人员在提供服务后通常需要进行总结。通过大模型快速生成服务小结,并抓取用户关键信息节点,可以有效避免信息丢失或不专业的情况。这样,客户不再需要重复说明,提高了服务效率。
以上工具能够大幅提高客服人员的服务效率,节省时间,让一个人的服务量从100个增加到150个。同时每个服务的时长缩短,大大提升了整体服务量。
在与客服行业从业者交流时,我们发现他们希望机器人在客户服务中起主导作用,当机器人无法解决问题时,再转接给人工客服。
每个客服代表或销售代表都像团队主管,雇佣不同的机器人。在这种情况下,我们可以实时展示三通电话的进程,并在判断客户有投诉、消费或买单可能时接管服务。
然而,由于过去的问答和交互体验不够流畅,实现人机耦合相当困难。但现在,AI实时生产和实时问答体验已显著提升,使得在不太复杂的场景下,客服人员可以实现真正的人机耦合。
通常情况下,由于不能让新员工直接面对真实客户,因此难以通过真实情景进行客服培训。
现在可以使用大模型进行对练,学习以前的服务记录,快速构建用户真实场景,让客服应对各种难题和刁钻问题。可能包括投诉处理、购买流程等。
此外,还可以进行随练随评,在整通队列完成后,机器会自动完成画像评分,评估岗位技能矩阵,帮助客户了解自己的问题所在并针对性地解决。
知识管理是企业数字化转型的关键。知识是企业重要的智力资产,通过构建知识中心,企业可以更好地赋能业务创新。而大模型的出现,为知识管理带来了新的机遇。
云问知识工程通过对知识进行分类、加工、消费,助力企业实现知识体系的完善和科学化。十年来,我们在知识工程领域积累了丰富的经验,提供了从自动化知识构建到统一知识体系的解决方案,适用于知识密集型行业,如研究院、飞机制造、汽车制造和建筑设计等。通过知识工程,企业可以在数字化转型道路上走得更扎实,创新更有基础。
云问知识工程涉及到不同类型的知识,包括FAQ、SPO、关系、流程等。对于不同的企业或场景,知识最终呈现的形式和方式也不同。因此,我们将知识区分为不同类型,以便在知识加工过程中明确不同对象的知识类比。
在知识工程的能力层,我们会进行文件预处理、多模态识别或视觉定位等操作,以了解知识所在的位置。此外,由于企业可能已经使用了许多不同的系统,此时需要进行知识中间态接口和任务能力的开发。
我们的知识工程平台集标注、训练、审核和抽取于一体,使企业在一个平台上完成所有工作,便于知识复用。在知识加工完成后,可以无缝对接到企业的知识中心,最后通过检索、问答、决策、支撑和推荐等多种形式进行知识消费。
在大模型知识构建方面,云问将知识构建拆分为FAQ构建、图谱构建、多模态构建和关键信息构建等环节。
首先,在FAQ构建方面,我们从不同数据文档中生成 QA和问题相似问,然后生成答案相似问,接着进行人工审核,最后供机器人消费。
在图谱构建方面,我们坚持将大模型与知识图谱相结合,使用知识图谱让大模型在生成时更具可控性和精准性。同时,我们也利用大模型来构建图谱能力,例如标签标注提取、摘要生成、文档分类等。此外,我们还可以进行主题抽取、属性抽取和关联关系抽取,从而实现文档的多维度调用。
在多模态知识构建方面,云问实现了文档段落抽取、图片抽取和公式提取等功能。用户可以通过图片识别定位、标题判断、人工审核标注等操作,将图片数据转化为可编辑的公式类型知识。对于复杂的公式,用户只需提供数据,机器即可给出结果。
知识消费场景的重要部分就是搜索。我们提出了聚合搜索的概念,认为不能单纯依赖大模型来定位知识,而是需要保留原有的搜索形式,但通过优化语义适配和推荐算法来提高搜索的准确性。
当用户提问时,系统会在后台找到所有相关的知识点,并根据优先级和访问热度进行排序。对于能够通过MRC(机器阅读理解)找到答案的问题,系统会直接给出答案,并标明知识来源。同时,系统还会通过图谱推荐相关的知识,帮助用户更好地理解知识体系。
除了聚合搜索,当用户已经定位到某一篇文档时,系统还提供了文内问答功能。对于篇幅较长的文档,用户可以通过提问来获取文档中的关键信息。系统通过长文档拆解技术对文档进行预处理,然后根据用户的问题在文档中找到相应的答案。此外,系统还会采用证据定位技术,标明回答内容的来源,方便用户追溯。
除了能够主动搜索知识,在应急灾害发生后,通过结合处置图谱和大模型,系统还可以针对不同情况为用户提供处置分析。
例如,当用户提问如何处理机动车在道路上撞人后逃逸的事故后,系统会分析事发情况、区域政策、伤亡情况等因素,给出处置建议和相关知识点。整个处置分析过程实际上是大模型和知识图谱相结合的结果。
在知识消费领域,除了前面提到的对于知识的搜索、处置建议的生成,云中问道大模型还可以进行智能撰写。
在撰写过程中,根据以往同类型的文档进行强化训练,例如设计一些类型、样式变更、续写或流程干预等。这些操作都可以在整套知识编辑辅助平台上实现,我们已经在右侧插入了一些插件,如WPS等,以便在撰写文档时提供辅助。同时能够判断文档是否符合当前的流程和规范,并且从某个地方找到一些信息来支撑和辅助撰写。
对于事件报告,可以通过事件立方来完成对事件的分析、筛选和预测。通过对大模型的事件阅读,我们可以发现每一类事件都有一个可梳理的发展路线,以及接下来的可能趋势。
由于人类受限于对知识的阅读量,无法在短时间内快速获取大量信息。因此,大模型的优势就体现出来了,如果将人工经验与大模型相结合,可以快速产出高质量的事件报告,帮助我们对事件进行预测。
云问能够通过图像识别的技术、关键词生成技术以及字幕生成技术来自动生成培训视频和课件,同时还能自动生成考题,当考试完成后,机器能够自动判卷,并根据考试成绩定制推送新的学习内容和考卷。
最后,我们认为大模型在企业落地时,必须结合不同行业的场景。例如,在方志的数字宣传平台上,云问汇总了传统的地方志内容,方便用户在搜索和撰写时使用大模型能力。在出版社的知识管理中,我们将不同类型的知识汇总,利用大模型进行学习。这使得搜索推荐和快速问答功能在平台上得以实现,甚至可以指导工程领域的工作。
在政务应用中,云问快速学习了政务服务事项,形成了政务知识中心。用户可以在这里获取服务办理帮助,甚至可以在聊天过程中完成事件办理。在工业领域,我们管理设备的全生命周期知识,包括故障定位、QY球友会官网预测、案例生成和检修单智能填写等功能。这大大提高了设备管理的效率。
此外,云问还实现了技术标准的消费和应用,提高了研发效率。在汽车经销体系中,能够让销售人员快速掌握汽车知识,维修人员能够定位并解决故障。这些应用都需要一个知识中心来驱动。
除了上述案例,云问还在公共服务体系、智能党建、消费服务等场景中实现了大模型的行业落地。大模型在多个行业和场景中发挥着重要作用,为企业提供了强大的支持赋能。
在未来,云问将继续推动技术创新,不断拓展AI对各领域的智能化升级。我们坚信,智慧源于专属,让每家企业都能拥有个性化的智能化解决方案,让每个人的生活都因智慧而更加美好!