最近,国内与国际在AI发展路径上存在差距。国内虽然也花了近70年的时间从手工业走向工业化,但AI领域,从“手工作坊”走向工业化,只花了不到3年。根据《意见》,2030年,新一代智能终端、智能体应用普及率应该超过90%。
然而,目前,AI技术发展并没有像我们想象般的顺畅,开发周期过长、投入成本过高,以及模型质量在实际业务应用成效低下的问题,是阻碍AI应用落地的三大核心问题。这些问题包括效率方面的困难,过去训练一个政务问答模型,需要5个工程师花费将近一个月的时间,最后效果还依赖调参工程师的经验。成本方面,企业需单独采购算力、组建算法团队、搭建数据平台,导致单个模型成本高达数千万。
另外,企业在大幅增加AI投入的同时,也越来越关注可量化的业务成效。“投资流向生成式AI过程中,企业已从对技术先进性的追求,逐渐转变为追求切实的商业价值。”联想集团高级副总裁、首席信息官、方案服务业务集团首席技术与交付官曾对笔者指出。
模型质量方面,现在模型在行业侧应用质量不高,很多模型产品投产之后达不到原有想要的应用效果。究其原因,主要有两点,一是模型选型与业务需求不匹配。二是模型存在幻觉问题。例如深度学习模型的性能,高度依赖于海量高质量的训练数据。但目前企业内部数据质量“参差不齐”,多数企业的数据分散在ERP、CRM、IoT设备等分散的,“孤岛”的数十个系统中。
肖雪认为,造成上述三重困境的主要因素是,常规的模型训练模式是一种类似“手工作坊”的模式——过程非标、高度依赖人才经验、难以规模化。为了解决这些问题,浪潮云给出的答案是:搭建人工智能模型工厂,通过“九大单元”(数据车间、模型车间、评测中心、集成车间、客户服务中心、产品工程中心、安全中心、设备管理中心、调度服务中心)架构,提供系统性答案,构建覆盖从数据准备,到集成交付全流程的体系。
当数据“就绪”之后,会将数据集“传输”到模型车间,该车间基于数据车间形成的高质量数据,对模型做调优训练,达到用户订单要求。通过这样一个个单元,组建起了一条模型的“产品流水线”,构建了统一、标准、安全、高效、开放的AI模型生产模式,解决了原先模型训练过程中存在的分散、高成本、高风险的问题,将模型作为一个工业产品,用集约化的方式对外输出。
目前,全球范围内已经建成了包括浪潮人工智能模型工厂在内4个模型工厂,而第五个——美的荆州工厂也投产在即。显然,模型工厂的模式将逐渐成为企业级AI应用的一条可行路径,通过集约化的方式,达到标准化流程、专业化分工与生态协同的目的。
然而,目前,AI技术发展并没有像我们想象般的顺畅,开发周期过长、投入成本过高,以及模型质量在实际业务应用成效低下的问题,是阻碍AI应用落地的三大核心问题。这些问题包括效率方面的困难,过去训练一个政务问答模型,需要5个工程师花费将近一个月的时间,最后效果还依赖调参工程师的经验。成本方面,企业需单独采购算力、组建算法团队、搭建数据平台,导致单个模型成本高达数千万。
另外,企业在大幅增加AI投入的同时,也越来越关注可量化的业务成效。“投资流向生成式AI过程中,企业已从对技术先进性的追求,逐渐转变为追求切实的商业价值。”联想集团高级副总裁、首席信息官、方案服务业务集团首席技术与交付官曾对笔者指出。
模型质量方面,现在模型在行业侧应用质量不高,很多模型产品投产之后达不到原有想要的应用效果。究其原因,主要有两点,一是模型选型与业务需求不匹配。二是模型存在幻觉问题。例如深度学习模型的性能,高度依赖于海量高质量的训练数据。但目前企业内部数据质量“参差不齐”,多数企业的数据分散在ERP、CRM、IoT设备等分散的,“孤岛”的数十个系统中。
肖雪认为,造成上述三重困境的主要因素是,常规的模型训练模式是一种类似“手工作坊”的模式——过程非标、高度依赖人才经验、难以规模化。为了解决这些问题,浪潮云给出的答案是:搭建人工智能模型工厂,通过“九大单元”(数据车间、模型车间、评测中心、集成车间、客户服务中心、产品工程中心、安全中心、设备管理中心、调度服务中心)架构,提供系统性答案,构建覆盖从数据准备,到集成交付全流程的体系。
当数据“就绪”之后,会将数据集“传输”到模型车间,该车间基于数据车间形成的高质量数据,对模型做调优训练,达到用户订单要求。通过这样一个个单元,组建起了一条模型的“产品流水线”,构建了统一、标准、安全、高效、开放的AI模型生产模式,解决了原先模型训练过程中存在的分散、高成本、高风险的问题,将模型作为一个工业产品,用集约化的方式对外输出。
目前,全球范围内已经建成了包括浪潮人工智能模型工厂在内4个模型工厂,而第五个——美的荆州工厂也投产在即。显然,模型工厂的模式将逐渐成为企业级AI应用的一条可行路径,通过集约化的方式,达到标准化流程、专业化分工与生态协同的目的。