元宇宙有了权威标尺,首批数字人评测结果正

怎样判断得白癫疯 http://m.39.net/baidianfeng/a_7192379.html

年6月21日,以“内容向善,科技赋能”为主题的内容科技成果发布会在线上顺利召开,中国信息通信研究院(以下简称“中国信通院”)作为主办单位,发布了全国首批数字人系统基础能力评测结果。共10家企业(2家选择不公布结果)参与评测,9家通过。

表1数字人系统基础能力评测结果

图1数字人系统基础能力评测结果发布

评测背景

中国信通院云计算与大数据所自启动数字人标准体系研究和建设以来,得到了头部互联网公司、重点行业企业的高度重视和广泛参与。经过两年多的研究和探索,目前已经形成了多项全球范围内首创的数字人国际标准及行业标准。本次评测正是依据其中的《数字人系统基础能力要求及评估方法》规范文件开展,分别从基础技术能力、基础工程化能力、基础安全保障能力三大维度评估数字人系统是否能满足用户普遍的使用需求、支持业务规模化应用落地和现有的合规要求。共计48项测试项,其中27项必选,21项可选。

图2《数字人系统基础能力要求及评估方法》参编单位

图3数字人系统基础能力评测内容简介

评测工作概况

年4月,中国信通院组成评测组通过进入企业应用现场或线上接入的方式,采取人员访谈、系统操作演示和材料审查相结合的评测方法,陆续对腾讯等10家企业开展测试工作,并于5月30日以线上会议的形式召开了专家评审会,形成最终检验结果。

评测结果分析

从各测试项通过情况上来看,所有参测产品测试项目平均通过率为96.61%,可选项平均通过率为92.26%。终端渲染SDK支持情况、肖像权及著作权等、数字水印支持情况、内容风险控制机制等可选指标项通过率相对较低。

基础技术能力方面,形象、驱动、内容供给、人设定制等相关能力普遍较为完备,形象装扮更换等相应功能支持全面。语音、交互等相关能力有待增强。

基础工程化能力方面,标准资源配置披露、可移植性、易用性、时效性等相关能力普遍较为完备。可扩展性、兼容性、可靠性等相关能力有待增强。

基础安全保障能力方面,显著标识等相关能力普遍较为完备。形象版权保障、内容回溯能力、内容风险控制等相关能力正在积极建设。

评测观察

观察1:精细化视频录制生成和CG生成分别是2D、3D数字人形象生成的主流方法,基于少量照片生成数字人仍处于探索阶段

部分企业已开始探索基于少量照片生成数字人,但尚未见到广泛使用。测试中发现%的参评企业支持CG生成3D数字人;75%的参评企业支持精细化视频录制生成2D数字人。37.5%的参评企业支持基于单张照片生成2D真人形象数字人;12.5%的参评企业支持基于单张照片生成3D卡通数字人。智能数字人形象生成可进一步加快数字人创建效率,降低数字人开发门槛。未来人工智能技术将深度融合到数字人形象生成环节,基于少量照片的形象生成将成为数字人创建的重要方式之一。

观察2:语音交互成为数字人主流的交互方式,视觉交互和多模态交互初见端倪

测试中发现%产品和应用使用了语音交互作为数字人交互方式,同时发现已经有部分参评系统开始支持视觉交互和多模态交互。视觉交互主要集中于人脸检测识别,对于手语识别、肢体(手指、头部、四肢等)动作识别、面部动作(表情、口唇动作)识别、视线追踪等其他视觉交互多数还停留在预研或者内测阶段;多模态交互则主要通过对输入的多维信息设置响应策略实现,如已有参评系统支持在和人交互的过程中同时采集视频和音频,并对嘴型和声波不匹配的情况进行提示。由于多模态交互可融合视觉、听觉、触觉等多方面信息,从整体上提高人机交互的自然度和精确度,多模态数字人已成为产业界争相探索的方向之一。

观察3:相比于基础技术能力及基础工程化能力,基础安全保障能力亟待加强

基础技术能力、基础工程化能力通过率分别为98.%、97.%;基础安全保障能力通过率为81.25%,相对较低,相应能力仍需完善。尽管有八分之五的参评企业对于基础安全保障能力的各测试项支持的比较全面,但目前还只解决了有无的问题,仍然存在较大的改进空间。例如“内容风险控制”测试项,尽管大部分的参评企业都具备相应的内容审核能力,但仍是复用语音的审核机制,并未开发针对数字人这类多模态交互系统的定制化的审核机制。

观察4:各家对于各测试项的完成度各异,整体均有较大提升空间

由于技术实力、入局时间早晚、业务方向各有侧重等原因,各家对于各测试项的支持程度各不相同,整体均有较大的优化空间。以“驱动范围”测试项为例,并不是每个参评企业都支持所有的驱动范围,目前还有部分企业未实现对背景、肢体、面部表情、手指的驱动;再如“情感化表达”测试项,所有参评系统的情感化表达主要采用触发策略或视频驱动实现,与完全智能合成的情感化表达尚有距离;再如“数字水印”测试项,尽管有75%的参评企业具备相应能力,但均未将其与数字人系统能力做打通。

观察5:数字人商业价值不断被挖掘和释放

根据对参评企业测试数据的不完全统计及调研发现,数字人应用范围不断拓宽,商业化进程不断加快,具体表现在以下三个方面。一是应用领域不断扩围,部分参评系统已实现在多个领域落地,涉及金融、商业、传媒、电信、娱乐、移动互联网、能源等领域。二是应用场景不断拓展,所有参评系统均已实现在多个场景的应用,涉及客服、助手、主播、员工、偶像、主持人、引导员、讲解员、记者等场景。三是接入渠道不断丰富,所有参评系统均已实现多渠道接入,涉及Web/H5、APP、大屏、小程序、VoLTE、VTM、VR、AR等。未来随着相关技术的不断成熟及“元宇宙”的持续探索,数字人应用定将进一步链接经济社会生活场景,在更多领域大放异彩。

下一步重点工作

中国信通院将依托内容科技产业推进方阵和CCSATC等平台,进一步聚焦数字内容生成相关产、学、研、用资源。开展产业研究、标准研制、评估测试等工作。

产业研究方面,将围绕数字人、沉浸式视觉内容等方向,持续探索数字内容生成相关政策、技术、应用及产业研究,编撰并发布相关产业报告。

标准研制方面,在现有基础上继续完善和研制数字人沉浸式视觉内容等相关标准规范,依托CCSA、ITU等标准组织平台,向上推行业标准和国际标准。

评估测试方面,将打造全国领先的数字内容生成检验检测能力,支撑相关前沿技术验证和评估评测,并启动第二轮数字人系统基础能力和性能分级评测。

业务联系

联系人:

颜媚

yanmei

caict.ac.cn

精彩回顾1“内容向善,科技赋能”内容科技优秀案例征集正式启动!2共话产业发展、重磅评测解读内容科技成果发布会隆重召开3国家网信办修订《移动互联网应用程序信息服务管理规定》发布施行长按

转载请注明地址:http://www.1xbbk.net/jwbls/617.html


  • 上一篇文章:
  • 下一篇文章:
  • 网站简介 广告合作 发布优势 服务条款 隐私保护 网站地图 版权声明
    冀ICP备19027023号-7