打印本文 打印本文  关闭窗口 关闭窗口  
虹软科技2022年年度董事会经营评述
作者:佚名  文章来源:本站原创  点击数  更新时间:2023/7/9 14:21:49  文章录入:admin  责任编辑:admin

  2022年,面对复杂多变的外部环境,公司用驰而不息的奋进与实干,践行着让人们生活更加美好的初心,以技术赋能客户取得更佳的市场表现。公司除继续推进计算机视觉人工智能技术在移动智能终端业务上高质量、可持续商业化落地,2018年开始铺垫的智能汽车前装业务也逐步贡献计件收入。与此同时,公司坚持以创新驱动企业发展,立足长远,持续高水平研发投入,在视觉人工智能领域进行前瞻性的技术培育和业务布局。

  2022年,全球经济下行影响持续,消费电子市场整体需求不景气,据Counterpoint统计,2022年全球智能手机出货量约为12.3亿部,创下自2013以来的最差年度业绩。在市场结构上,搭载安卓系统的智能手机市场份额也被进一步挤压。受市场环境变化、原有客户手机出货量下滑等因素影响,公司移动智能终端视觉解决方案2022年度实现营业收入47,330.45万元,同比下降11.49%。

  2022年,中国汽车产销整体小幅增长,据中汽协统计,2022年中国汽车产销分别完成了2,702.1万辆和2,686.4万辆,同比增长3.4%和2.1%。在这一领域,随着前期定点项目落地所形成的良好口碑和示范效应,公司后续新增定点数量和量产收入都将迎来新的发展和增长。公司智能驾驶视觉解决方案2022年度实现营业收入4,441.81万元,同比增长121.16%。

  报告期内,公司实现营业收入53,164.85万元,同比下降7.22%;实现归属于上市公司股东的净利润5,779.73万元,同比下降58.95%。公司重点开展并推进了如下工作:

  移动智能终端相关视觉解决方案上,公司技术拥有领先同行的智能手机应用规模,也为拓展至更多应用领域提供了前提。报告期内,面对不利的行业环境,公司牢牢把握市场变化趋势和客户需求演变,持续输出技术能力,为各类终端提供更强劲的性能、出色的影像和更智能的显示技术。

  公司继续推出创新技术和多品类算法产品,并在OEM客户智能手机、平板电脑、笔记本电脑智能终端上持续出货。其中,2022年公司所研发适用于智能手机的单摄电影模式解决方案、星空拍摄解决方案、针对眼镜镜片透视畸变的矫正解决方案、智能超域融合解决方案,以及前期所推出适用于笔记本电脑的智能暗光增强解决方案、视频HDR解决方案、智能人像居中解决方案、智能人像虚化方案、智能人像视线矫正方案均在新项目上实现了量产落地并持续出货。

  除了前述方案,针对智能手机应用终端,公司还在报告期内研发了智能视频超分解决方案、智能天际线矫正解决方案、智能九合一拜耳拍照超分解决方案、智能3D手势解决方案等;针对笔记本电脑应用终端,公司也新推出了智能人像细节恢复方案、智能眼镜去反光方案、视频超分解决方案、人像聚光灯方案等,进一步丰富了视频会议整体解决方案。

  智能可穿戴设备相关方案是公司前瞻性技术培育方向。公司持续推进与行业伙伴的业务交流、技术深度合作关系,VR/MR/AR创新产品目前已成功打入了行业头部厂商。报告期内,公司积极应对传统手机客户和新兴眼镜厂商在VR/MR/AR领域的需求,全面布局相关视觉产品,努力发挥和延续公司在移动终端计算机视觉领域的算法优势,为客户提供一站式、全方位的产品矩阵。

  ①报告期内,公司丰富了智能VR/MR/AR头显低延时渲染解决方案、智能VR/MR/AR头显视频透视解决方案。针对头显端低延时、高刷新率的渲染需求,当前硬件瓶颈限制了用户体验,公司在异步事件扭曲等插帧产品方案的基础上,开发了位置空间扭曲方案,提升了用户在不同运动方式下的低延时虚拟现实或者虚实融合体验,弥补了因时延引起的眩晕感缺陷。在虚拟现实或者混合现实眼镜的使用场景下,为实现用户佩戴使用过程中区域安全、便于寻找手柄配件、扩展MR体验等目的,用户需要透过封闭的头显设备“看穿”到外部世界。公司实现了基于鱼眼相机的黑白透视,以及基于双RGB相机、单RGB+双鱼眼相机融合方案的全彩透视,为前述MR场景需求提供了基础技术支撑,同时也为客户在硬件形态设计上提供了更大的灵活性。

  ②报告期内,公司重点实现了OpenXR软件框架,将头显SLAM、手柄SLAM、视频透视和渲染插帧算法嵌入到OpenXR软件框架,为客户提供了易用和标准的接口信息,便于客户快速实现产品落地。

  ③虚拟数字人是VR/MR/AR用户虚拟身份的重要表征方式,报告期内,公司实现了可用于VR/MR/AR头显的虚拟数字人的视觉面部捕捉技术,可借助眼镜内置摄像头获取人脸局部图像来实时驱动虚拟数字人的微表情。

  公司继续加大对智能汽车业务的投入力度,战略蓄力打造公司新的增长点。在这一领域,公司为汽车OEM客户提供VisDrive一站式车载视觉软件解决方案及舱内Tahoe和舱外Westake软硬一体车载视觉解决方案。基于乘用车解决方案,公司也为大型商用车提供有针对性的软件和软硬一体车载视觉解决方案。

  ①虹软人脸识别技术获得了国家金融科技测评中心(银行卡检测中心,BCTC)支付级别的测试认证,为车端人脸支付场景的应用提供了强有力的支撑。在汽车无钥匙进入的产品上,公司与硬件合作伙伴共同开发了基于虹软TOF技术的车门解锁方案,该技术加强了此场景下人脸解锁车门的安全性。当期,虹软人脸识别技术也获得了谷歌对3D人脸识别防伪安全的最高级别安全认证。

  ②在驾驶员监测相关产品上,公司获得了功能安全开发体系ASIL-D级别(功能安全最高等级)的能力认证。在产品技术研发上,公司对视线关注区域进行了大量的优化和提升,目前已经支持可实现量产的14个区域的高精度检测,同时还针对海外不同人种进行了深度优化,为ADAS系统提供更加全面且强有力的驾驶员侧感知能力。

  ③在乘客监测相关产品上,公司完成了基于OMS摄像头的儿童检测、儿童座椅检测、儿童座椅安全带检测方案;在OMS遮挡场景中,公司完成了多摄像头的感知结果融合的产品方案,大幅度提升了乘员位置的识别精度;在儿童检测产品中,公司基于图像可见区域结合视频预测的结果,完成了儿童检测的基础模块,为CPD产品合规打下了坚实的基础。

  ④针对多模态交互场景,公司完成了基于TOF的3D隔空手势技术的产品化并已经实现量产出货。公司不断提升、优化TOF算法精度,实现更好效果的同时,也持续开发和优化能为车企降低硬件成本的OMS鼠标手势方案,并进一步拓宽产品功能,完成了智能阅读灯、游戏手势、激光手势等的产品化工作。

  ⑤在360°环视相关产品中,公司持续深挖产品技术,完成了基于AVM环视摄像头的哨兵模式监控、售后免工位标定等模块的产品化。完成了基于AVM后摄的智能尾门产品的产品化工作,为车企降低硬件成本提供了完美的软件替代方案,目前正在持续推广中。

  ⑥针对车内的视频通话场景,完成了视频人像居中、画质提升、人像美化、视线纠正等一套完整成熟的系列产品。

  ⑦基于DMS及OMS摄像头,完成了驾驶员健康监测的产品化,在缓解驾驶疲劳方向上,完成了驾驶员冥想模式的产品开发,目前正在持续优化体验和效果。

  ⑧公司高级驾驶辅助系统(ADAS)的技术开发侧重于落地应用,基于虹软自研感知算法,已经实现自动紧急制动(AEB)、车道居中控制(LCC)、自适应巡航(ACC)等L0至L2功能,视觉感知算法引擎结合实际功能需求持续迭代优化,目前包含了前视、周视、夜视解决方案的视觉感知算法引擎为量产做好了准备,其中周视解决方案已实现了落地。

  报告期内,通过送检虹软软硬件一体的Tahoe解决方案,公司DMS通过了欧盟相关法规的认证测试(DDAW),并且还满分通过了E-NCAP授权机构对驾驶员状态监测报警部分的全部测试(包括疲劳和分心的全部内容),这将帮助国内外车企客户更快地获得法规的准入资质。

  报告期内,公司向大型商用车客户提供符合国家标准的域控制器产品及解决方案。目前针对商用车市场研发的软硬一体解决方案AITrak已完成即将实施的《商用车辆车道保持辅助系统性能要求及试验方法(GB/T41796-2022)》要求的整车功能调试。

  报告期内,公司VisDrive一站式车载视觉软件解决方案助力更多汽车智能科技创新落地。公司前期定点项目落地形成了良好的口碑和示范效应,算法产品的鲁棒性、平台方案上的优化能力和工程落地能力获得客户的广泛认可,公司客户数量、合作深度继续拓展,新增定点数量迎来较快增长,并且还在长城、吉利、东风日产等车厂的项目上取得了多个平台型定点。2022年1月至今,公司新增了与长安、奇瑞、长城(含海外车型)、岚图、理想、吉利(含沃尔沃全球车型定点项目)、长安马自达、本田、长安新能源、赛力斯601127)、金龙旅行车等车厂的前装量产定点项目。目前,正处于市场推广期的舱内Tahoe软硬一体车载视觉解决方案也获得了海外车厂的全球定点项目。

  截至目前,分别搭载了公司DMS、OMS、FaceID、TOF手势(属业内首发)、舱外体态拍照、AVM等舱内外算法的量产出货车型累计已有数十款,主要知名车型如理想L9,长城哈佛系列、欧拉系列、坦克系列,合众哪吒系列,长安CS75PLUS,吉利豪越L、领克06等。

  为建立长效的核心人才培养机制,公司制定了一系列人才培养规划措施,聚焦后备人才库建设,有效扩充人才“蓄水池”。报告期内,公司根据战略发展规划和业务拓展需求,持续引进移动智能终端、智能驾驶行业内的研发、销售、产品等领域的资深人才,助力公司整体的研发实力和项目落地能力。同时,公司从重点院校选拔素质优异的应届毕业生,为后续的人才梯队建设做好充分的准备。

  公司秉承“坚持创新,追求卓越”的发展理念,通过组织学习培训、技术竞赛、质量文化创建、体验式团建等多种多样的活动,助推企业文化落地。公司着力打造学习型组织和技术创新文化氛围,持续开展了项目管理训练营、新员工培训集训、学习与发展嘉年华、信息安全培训月、技术主题分享、内部讲师分享、前沿技术研讨等一系列学习和交流活动。公司还开展了“1024程序员节系列学习与比赛活动”、“工程质量奖及超级圣斗士”、“虹软力量奖”、“专利启航”等评选活动,持续激发员工创新创造活力。

  公司建立了较为完善的公司内控制度和公司治理结构,报告期内,公司根据监管部门最新修订并实施的法律法规对内部控制制度进行了梳理及修订,并严格按照内控管理制度将规范运作的要求贯穿于日常经营,切实防范管理风险,进一步提高了公司治理能力和经营水平,为企业持续健康发展提供了坚实基础。

  公司专注于计算机视觉领域,为行业提供算法授权及系统解决方案,是全球领先的视觉人工智能企业,始终致力于视觉人工智能技术的研发和应用,坚持以技术创新为核心驱动力,在全球范围内为智能设备提供一站式视觉人工智能解决方案。

  公司拥有丰富的针对智能手机等移动智能终端以及智能驾驶的视觉算法产品线,主营业务收入来源于自主研发核心技术的授权许可使用。目前主要客户包括三星、小米、OPPO、vivo、荣耀、Moto等全球知名手机厂商以及国内主要的自主品牌、部分合资品牌汽车主机厂商。

  针对智能手机,基于多年的研究开发,公司可以提供目前市面上大部分主流智能手机视觉人工智能算法产品,包括单/双/多摄摄像头在各种场景下的拍摄和高质量成像、深度摄像头在各种场景下的拍摄和高质量成像、潜望式长焦摄像头无级变焦、3D建模、全景、SLAM、AR/VR、人脸解锁、超像素无损变焦、人体驱动等重要核心功能。

  针对其他移动智能终端设备,公司也提供了相应的解决方案。①在笔记本电脑上,公司从画质、隐私、美颜等几个方面来提升用户视频会议体验。通过视频去噪、提升动态范围来改善会议时的画质;通过背景虚化、换背景对实现用户隐私进行保护;通过人像美颜、人体自动居中、人脸细节恢复和增强、眼镜去反光等技术提升视频会议效果。②在VR/MR/AR智能可穿戴设备上,公司从标定、感知、交互和视觉呈现四大方向布局算法解决方案。可以提供VR/MR/AR一站式多传感器标定解决方案、头显6DoF跟踪、平面检测、稠密重建、语义分析、深度估计、实时3DMesh重建等空间感知解决方案,手柄6DoF跟踪、裸手3D手势交互、视线跟踪和虚拟数字人表情驱动、人体驱动等交互解决方案,以及异步时间扭曲、视频透视(VST)等视觉呈现解决方案。

  在智能驾驶领域,公司可以提供聚焦舱内服务的驾驶员监控系统、视觉互动系统、乘客监控系统、生物认证、舱内智能悦动解决方案、驾驶员健康监测系统、舱内自拍,与聚焦舱外行驶智能安全的高级驾驶辅助系统、盲区检测系统、AR抬头显示、360°环视视觉子系统共计十一类解决方案。

  公司主要盈利模式是将计算机视觉算法技术与客户特定设备深度整合,通过合约的方式授权给客户,允许客户将相关算法软件或软件包装载在约定型号的智能设备上使用,以此收取技术和软件使用授权费用。同时,公司也向客户销售软硬一体视觉解决方案。

  公司主要采取自主研发的模式。研发过程大致分为以下9个步骤:①获取需求信息;②管理层决策研发方向;③搭建研发项目组;④验证研发项目算法,进行项目测试;⑤集体讨论决策项目算法;⑥进行底层算法与实际环境的结合优化;⑦进行实际产品结合测试;⑧产品成熟后路演,选择合适的客户进行测试合作;⑨测试合格后大规模推广。

  公司采用直销的方式,主要向智能手机、智能汽车、笔记本电脑、智能家居、智能零售以及各类带摄像头的AIoT设备制造商销售计算机视觉算法软件及相关解决方案。

  按照业务合同的不同类型划分,公司的计算机视觉算法软件主要收费模式可划分为固定费用模式和计件模式两种模式。①固定费用模式:按合同约定的软件授权期限,收取固定金额的软件授权费用。特定客户在软件授权期限内,针对某款、某系列的特定设备内,可以合法地把含有虹软科技算法技术的特定软件无限量装载在合约限定的智能设备上。②计件模式:在合同约定的软件授权期内,按照客户生产的装载有虹软科技算法技术智能设备的数量进行收费。通常情况下,公司会与客户就不同生产数量区间,约定阶梯价格,保障双方利益。

  针对公司的日常研发和运营,公司的主要采购内容包括网络基础设施(如带宽、服务器等)、研发设备,以及支付给境外销售咨询服务商的服务费。

  针对软硬一体解决方案,由公司进行硬件的设计并购买相应部分核心部件后,委托第三方进行组装生产。

  根据《国民经济行业分类》(GB/T4754-2017),公司所属行业为“I65软件和信息技术服务业”中的“I6513应用软件开发”。根据中国证监会颁布的《上市公司行业分类指引》(2012年修订),公司所属行业为“信息传输、软件和信息技术服务业-软件和信息技术服务业”,行业代码为“I65”。

  公司从事计算机视觉技术算法的研发和应用,主要产品有移动智能终端视觉解决方案、智能驾驶视觉解决方案和其他AIoT智能设备视觉解决方案,根据公司主要产品功能及服务对象的特点,公司所属行业为计算机视觉行业,属于软件和信息技术服务业。

  根据国家发改委公布的《战略性新兴产业重点产品和服务指导目录2016版》,公司属于“新一代信息技术产业”。

  在新科技革命和产业变革的大背景下,人工智能加快向各产业渗透,日益成为科技创新、产业升级和生产力提升的重要驱动力量。视觉人工智能行业为各类人工智能应用提供基础支持技术,广泛应用于各类人工智能细分领域。政府积极出台政策促进人工智能技术发展和应用,深化落实与视觉人工智能息息相关的人工智能、智能制造、信息化和工业化的相关政策,为视觉人工智能的发展提供了政策与配套资源支持。2022年以来,新出台的人工智能主要产业政策如下:

  2022年1月,根据国内数字经济和智慧城市的建设现状,国家层面对“十四五”期间的数字经济和智慧城市发展进行了专项规划,国务院印发《“十四五”数字经济发展规划》,提出实施产业链强链补链行动,加强面向多元化应用场景的技术融合和产品创新,提升产业链关键环节竞争力,完善5G、集成电路、新能源汽车、人工智能、工业互联网等重点产业供应链体系。深化新一代信息技术集成创新和融合应用,加快平台化、定制化、轻量化服务模式创新,打造新兴数字产业新优势。协同推进信息技术软硬件产品产业化、规模化应用,加快集成适配和迭代优化,推动软件产业做大做强,提升关键软硬件技术创新和供给能力。

  2022年7月,科技部等六部门印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,围绕高端高效智能经济培育打造重大场景,鼓励在制造、农业、物流、金融、商务、家居等重点行业深入挖掘人工智能技术应用场景,促进智能经济高端高效发展;围绕安全便捷智能社会建设打造重大场景,以更智能的城市、更贴心的社会为导向,在城市管理、交通治理、生态环保、医疗健康、教育、养老等领域持续挖掘人工智能应用场景机会,开展智能社会场景应用示范。

  2022年8月,科技部印发《关于支持建设新一代人工智能示范应用场景的通知》,强调坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,充分发挥人工智能赋能经济社会发展的作用,围绕构建全链条、全过程的人工智能行业应用生态,支持一批基础较好的人工智能应用场景,加强研发上下游配合与新技术集成,打造形成一批可复制、可推广的标杆型示范应用场景。首批支持建设十个示范应用场景。

  2022年12月,国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》,提出加快构建数据基础制度,充分发挥我国海量数据603138)规模和丰富应用场景优势,激活数据要素潜能,做强做优做大数字经济,增强经济发展新动能,构筑国家竞争新优势。

  2023年2月,国务院印发了《数字中国建设整体布局规划》,明确数字中国建设按照“2522”的整体框架进行布局,推进数字技术与经济、政治、文化、社会、生态文明建设“五位一体”;推动数字技术和实体经济深度融合,在农业、工业、金融、教育、医疗、交通、能源等重点领域,加快数字技术创新应用;提升数字文化服务能力,打造若干综合性数字文化展示平台,加快发展新型文化企业、文化业态、文化消费模式。

  根据Counterpoint的最新研究,全球智能手机市场在2022年第四季度仍然面临压力,尽管出货量环比增长1%(达3.039亿台),但年同比下降18%。2022年全球智能手机出货量下降至12.3亿台,同比下降12%,创下自2013年以来最差年度业绩。从机型看,主要OEM厂商增加了高端手机产品组合,售价在600美元以上的高端手机销量增长1%,推动整体平均单价(ASP)小幅上涨。从手机搭载的操作系统来看,搭载安卓系统的智能手机市场份额进一步受到挤压。影像拍摄能力在近几年实现了巨大飞跃,一直是智能手机核心卖点,当前,各主流手机厂商为抢占市场特别是高端市场,通过创新影像技术为用户带去更专业化的影像体验。

  随着AR/VR及5G技术的发展,越来越多国内外科技巨头战略卡位被称为“下一代计算平台”的XR头戴设备。XR是新一代信息技术融合创新的典型领域,集成了众多前沿技术。根据德勤中国发布的报告观点,XR相较于当前计算环境的提升主要体现在维度和感知上有极大提升,要求XR设备必须具备空间扫描建模、空间定位追踪、全身动捕、眼动追踪、手部追踪、面部追踪等前沿技术集成能力,这主要体现在感知交互技术能力。感知交互重点在于与近眼显示、渲染计算、内容制作、网络传输等关键领域的技术协同,高度集成光学显示、传感、图像识别和算法等高精尖技术能力,这些都是各领先厂商布局的关键点。行业认为,当前XR终端设备产品成本和售价尚需进一步降低,用户体验仍不完善,随着产业链和技术的不断发展,生态参与者加速入局,内容应用逐步繁荣,XR终端设备出货量将获得提升。IDC预测,随着宏观经济预期的修复,2023年全球VR/AR设备出货量有望同比增长31.5%,2026年出货量将达到3,510万台。

  近年来,全球汽车市场运行总体稳定,根据国际汽车制造商协会(OICA)统计数据显示,2021年,全球汽车行业结束了自2018年以来连续三年的下降局面,产销量分别为8,016万辆、8,268

  万辆,同比增长3.26%、6.05%,全球汽车行业呈现出复苏态势;2022年,全球汽车产量为8,502万辆,同比增长6%。2009年,中国首次成为全球汽车产销量第一大国,此后近十年均保持快速增长态势。根据中汽协统计数据,2022年中国汽车产销分别完成了2,702.1万辆和2,686.4万辆,同比增长3.4%和2.1%,其中乘用车在稳增长、促销费等政策拉动下,实现较快增长,为全年小幅增长贡献重要力量。

  电动化作为汽车业变革的上半场,我国已处于世界较为领先的水平,作为下半场的网联化、智能化和数字化成为这场变革决胜的关键。国内车企抓住电动化、智能化、网联化的转型机遇全面向上,产品竞争力不断提升,中国汽车品牌在国际市场上获得更多认可。同时,国内车企实施“全球化”战略,加速海外拓展,造车新势力与传统头部车企纷纷在欧洲布局,整车出口特别是新能源汽车出口数据表现亮眼。据中汽协统计,2022年,我国汽车出口突破300万辆,达到311.1万辆,同比增长54.4%,有效拉动行业整体增长。

  视觉人工智能属于高知识密集型领域,有较高的技术门槛,公司为各类移动智能终端、智能汽车等智能设备提供视觉人工智能解决方案,在前述领域的主要技术门槛包括:

  边缘计算极大程度上解决了物联网背景下集中式运算架构中的带宽和延迟两大瓶颈问题,主要难点在于低资源的嵌入式平台环境的开发能力,基于移动终端的边缘计算具有巨大的应用价值,但是受限于移动终端有限算力,诸多企业望而却步。

  公司自2003年开始便明确了在嵌入式设备研发相关视觉人工智能技术的发展方向,在边缘计算技术领域积累深厚,多年来建立了全面、复杂的多平台适用的底层嵌入式开发库。公司积累的算法具有高度的紧凑性、稳定性以及易调用性,可以在高性能、有效大幅降低资源消耗的情况下实现高精度运行。

  公司长期专注于嵌入式设备算法的研究与开发,多年来积累了大量基于端设备的视觉人工智能算法开发经验。目前公司基于端设备的视觉人工智能算法适用性高、运行稳定,可以在边缘侧发起高效的运算,通过诸如智能手机、笔记本电脑、智能可穿戴等设备实现高效的图像优化、识别与检测等功能。公司的移动智能终端视觉解决方案、智能驾驶视觉解决方案和其他AIoT智能设备视觉解决方案等业务均是从边缘侧发起运算,在智能手机、笔记本电脑、智能可穿戴设备、汽车和各类AIoT设备上实现各类视觉人工智能的功能。

  在数码相机以及手机功能机时代,公司就开始专注于视觉人工智能技术的研发与应用,公司主要算法技术都经过了长时间的锤炼,从基本的黑白小分辨率图像的摄取、增强、编辑、检测识别到高清大图像、视频的实时处理均打下了坚实的基础,创造了有利和领先的条件。

  公司掌握的视觉人工智能算法技术具有通用性和延展性。多年来,公司积极致力于将视觉人工智能算法与行业应用相结合,凭借先进的科研力量、强大的产品开发能力以及卓越的工程实施能力,公司快速将视觉人工智能算法技术落地为成熟的解决方案,并进一步将应用领域从智能手机扩展到智能汽车、智能家居、智能零售等多个行业,助推行业升级。此外,公司基于自身深厚的技术积累,能够为上述行业快速提供高性能、高效率、硬件平台适应性强,功耗控制优良的解决方案,大大降低各类客户的产品使用先进技术的门槛,帮客户提升产品竞争力,助力视觉人工智能和人工智能相关应用的普及。

  虹软创立至今,除不断积累和发展自身技术、掌握持续开发、迭代与硬件更加匹配的算法的能力,还一直致力于与核心产业链内主流公司开展长期、广泛的合作。公司与高通、联发科等各主流芯片公司建立了长期稳定的合作关系,研发中持续合作交流,深入了解平台硬件特性以及为其针对性优化,共同开发核心功能,不断提高视觉人工智能技术算法产品与移动芯片的适配性。公司还与索尼传感器、三星半导体、格科微、OmniVision、舜宇光学、信利等业内核心器件合作伙伴建立了业务交流或合作关系,在项目早期就针对特定相机或硬件做算法适配和调优。针对智能终端的芯片平台,公司具备针对CPU、GPU、DSP和NPU等各个算力单元的强大优化能力。结合各硬件算力单元的能力和算法模块的算力需求,公司具备的异构计算优化能力能够从系统层面更有效地优化性能和功耗。得益于此,除核心技术能力突出外,公司同时具备优势明显的工程落地能力,在客户提出技术需求后,能更好地联合和发挥在相机模组、软硬件平台、产线、算法等多方资源合作优势,进而提供效果好、低能耗、高效率、硬件平台适应性广并能够快速落地的解决方案。

  目前,视觉人工智能市场格局已经初步形成,核心技术、产品化能力、产业生态链合作均成为行业的核心壁垒,建立在自主创新能力基础之上的产品化能力成为最终创造社会价值和商业价值的核心,而能否寻找到规模化、商业化的应用场景则决定了企业是否能够长远发展。

  公司是计算机视觉行业领先的算法服务提供商及解决方案供应商,是全球领先的计算机视觉人工智能企业。除本公司外,行业中国内企业主要有商汤科技、旷视科技,国外企业主要有SeeingMachines、Mobieye、Cipia、Smarteye。

  全年出货量达十几亿台的智能手机市场是视觉人工智能技术的重要应用领域。基于多年的研发和积累,目前公司可以提供大部分主流智能手机的视觉人工智能算法产品和技术。根据IDC所统计的2019年度至2022年度全球出货量前五的手机品牌中,除苹果公司完全采用自研视觉人工智能算法外,其余安卓系统手机的主流机型均有搭载公司视觉人工智能解决方案。在继续巩固公司在智能手机算法影像行业领导地位的同时,公司依靠对行业演进规律和技术更迭的理解,成熟有效的产品落地能力,正横向大力推进在智能驾驶领域的落地。

  3.报告期内新技术、新产业300832)、新业态、新模式的发展情况和未来发展趋势

  随着深度学习技术的快速突破和数字内容需求的日益增长,生成式人工智能(AIGC)逐步兴起。一方面,基于深度学习算法的AIGC技术打破了原先模板化、公式化、小范围的局限,可以快速、灵活地生成不同模态的数据内容,可用性不断增强。另一方面,数字经济与实体经济融合程度的不断加深,以及Meta、微软、字节跳动等平台型巨头的数字化场景向元宇宙转型,对数字内容的需求大幅提升。

  AIGC已率先在传媒、电商、文娱等数字化程度高、内容需求繁多的领域得以应用。在当前数字世界和物理世界加速融合的大背景下,AIGC应用场景将进一步多元化,并且随着AIGC生成内容种类的不断丰富、质量的不断提升,其有望成为新型的内容生产基础设施,重塑数字内容的生产方式和消费模式。特别是多模态大模型方面的发展,让AIGC进行跨模态融合性创新成为可能,这些都给AIGC带来良好的产业发展空间。

  目前,公司积累了大量视觉人工智能的底层算法,构建了完整的视觉人工智能技术体系。

  公司自主研发了诸如人脸分析及识别/人脸美化及修复/人体分析及美化、手势识别/物体识别/场景识别、行为分析、暗光图像增强/超分辨率图像增强/视频画质增强/画质修复、光学变焦、虚化技术、3DAR动画等诸多可应用于智能手机、智能座舱、智能辅助驾驶、笔记本电脑、智能可穿戴设备等终端领域的核心技术。

  针对单摄/多摄/TOF/结构光等不同种类的摄像头,公司均可提供相应的3D与AR视觉解决方案,帮助厂商在移动设备上便捷高效地实现落地。为满足各智能终端对于VR/MR/AR应用的需求,公司已经研发并可以直接落地使用的解决方案,包括基于双摄/多摄/TOF/结构光的深度获取和优化,以及基于单摄的深度获取引擎,这些深度数据成为一些上层逻辑应用的核心基础;实现了SLAM中环境Map的构建,物体的3DModeing,视线的检测、跟踪,人体和动作静态、动态姿态的检测和跟踪,解决了实时显示中的延迟等多种场景。为满足智能驾驶人机交互的需求,公司主要研发了基于红外相机、单摄RGB摄像头、双摄、深摄的交互技术,包括手势交互引擎包、头部动作和口部动作交互引擎、经典表情识别,以及视频、照片拍摄时的娱乐功能。

  公司在人体分析、人脸识别、人体识别、手势识别、人体美化等技术上,在当前状态下的中段平台达到超过95%的正确率、毫秒级实时性,这些引擎也可以有效鲁棒地支持低端硬件平台,人物属性分析、对象属性分析、多帧多通道质量提升等技术点能达到业界先进的低功耗、高性能、相对强鲁棒的水平。

  公司大部分智能手机视觉解决方案均达到国内外先进水平,多数新创技术在首发周期属于国内外领先水平,能够满足目前市面上中高端智能手机大多数与视觉相关的技术与应用的算法需求,且公司的智能手机视觉解决方案在除苹果之外的主流手机品牌的大部分旗舰机型上获得使用。

  人脸检测算法针对人脸大姿态和暗光做了进一步优化,在内部通用测试集上保持精度不变的情况下,召回率提升1.7%,在分姿态子测试集上,召回率提升8%。另外,人脸检测算法还应用在车载舱外摄像头人脸脱敏相关应用上,可以支持检测团标规定的小人脸,内部测试数据集上召回率达到95%,同时在主流车机平台,达到4路摄像头30fps的帧率。手机高清自拍场景中,眼睛部分的关键点稳定性有较大的改善。在智能座舱场景中,人脸关键点在转向柱位置以及中央后视镜位置中点位的准确度有进一步的提升,人脸角度估计输出精度在人脸存在遮挡时提升3度。另外人脸关键点定位还扩充支持到XR眼镜等可穿戴设备上,支持在虚拟世界进行更加生动的交互。人脸重建技术在表情自然度及流畅度上进一步优化,尤其是在眉毛稳定性,鼓嘴稳定性,以及大角度精度方面都有明显改善,在测试集上平均稳定性提升10%,实现更加自然稳定的表情驱动。同时,人脸重建技术也从PC和手机端扩充支持到XR眼镜,利用存在严重自遮挡的局部图像也可实现对佩戴人员进行表情重建与跟踪。2DFaceID在FAR≤100k的情况下,常规场景和戴口罩场景下,FRR改善5%,对美颜、带妆容等场景下的识别也有3%的改善;特别根据用户反馈,针对一些容易误识的人员(例如兄弟姐妹,或是长相明显相似的人)也有更好的分辨能力。车载场景的RGB/IR交叉识别持续改善,尤其对各种困难case进行优化,FRR改善6%,无需用户配合,达到无感识别的效果;进一步优化了车载版本对外籍人员的识别效果,在黑、白、棕等各色人种测试集上效果都有大幅度提升;3DFaceID已经完成了对车规摄像头的适配,已在一些车型上完成部署,满足对人脸识别安全性要求更高的场景;服务器版本通过了BCTC的辨识算法认证;同时进一步深化对抗样本攻击问题的研究,在CSIGFAT-AI2022开放场景人脸对抗伪装挑战赛中取得冠军,为提升人脸识别模型的抗攻击能力打下坚实基础。

  进一步提升了人体检测方案,提升车内场景人体检测率,尤其是存在大范围遮挡情况下的人体召回率。同时也降低了人手臂、座椅等目标的误检,在难例数据集上,整体mAP提升1%,达到94%。人体骨骼关键技术,增加脚尖脚后跟两点输出,点位稳定性和平滑性有较大提升,同时在智能座舱场景中,也作为基础引擎为后续舱内行为分析提供进技术支持。BodyCone从手机平台拓展至智能座舱业务,实现对车内人员的3D姿态的重建,并且大幅度优化了人体在前倾及后躺动作下对身体倾斜度的预测。行为识别技术除了支持的动作类型增加之外,也提升了动作识别的准确率。

  宠物身体检测技术采用新的方案,在保持参数量和计算量不变的情况下,mAP提升约1.5%,有力地支持了Bokeh等产品的宠物场景效果提升;针对客户需求,专门开发了宠物眼睛检测跟踪技术,可以实时准确定位跟踪宠物眼睛区域,为宠物产品应用提供了强力支持。

  2022年,应用于智能座舱的行为分析技术在提升原有技术效果的同时完成了更多智能座舱相关解决方案的研发,为众多新项目上线提供了有效技术支持并拓展了技术在舱内环境中的应用。驾驶员疲劳/分心检测技术继续全面部署在车载DMS产品线中,为众多量产项目提供支持。重点完成了满足DDAW以及EuroNCAP法规的驾驶员疲劳/分心检测技术方案的研发。根据大量疲劳研究实验进行了真实疲劳数据采集和真实疲劳检测技术更新,提升了基于真实疲劳反应的驾驶员疲劳分级检测,形成了与市场同类产品技术的差分化,经过海外实车测试达到DDAW认证要求。持续进行眼睛、嘴巴等面部活动重要区域的失效状态检测研发,将眼睛由于外界影响分为多种不同的失效等级,支持各种复杂环境下的失效判断,为眼睛行为分析提供更好的保障。

  视线年已经完成了众多智能座舱量产项目的支持,结合座舱标定方案为驾驶员分心技术提供视线落点输出支持,完成了EuroNCAP法规中需要支持的视线年继续对多摄像头视线追踪技术进行研究并应用于量产项目中,全面提升了驾驶员对舱内各区域注视点的视线精度,尤其是在人脸大角度条件下精度提升20%,全面支持了基于舱内多种摄像头装配位置的全角度人脸视线检测。目前该方案已经大规模用于量产项目中,适配各种车型的活动摄像头安装需求。人脸姿态以及视线真值系统研发也在持续进行中。基于XR头显中的眼动追踪技术完成了双眼双目多光源方案的研发,并配合头显的需要完成了与眼动相关的外围视觉算法研发,完成了设备端部署,精度效果已经达到业内领先水准。人脸面部动作分析技术成功用于车载DMS中驾驶员表情识别解决方案,该技术通过虹软自研深度学习解决方案,克服了复杂人脸角度、复杂光照条件下的技术瓶颈,2022年继续研发了点摇头识别、唇语识别、说话人检测等技术,并在众多量产项目中上线年还完成了其他众多车内人员行为分析技术的研究与上线部署,包括公交车乘客上下车检测与客流量统计技术、驾驶员安全带与离位状态检测技术、乘员分析与乘客占位检测、乘员行为检测技术。其中公交车乘客上下车检测与客流统计技术目前已经完成了整体软硬一体方案的测试,上线部署并验收通过。乘员占位与行为检测技术结合目标检测与人体行为分析技术对乘客的异常状态等行为进行分析,给出正常或异常状态的判断。目前该技术正在基于量产项目做各种车型下的适配调优,提升复杂场景下儿童与成人的区分性,为视觉儿童看护相关技术提供更多可行性方案。

  车载危险行为在不提升算力的情况下改善了效果。在抽烟打电话检测上,持续优化检测率和误识率,重点针对相似物体误报的问题进行优化,误报概率显著降低,3,000公里路测错误报警事件次数优化到小于等于两次;获得更精准贴合的检测结果,提升了识别准确率;更新了DMS和OMS镜头融合的方案,当DMS镜头因安装位置或驾驶员坐姿导致目标物体被遮挡时,使用OMS镜头的检测结果进行修正补偿,提升整体检测效果;针对不同算力的硬件设备,研发不同大小的算法模型,在性能指标和算力负载方面达到良好平衡,扩展了算法落地的适用性。此外,针对鱼眼/广角摄像头,研发了新的基于单颗摄像头的支持抽烟、打电话、玩手机、方向盘脱手等检测的多功能解决方案,该方案可进一步降低客户的部署成本。

  手势相关底层算法模块持续改进优化。其中核心技术手部姿态估计在手机、VR/MR/AR和车载等不同业务方向上持续优化。该算法采用多种算力模型方案,适用于不同业务场景,在算法效果和性能方面做到了很好的平衡;在3D姿态估计的基础上,增加了对手部形状参数和手部3DMesh的估计;继续优化车载场景下的手部姿态估计,新增对多个目标平台及硬件加速设备的支持。手势交互技术在车载智能座舱应用中全面铺开,更多项目量产落地。基于OMSRGB/IR镜头的车载手势识别技术实现了对多种常见手势和客户定制手势的支持,满足了客户的差异化需求;持续提升手势检测、跟踪、姿态估计和动作识别等基础算法效果;静/动态手势识别,针对用户实际使用遇到的问题做有效改进,扩展了静态手势支持的角度,优化了手持物体时手势误检的问题,改善了动态手势相似动作误检的问题,使算法具有更好的鲁棒性和适应性。积极布局基于TOF摄像头的智能座舱手势交互解决方案。报告期内,完成了基于TOF镜头的手指指向车机控制和车内娱乐系统鼠标控制整套解决方案的研发,并且顺利量产落地。该技术经过持续优化,目前支持更大的操作视角和距离,通过对手持物体的场景分析,降低误检,提升了算法鲁棒性。此外,该方案还顺利迁移至车规级RGB/IR镜头,效果与TOF镜头保持一致,可大幅降低客户的硬件成本。基于ToF镜头的自顶向下视角的动态手势识别方案,公司从用户体验出发,结合实际操作场景,不断迭代优化使动作识别更加符合用户习惯。底层技术方面,提升了基于深度图的3D手部关节点估计精度。随着底层技术的改进,新研发了基于TOF摄像头的手指3D指向交互方案,通过对用户手部的线D姿态建模,获取食指指向的精准空间位姿及其方向射线与交互屏幕的交点,从而实现用户“指哪打哪”的良好体验,完成在中近距离下与设备的精确交互。在VR/MR/AR手势技术方向,获取了大批量的手部3D真值数据。手部检测及关节点估计等基础模块持续改进,在内部自建测试集上手部检测的reca提升至98%,precision提升至99.1%;关键点检测则优化了侧手、捏合、前戳等姿态的精度,在复杂背景下点的稳定性也有较大的改善。

  多属性的人脸质量打分进展显著。根据市场需求,结合国内外相关标准文档,进一步增加质量评估的维度,目前已达14种属性,对一些容易互相干扰的属性重点优化解耦,各属性准确率指标进一步提升3.5%;同时,也在BCTC的辨识算法测试中,作为必备的基础功能通过认证,表明算法可以有效甄别人脸图像是否满足人脸支付的质量要求;进一步对车载场景的困难case进行优化,满足不同客户需求;同时考虑到目前行业内在人脸质量方面缺乏统一认知,开始以高精度仪器采集数据为基准,着手制定标准文档。HDR场景识别技术采用新的方案,移除了对方向参数的依赖,在保持参数量和计算量基本不变的情况下,大大提升了识别精度;利用图像语义信息,对过曝区域、欠曝区域进行精确分割,进而可以统计出当前场景是HDR或者LowightHDR场景的程度,来更好地适配客户的不同需求;镜头脏污识别技术采用更加高效的方案,显著提升了对脏污场景的检出率,同时保持误检率和性能稳定;通用场景的图像画质分析技术,从对比度、亮度、色彩度、清晰度、噪声等不同维度对图像画质进行综合打分,持续提升精度。

  YUVHDR支持了旗舰处理器AEB模式下的HDR融合。该模式配合改进的HDR融合算法,实现了零延时的高动态范围合成,实现了高光还原和亮度过渡的平衡,实现了防鬼影和防噪音的平衡,实现了对霓虹灯、日落、天空、室内ficker等不同场景的智能优化,提高了整体的合成率和还原度。在防鬼影方面,加入了基于AI的增强技术,实现了提亮和去噪,减少了运动区域的噪音,提高了运动场景的画质。开发暗光环境人像HDR功能,在暗光人像模式能更好的还原场景动态,同时保持人像的亮度和人脸的细节。基于RAW域的HDR在AI去噪、高动态图像获取方面都取得了巨大进步,针对HDR摄影的复杂环境,从白天到夜晚都准备了鬼影处理策略,在影调方面以保持真实场景亮度分布为出发点,自适应调整影调,在保持原本动态范围扩展能力的基础上使最终结果更贴近客户从美学角度的需求。弱光环境结合图象分割方面,根据图象区域分割的结果动态调整局部的融合策略,最终的融合结果更加自然。开发暗光环境闪光灯模式和屏幕补光模式人像HDR功能,在暗光人像模式能更好地还原场景动态,同时保持人像的亮度和人脸的细节。

  暗光图像增强技术,公司为客户的摄像头传感器做了针对性支持,确保每个摄像头的去噪以及保留细节达到最佳效果。改进对齐算法,提升运动区域和人像的配准精度。改进多帧融合算法,后处理结合AI增强提升细节。改进训练策略,使得落地后的性能优化版本,效果更好。改进算法框架,调整算法参数结构,有效的提升算法在落地过程中的调试成本。对更多平台做了NPU设备的适配,同时,针对更低平台做了算法的针对性改进,维持效果和性能的最佳平衡,使得算法可以平铺到更多的客户设备。

  超分辨率图像增强技术,通过不同方案的尝试和实践,最终方案在清晰度上有突出优势,在效果和性能上达到了一个新的高度,满足市场客户的需求。YUV图像超分,改进运动区域检测策略和配准精度,改进融合算法,优化AI模型训练流程,提升AI增强的效果,去除噪音,提升结果细节。优化代码框架,提升性能。

  屏下摄像头画质修复技术实现了预期的功能,在抑制图像原有噪声的同时提升图像清晰度、对比度和色彩饱和度,图像整体视觉效果更接近普通摄像头效果。文档图像去阴影技术更新了基础模型,改善了阴影mask检测的效果。通过对模型的优化和精简,在降低计算量的同时,也大幅降低了内存占用开销,并且效果和之前基本一致,从而使得该技术在更多中低端手机上落地应用。此外,通用场景去阴影技术的研发,也拓展了该技术的应用领域。美食图像去阴影方面,设计了多级检测和联合优化的方案,提高检测的稳定性,优化复原网络结构,从语义上有效地区分外部投射阴影和自身立体阴影区域,在各类食物场景中,偏色问题得到很大的改善,主观评测通过率和客观得分都超过几家竞品的效果。通过对摩尔纹产生机理的深入研究,对摩尔纹合成算法进行了改进,可以根据不同场景,生成对应的摩尔纹,提升了数据的真实性和丰富性。算法上尝试了多种新的方案,提升了去摩尔纹的效果以及泛化性能,同时精简了模型,降低了计算量。去反光技术细分各种拍摄场景,设计了有效区分反光层和背景层的代价函数,有效地改善了强反光边缘的场景并抑制误去除,相比基础版本有明显的改善,未来还需要进一步与竞品效果做比较。

  视频超夜技术上,对不同应用场景下的效果和性能进行了优化。对算法框架做了整体改进,优化配准和融合算法,改进运动区域的融合ghost,在保持实时性能的同时降低了整体功耗,并且提升细节保持能力和大噪声场景的空域去噪能力。针对前置人像自拍场景,在保证人像低鬼影的同时大大提升背景的时域稳定性,同时优化AI模块的数据处理流程,在保持模型大小的情况下进一步提升了去噪和保细节能力。针对PC端需求,开发了时域AI降噪模型,同时根据硬件特性优化模型性能,目前在客户目标平台上已达成1080p分辨率视频的实时处理。针对多个第三方应用进行了算法适配,使得该技术的应用场景得到了更多的拓展。视频超分技术,增强了去噪模块,改善了对时域噪声以及块状噪声的处理效果,深度优化算法,极大的降低了算法功耗。进一步发展了基于深度学习的端到端解决方案,将业务扩展到视频会议领域,满足客户需求,对视频会议中极端低带宽下的最低180p输入在端侧部署4x超分增强,经历高性能超分网络的摸索与量化支持、多轮数据构造方式的尝试、训练数据的不断扩展,明显改善画质严重退化带来的人像和文字模糊、颜色失真、边缘断裂等问题,改善视频会议体验和文字可阅读性。视频插帧技术,针对光流算法进行了改进优化,利用AI模型,进一步提升了对于大位移的追踪能力和运动边缘准确度。同时拓展了插帧技术在模拟长曝光场景的应用,对于拍摄的少量连续帧,计算中间图像并模拟运动模糊效果,使运动轨迹平滑自然。

  进一步优化了光学畸变消除性能和功耗表现,提升了视频流的处理性能;进一步提升了身体部分的修正效果并增加了任意输入区域透视畸变弱化的效果;设计实现了人脸透视畸变检测及自适应矫正的方案,扩展了人像矫正的适用范围。

  平滑切换支持更多的摄像头组合,变焦算法扩展至更多的低平台,同时在更多的场景下支持faback模式,新增融合过渡,使得切变效果更加自然;改进融合技术涉及到的核心算法,效果提升明显。

  进一步扩大AVM和BSD标定方案的支持列表,兼容市面主流所有的标定方案以适配更多的车型,对于商用车及工程用车超大车体和异形车体有了更好的支持,并部署于多个实际案例;完成了XR眼镜的标定产线设计,并且已经得到特定厂商的认可,应用到了实际产品线)全景拼接

  增加了对raw数据作为输入的支持,在低光场景下对噪声抑制有一定的提升,并能够扩展全景图的动态范围;针对一些带有运动物体的场景,通过检测运动场景内的运动物体并加以保护,减少鬼影,对于大的运动物体,效果提升比较明显。

  公司在图像修复与编辑方向上长期致力于LivePhoto、视线校正、人头姿态校正等人脸修复与编辑技术。LivePhoto技术通过用户照片生成真实感人脸动画效果,完成人脸视频生成,结果具有高度真实性和自然度。相比传统的方案,新方案在口腔与牙齿部分、表情、头部运动、背景方面更加自然;同时基于相同的时间开销,提升了生成视频的分辨率和清晰度。视线校正技术可以将图像中的人脸眼睛视线方向进行校正,生成任意视线方向的合成图像,该技术在2022年于项目中提升了校正结果的整体质量。在算法稳定性方面,优化了结果的抖动,使校正效果更平滑。在校正范围方面,从上下两方向校正,变为全方向校正。该技术已经用于视频会议产品中,预计在2023年将获得更广泛的应用。人头姿态校正是2022年推出的一个全新技术,可以对视频中人物的头部姿态进行实时的校正,旨在解决视频通话中由于相机位置造成的头部姿态偏移。目前已实现一套基于深度学习的算法原型,相比于学术界公开的方案,校正效果更加自然、真实,现有的测试结果令人满意。下一步目标是在保持效果基本不变的前提下提升性能,以满足实时应用需求。

  在人脸美化技术上实现拍照磨皮新方案,提升了细节表现力、肤质纹理更加自然,增强了对不同画质人脸去噪的自适应性,改善人脸明暗不均现象的同时立体感也得到保持提升;实现预览磨皮算法,在去脏能力、通透度、立体感、肤质细腻度方面都有所提升;实现OpenGL版本腮红、眼影、SkinGoss等美妆技术,新方案性能方面有较大提升,同时由于具有更小的精度损失从而带来更好的视觉效果;实现了AI预览祛斑算法,较大提升了预览美颜的祛斑、去脏能力,对肤质纹理也有很好的保留。性能功耗方面,进行了模型优化和NPU硬件优化,优化了拍照AI祛斑算法,对大侧脸caset提升祛斑效果的稳定性。预览头发柔顺技术可以去除视频中的杂乱发丝、捋顺发束,达到美发风格化的效果。针对海外市场需求,定制实现了Bindi检测技术,可保护印度女性眉心Bindi,提升美颜效果;为车载项目开发滤镜算法库,支持多种滤镜风格,方便了开发维护;优化调整了OpenGL相关的框架逻辑,使不同算法模块更好地衔接,提高开发效率。

  低光照和极暗光线下的人脸美颜解决方案在继续扩展了超清人像美颜风格的应用平台,人像视觉效果更加自然、整洁,同时保持清晰度和立体感。视频任务上,针对移动设备端改善了模型以及任务框架,增强人像效果以及自然程度,同时提升了性能。而PC端主要增强人像修复强度,提升人像解析力,同时针对不同平台的做了专门的性能优化。实现针对车载、平板、PC、手机等设备的视频人像修复的轻量级模型部署。

  视频虚化升级到了新一代渲染算法,该算法在效果上更加逼近大光圈的单反镜头,光斑更具真实性、自然性和艺术性;改善了渐变的层次感,使其更加立体、自然;改善了边界的准确性,使其更加锐利;大幅优化了性能和功耗;实现了已拍摄视频在相册中重新编辑虚化强度、对焦点等功能的算法原型;作为底层核心技术,多维度达到了业内领先水平,为电影模式在多家手机客户成功出货提供了重要技术支撑。

  升级了视频换背技术,能够根据背景图像自适应地调整前景的色调和亮度,使融合结果更加自然、真实。双摄虚化基于更加精确的双摄AI深度,进一步优化算法,使得效果更加精确和自然,接近单反相机拍照的效果。同时虚化算法、HDR和超级夜景等画质类算法结合,显著提高了虚化光斑的层次感和真实感。进一步基于特定的单反相机或镜头专门优化光斑效果,使得效果更加接近光学镜头拍摄的效果如哈苏风格化等。

  进一步提升了单帧/多帧画面的深度恢复精度,包括大幅改善了主体一致性和均匀性、人物及物体的边界精度、中远距离的错误、深度信息的层次性,特别是前后排人物深度的层次性、和人物同距离物体深度的准确性等等;大幅提升了前后帧的稳定性;进一步裁剪和压缩模型,大幅优化了功耗和性能;作为底层核心技术,在多维度均达到了业内领先水平,为电影模式在多家手机客户成功出货提供了重要技术支撑。单目AI拍照模式也显著提升了极夜和近景场景的表现。双目AI视频方案显著改善了深度准确性和精细度。

  为满足实时低功耗要求,在性能和功耗方面也有极大的改善,进一步满足客户要求。双摄方案利用全新的技术对双摄深度进行估计,对传统方法比较难处理的重复纹理,无纹理区域有着极大的改善,并且极大的提高了深度的准确性和精细度。同时针对一些特殊情况,比如细小物体,透明物体,反光物体,低光夜景场景等,进一步改善了这些场景的准确性和精确度,使得效果更能符合用户的实际需求,在多款旗舰手机上顺利落地,并获得了客户良好的反响。

  继续优化人像分割的主体准确性、边缘准确性和稳定性,在不同光照、遮挡等场景下的表现也更加鲁棒,在视频会议、车载OMS等场景均有明显改善。针对智能化拍照开发了AICamera功能,能够对场景中的天空、植物、宠物、人像、及人体不同区域进行多语义精准分割,从而做到对不同成像区域的定制化处理。实现了新一代交互分割算法的原型开发,能够以极少的交互实现用户对特定物体的抠图,该技术具有不限场景及类别、交互简单高效、准确性高等优点。改进了实例分割算法,逐步构建了更大规模的实例分割数据集,支撑了算法的迭代改进。实现了超高分辨率的语义分割算法原型,支持4K分辨率像素级别高精度语义分割。稳步提升了人宠分割引擎的精度,重点优化了部分复杂场景效果,同时针对低算力平台优化了性能和功耗,进一步提升了算法的竞争力。

  车牌检测算法对多类型车载摄像头配置支持,适配多种相机的架设角度和视场角,包括了行车记录仪,周视相机和环视相机等,对于图像抖动、模糊、强光等环境也有较强的适应性。检测算法结合CPU、GPU、DSP、NPU等多核架构,充分发挥异构计算的高效性,在有限的计算资源搭配中取得较好的性能和效果。检测算法针对多款车机芯片进行了性能优化,可以满足在线实时检测的需求。目前车牌检测技术可以支持多种常见的车牌类型。当前在内部多场景实车采集测试集中测试结果可以满足中汽协《汽车传输视频及图像脱敏技术要求与方法》中相关的要求,通过特定的硬件和环境适配,召回率和误检率指标还可以进一步提高。

  场景检测引擎GPU版本继续更新迭代算法模型,支持高通、MTK等NPU平台的运行,进一步提升了全体场景检测的平均准确率至96.27%,改善支持任意角度和有限度遮挡的目标场景检测。

  物体三维重建技术进行了方案优化,更加符合用户习惯。原先的方案要求物体不动,手机围绕物体旋转,这对拍摄环境有一定的限制。为进一步减少用户交互限制,新增了手持相机同时转动被摄物体的扫描方式,建模时间与效果与之前基本保持一致。实时三维重建在模型生成方面进一步优化相机的pose以及网格的生成,在模型的准确性和完整性方面都得到一定提升。同时在三维模型的纹理映射上,提升纹理颜色一致性,导出模型的纹理图效果达到主流重建软件水准。新增单目RGB相机和dToF相机重建模式,未来将支持更多搭载dToF相机的设备。新增双目相机重建模式,利用深度学习算法通过双目输入实时估计场景深度数据,用于VR/MR/AR头戴设备。算法耗时模块利用GPU加速,让出更多CPU资源给上层应用。

  新增采集全身人像数据,扩展了重光照的效果应用范围,从原来重点人脸区域扩展到人像全身,减少人像整体因光照冲突产生的违和感,提升效果真实感;从原功能仅支持单个白色光源扩展支持多个彩色光源,支持每个光源独立调整参数;改进宠物重光照技术,使不同场景下宠物毛发和背景的融合更自然、精准;实现将原有算法模型从GPU移植到NPU,现NPU算法功能和GPU算法基本相同,以便于充分利用设备硬件资源,能够适配更多机型;预览功能新增支持在不同场景切换、有人脸无人脸状态切换时的平滑过渡功能,明显提升了用户使用体验;为改善拍照时人脸受阴影干扰的问题,新开发了去除人脸阴影的功能,可去除或弱化各种类型的外部异物,头发、眼镜、五官等造成遮挡阴影。

  VR手柄跟踪是SLAM技术的一个新拓展领域,是VR终端设备的刚需技术。2022年已经完成了VR手柄方案产品原型。通过基于深度学习的检测技术与SLAM技术相融合,在定位精度、鲁棒性以及场景自适应性上有了大幅度提升。该技术方案可以输出频率达数百赫兹的6自由度手柄位姿,定位精度达到毫米级,能够支持手柄短时间移除视野后的鲁棒跟踪,以及手柄长时间移除视野后的快速重新定位。初步实现了用手机作为VR头显的手柄控制器,实现实时6自由度跟踪。在常见手机中低速运动状态下,可以对手机姿态进行连续、准确地跟踪。

  报告期内,优化视觉跟踪匹配算法,改进SLAM建图模块,进一步提升重拾成功率和精度。提高平面扩展速度,纯RGB输入的平面扩展速度也能接近RGB+TOF输入。深度结合平面检测模块和SLAM模块,有效减弱平面融合时的闪现问题,提升用户体验。新增并落地VR/MR/AR设备的产线标定方案,在标定产量指标上有竞争力。

  通过多年的技术积累,2021年初开始了写实数字人重建的大方向研究。针对数字人直播等应用,实现了一个便捷的数字人建模方案。输入一张正面中性表情图,即可自动重建出对应的写实数字人,整体重建效果具有较高真实感、细节表现力强等特点,并可以通过人脸/人体驱动技术进行流畅的实时身体和表情驱动。在细节上支持了头发重建,重建出的头发与输入发型相似度可以达到80%。目前已经对多个平台项目进行支持,为客户定制虚拟人基础模型与渲染效果。

  持续提升座舱健康监测技术。其中心率检测算法,引入更高维人脸属性;扩大特征维度,有效改善主体运动场景下有效检测成功率,打电线%;呼吸检测算法方面,结合频率估算和动作识别算法,有效提升输出结果稳定性,异常波动率下降30%,显著提高用户体验;血压检测算法方面,结合多模态信息,建立用户画像,提高有效检测率约10%;开发完成图像预处理技术,快速适配多款镜头,降低开发时间约10%。

  ADAS技术按照L2落地应用重点攻坚感知核心引擎。前视解决方案中,完成产线标定、售后标定和在线标定等完整标定功能,提升C-NCAP场景下行人探测率3.5%(精准度94%),提升直弯道场景下车道线%;周视解决方案中,持续提升障碍物感知算法精度,行人召回率提升5%,车辆召回率提升2%,锥桶召回率提升3%,增加镜头诊断和自动标定功能,在指令变道应用中能达到98%成功率;夜视解决方案中,运用图像增强算法提升热红外图像质量,提升夜间障碍物召回率约10%;针对车载硬件继续深入优化算法,在多路解决方案中,CPU占有率降低30%;下一阶段,将重点继续打磨提升实际场景cornercase,提高用户体验。AEB功能已经在自测试验场实现了C-NCAP2021,完成车道偏离预警(LDW),自适应巡航(ACC),车道居中保持(LCC),自动变道(ALC),车道偏移辅助(LKA)的功能开发。暗光环境下周视交通参与者检测识别,利用公司自研暗光图像增强技术,有效改善暗光图像效果,同时在网络结构设计上进行优化,在不增加耗时的情况下较大程度提高暗光环境下识别效果。AVM技术持续改进了2D鸟瞰图、3D全景图的拼接一致性效果,改善了各个视图的投影变形效果,以及重点优化了透明底盘功能的对齐过渡效果;在功能上,面对客户的多样化需求,AVM技术也在不断扩展如广角视图、轮毂视图、后视镜视图、暗光增强功能等在内的新功能;在性能上,深度优化算法框架,大大降低了AVM技术对设备算力的需求。

  基于丁达尔效应产生的物理原理,选择合适的场景对仿真实现进行合理的简化和模拟,最终实现一套结合AI和CG的方法,为特定的场景图像添加上合适的丁达尔特效效果,提升图像艺术感。

  公司坚持以创新驱动企业发展,不断探索视觉领域的前沿技术,持续高水平研发投入打造核心竞争力,研发投入强度连续七年达30%以上。截至2022年末,公司拥有专利245项(其中发明专利227项)、软件著作权129项。相较于2021年末,报告期内净增发明专利29项、软件著作权10项。

  在超过20年的发展历程中,公司磨合出一支以博士为带头人、硕士为骨干的核心研发团队,充分掌握核心技术算法,并进一步落地成为成熟的商业产品。通过长期的潜心学习,公司始终立足于领域内的最前沿,建立和长期保持行业内经验积累和能力上的领先优势。

  虹软科技及其下属公司经过近三十年的摸索,不断改善形成了一套独有的高效管理模式,基本实现自动化、自驱、自愿的高效运行状态,同时采用“导师制”培养模式,有效减少研发的试错次数。高效的研发管理体系提高了公司的自主创新能力和产品研发速度,提升了公司视觉人工智能技术算法水平。目前,公司拥有良好人才储备并在持续完善,为重要项目的推进奠定了基础。

  公司技术积累优势主要体现在端计算和边缘计算技术的积累优势、视觉人工智能技术的层次积累优势、工程落地能力,具体见本节“

  二、报告期内公司所从事的主要业务、经营模式、行业情况及研发情况说明/(三)所处行业情况/1.行业的发展阶段、基本特点、主要技术门槛/1.2主要技术门槛”。

  虹软自成立以来便致力于计算机视觉技术的研发,技术所应用的终端,从个人电脑、数码相机、智能手机,再发展到智能汽车、VR/MR/AR智能可穿戴设备以及其他AIoT领域,一直与影像产业的发展、消费者的需求和影像科技创新紧密相连。经过多年的技术、专利和人才积累,公司已全面掌握视觉人工智能及人工智能的各项底层算法技术并不断进行技术演进,掌握包括即时定位与建图、图像语义分割、人体识别、物体识别、场景识别、图像增强、三维重建、虚拟人像动画、虚拟数字人等全方位的视觉人工智能技术。公司所掌握的这些底层技术具有通用性和延展性,在此基础之上,公司构建了不同的组件和产品,并衍生出多种产品应用方案满足相应的细分市场需求。

  公司坚持以创新驱动企业发展,持续高水平研发投入,研发费用占营业收入比重连续多年在30%以上。截至报告期末,公司拥有专利共计245项(其中发明专利227项),软件著作权129项。

  公司业务涉及到的消费电子产业、汽车产业特别强调产业高度协同,相互赋能、协同发展成为产业发展壮大的内在需求。公司拥有紧密、稳定的生态关系,与高通、联发科、格科微、索尼传感器、三星半导体、艾迈斯半导体、OmniVision、舜宇光学等平台、传感器、摄像头模组厂等产业链上下游主流公司开展合作。在智能驾驶业务上,除了既有的合作伙伴之外,公司也持续与更多的芯片、相机模组、Tier1等诸多上下游产业链公司形成了相互信赖的合作伙伴关系。

  凭借与产业链内主流公司长期、广泛的合作,掌握了持续开发、迭代与硬件更加匹配的算法的能力,通过共同研发、持续合作交流,得以在客户提出技术需求后,在最短时间内及时响应,提供低能耗、高效率、硬件平台适应性广的解决方案,保持技术持续处于行业最前沿。

  公司是全球智能手机视觉人工智能算法重要供应商,目前已在视觉人工智能算法行业形成良好的口碑,客户遍布全球,算法产品基本覆盖安卓手机品牌。公司自与主要客户建立合作以来,均保持了持续良好的合作关系;对于展露市场的新客户,公司也通过帮助新客户成就其产品快速获得了客户的信赖。优良的客户质量、良好的市场口碑、国际化的品牌认可度、海量历史销售数据,为公司后续业务发展奠定了良好基础。公司正逐步利用在手机行业形成的技术、品牌和客户服务经验等优势,把产品和业务扩展到汽车行业以及其他AIoT行业。

  (二)报告期内发生的导致公司核心竞争力受到严重影响的事件、影响分析及应对措施

  公司2022年度实现营业收入为53,164.85万元,同比下降7.22%;实现归属于上市公司股东的净利润为5,779.73万元,同比下降58.95%;实现归属于上市公司股东的扣除非经常性损益的净利润为678.92万元,同比下降92.97%。主要原因为:①在移动智能终端业务上,全球经济下行影响持续,消费电子市场需求不景气,全球智能手机出货量继续萎缩。受市场环境变化、原有客户手机出货量下滑等因素影响,公司2022年度移动智能终端视觉解决方案实现营业收入47,330.45万元,同比下降11.49%。②随着行业的快速发展,公司结合智能驾驶业务发展路径,加大了对关键人才的招聘力度。2022年末,公司员工总人数同比增加15.87%,相应职工薪酬等相关支出增加。报告期内,公司的主营业务、核心竞争力未发生重大不利变化,所处行业景气情况不存在产能过剩、持续衰退或者技术替代的情形,公司持续经营能力不存在重大风险。另外,作为技术驱动型企业,为始终保持核心竞争优势,公司持续加大对优质人才的投入力度,将导致成本及费用持续增加。未来,如果公司人力成本的投入增长速度持续高于收入的增长速度,则会对公司的短期经营业绩产生不利影响。

  公司所处的视觉人工智能行业技术升级迅速,是典型的科技驱动型行业,产品更新换代频繁,市场对技术与产品的需求不断提高,更多的视觉人工智能技术正被运用到各类智能终端。公司是以研发和技术为核心驱动力的企业,如果公司不能正确判断和及时把握行业的发展趋势和技术的演进路线,并投入充足的研发力量布局下一代的视觉人工智能技术研发,可能导致公司无法保持当前的技术领先性,从而对公司未来的经营产生不利影响。

  智能手机市场的需求变化较快,相关技术的迭代周期较短,迭代周期约为1-2年。如果公司未能及时更新升级相关技术或根据市场需求成功开发出新产品,则公司可能出现技术落后、技术迭代不及时等情况,从而导致市场占有率大幅下降。而在其他移动智能终端领域,尽管公司利用既有技术整合开发出一些符合客户需求的产品,但若无法抓住未来市场涌现的机遇尽快获取客户,则可能导致错失发展机遇的风险。在智能驾驶领域,公司目前所取得的前装定点项目主要是针对座舱内的软件算法,但随着产业的不断演进,如公司无法研发出针对智能驾驶相关有竞争力的产品、技术,则公司可能面临错失发展机遇的风险。

  公司所处行业发展前景广阔,近年来参与者不断增多,导致行业竞争加剧。众多企业凭借其在特定细分领域的优势参与各垂直应用领域的竞争。若公司不能持续有效地制定并实施业务发展规划,保持技术和产品的领先性,则将受到行业内其他竞争者的挑战,从而面临市场竞争加剧而导致的毛利率下滑和市场占有率下降的风险,进而影响公司的经营业绩和发展潜力。

  公司销售的各类产品均基于公司独立研发积累的大量计算机视觉核心技术。为保护公司的核心技术,公司制定了严格的保密体系,但上述措施仍无法完全避免公司核心技术泄密的风险。未来如果公司相关核心技术内控制度不能得到有效执行,或者出现重大疏忽、恶意串通、舞弊等行为而导致公司核心技术泄露,将对公司的核心竞争力产生风险。

  公司经过数十年的发展,积累了大量视觉人工智能的底层算法,这些底层算法具有通用性、延展性,除了可以广泛运用于智能手机外,还可应用于笔记本电脑、智能可穿戴设备等其他消费电子产品以及智能驾驶、智能保险、智能零售、智能家居、医疗健康等多个领域。

  在智能驾驶领域,2022年1月至今,新增了与长安、奇瑞、长城(含海外车型)、岚图、理想、吉利(含沃尔沃全球车型定点项目)、长安马自达、本田、长安新能源、赛力斯、金龙旅行车等车厂的前装量产定点项目。公司这些新业务的成功与否既受到行业发展状况、市场需求变动以及市场竞争状况等因素影响,又受到公司对新领域的理解、认知、推广力度及与伙伴的合作等诸多因素影响。因此,公司对新业务开发和拓展可能不及预期。如果公司在新领域产品开发或市场推广效果不佳,或者出现其他不利因素,将可能导致公司新业务开发失败,从而对公司未来的经营业绩产生不利影响。

  报告期内,公司前五名客户销售额为30,522.79万元,占销售总额的57.41%。如果智能手机出货量下滑、主要客户业务发展战略发生调整、主要客户因供应链短缺等原因延迟推出新机型或者其他不可预知的原因导致对公司产品的采购需求下降,则会对公司整体经营业绩产生不利影响。

  公司所处的视觉人工智能行业近年来发展蓬勃,对人才的需求量较大。公司的业务发展,需要一批稳定的研发技术人员、产品化人才及管理人才,这些核心人才对于公司业务的发展壮大起到至关重要的作用。

  公司的成功取决于不断吸收和留住高水平的研发、产品、销售和管理人才。尽管公司通过内部培养及外部引进逐步形成了较为稳定的核心人才团队,并通过树立企业文化、优化薪酬体系、改善工作环境、完善绩效考核机制等方式完善了人才培养体系,但是,仍然可能出现核心人才流失的情况,从而给公司业务带来不利影响。

  公司所处行业内企业对于优秀人才的竞争越来越激烈。如果公司未能招募到满足公司业务发展需求的优秀人才,则会对公司的业务发展产生不利影响;如果公司的人力成本的投入增长速度持续高于收入的增长速度,则会对公司的短期经营业绩产生不利影响。

  目前,公司已积累了适应业务快速发展的经营管理经验,完善了相关内部控制制度,逐步实现了公司内控制度的完整性、合理性和有效性。首次公开发行股票并在科创板上市后,公司资产规模迅速扩张,在研究开发、市场开拓、资本运作、内部控制、运营管理、财务管理等方面对公司的管理层提出更高的要求;同时随着公司不断进入新的行业应用场景以及募集资金投资项目的实施,公司业务规模将进一步扩张。若公司的组织模式、管理制度和管理人员未能适应公司内外环境的变化,将给公司持续发展带来不利影响。若公司管理水平不能快速适应不断扩大的经营规模,解决上市公司经营管理面临的新课题,也将对公司发展带来不利影响。

  随着公司经营规模的不断扩大,公司人员增加、结构优化导致各项费用增加,同时在国际贸易摩擦的背景下,国外客户受美国制约可能向公司减少采购、国内外客户受制于贸易摩擦或其他因素导致的自身销量下降进而可能对公司采购下降,以上因素可能会对公司的短期业绩形成不利影响。

  目前,公司提供的视觉人工智能解决方案主要应用于智能手机、智能驾驶行业,主要客户包括了三星、小米、OPPO、vivo、荣耀、Moto等全球知名手机厂商以及国内主要的自主品牌、部分合资品牌汽车主机厂商。报告期内,公司移动智能终端视觉解决方案业务收入为47,330.45万元,占公司营业收入比例为89.03%,公司下游主要客户集中于智能手机市场。

  公司智能手机视觉解决方案收入与智能手机和摄像头的出货量虽无明显线性相关关系,但如果智能手机出货量下滑、摄像头出货量出现下降,主要智能手机业务客户发展战略发生调整或者其他不可预知的原因导致对公司的智能手机计算机视觉解决方案的采购需求下降,则会对公司经营业绩产生不利影响。智能驾驶视觉解决方案方面,如果行业竞争加剧,公司技术及产品竞争力不足,客户业务发展战略发生调整、客户自身业务发展状况发生改变或供应链紧缺等,可能导致公司智能驾驶业务进展不及预期,以上因素可能会对公司经营业绩产生不利影响。

  公司主要从事视觉人工智能技术的研发和应用,主要产品有移动智能终端视觉解决方案、智能驾驶视觉解决方案和其他AIoT智能设备视觉解决方案,主要终端应用领域包括智能手机、笔记本电脑等消费电子产品以及智能汽车等。应用领域对国内外宏观经济、经济运行周期变动较为敏感。如果国内外宏观经济发生重大变化、经济增长速度放缓或出现周期性波动,公司主要客户因终端需求下滑、调整自身市场计划,或因供应链短缺等原因延迟推出新产品而对公司采购需求下降,且公司未能及时对行业需求进行合理预期并调整公司的经营策略,可能对公司未来的发展以及经营业绩产生负面影响。

  报告期内,公司及子公司享受了一系列增值税税收优惠、所得税税收优惠,尽管税收减免对公司业绩的影响有限,但如果未来公司所享受的税收优惠政策出现不可预测的不利变化,或者在税收减免期内公司不完全符合税收减免申报的条件,则公司将在相应年度无法享受税收优惠或存在所享受的税收优惠减少的可能性。公司税收优惠政策可能的变化会使公司未来经营业绩、现金流水平受到不利影响。

  虹软科技是一家全球化公司,在海外多地拥有经营主体,且客户分布韩国、日本、台湾地区、美国及欧洲等各地,报告期内公司来源于境外的收入占比为46.20%,上述境外业务使用外币进行结算,受到人民币汇率水平变化的影响。随着公司业务的发展,公司外汇结算量将可能进一步增加,同时人民币汇率受国内外政治、经济环境等综合因素的影响,存在波动风险,进而对公司的经营业绩产生不利影响。

  在业务发展过程中,公司可能面临各种诉讼、仲裁。公司不排除在经营过程中,因公司业务、人力、投资等事项而引发诉讼、仲裁事项,从而耗费公司的人力、物力,以及分散管理的精力。

  公司实际控制人HuiDeng(邓晖)于2019年9月出具承诺,针对“MarcChan、LeiLi及其家庭基金诉讼事宜”,如发生任何纠纷(包括但不限于诉讼、仲裁、索赔等)给公司造成任何经济损失(包括但不限于支付赔偿款、律师费、诉讼费等)均由公司实际控制人HuiDeng(邓晖)独立承担。截至目前,该案处于审前调查取证阶段,实体上庭审程序尚未开始,诉讼结果存在一定不确定性。

  由于募集资金投资项目数额较大,对公司经营管理、研发管理、市场开拓、财务管理及人力资源管理等各方面能力提出了更高要求。如果未来市场发生不可预料的不利变化或管理疏漏等原因对募集资金投资项目的按期实施及完全达产造成不利影响,将导致募投项目经济效益的实现存在较大不确定性。

  募投项目建成后,将新增大量固定资产、无形资产、研发投入,年新增折旧摊销等费用金额较大。如果行业或市场环境发生重大不利变化,募投项目无法实现预期收益,则募投项目折旧摊销等费用支出的增加可能导致公司利润出现一定程度的下滑。

  针对光学屏下指纹解决方案开发及产业化项目,公司在项目推进过程中,尽管通过加强与供应链企业的合作等方式努力推进,但该项目的产品出货及商务拓展进度仍不及预期。市场环境亦发生较大变化,智能手机是公司光学屏下指纹解决方案的重要应用领域,全球智能手机出货量近年来持续萎缩,同时光学屏下指纹市场竞争加剧,相关解决方案的价格竞争愈发激烈,产品整体单价呈现快速下降趋势。综合前述因素,光学屏下指纹解决方案开发及产业化项目投资风险明显升高,按原计划投入将无法达到预期目标。报告期内,公司已终止募投项目光学屏下指纹解决方案开发及产业化项目。

  公司下设多家境内外子公司,层级较多,并且存在通过境外子公司控股境内子公司的架构情况,公司面临各国法律及税收的监管要求。如果未来境外子公司所在国家或地区法律及税收的监管要求发生不利变化,同时公司实际控制人、管理层缺少相应的管理经验和能力,将增加公司管理协调的难度,带来经营管理风。

打印本文 打印本文  关闭窗口 关闭窗口