中原证券股份有限公司
关于北京零点有数数据科技股份有限公司
首次公开发行股票并在创业板上市之上市保荐书
保荐机构(主承销商)
(郑州市郑东新区商务外环路10号中原广发金融大厦)
2021年11月
中原证券股份有限公司
关于北京零点有数数据科技股份有限公司
首次公开发行股票并在创业板上市之上市保荐书
中国证券监督管理委员会、深圳证券交易所:
作为北京零点有数数据科技股份有限公司(以下简称“发行人”、公司)首次公开发行股票并在创业板上市的保荐机构,中原证券股份有限公司(以下简称“保荐机构”)及其保荐代表人已根据《中华人民共和国公司法》(以下简称“《公司法》”)、《中华人民共和国证券法》(以下简称“《证券法》”)、《创业板首次公开发行股票注册管理办法(试行)》(以下简称“《管理办法》”)、《深圳证券交易所创业板股票上市规则》(以下简称“《上市规则》”)等法律法规和中国证券监督管理委员会(以下简称“中国证监会”)及深圳证券交易所(以下简称“深交所”)的有关规定,诚实守信,勤勉尽责,严格按照依法制定的业务规则和行业自律规范出具上市保荐书,并保证所出具文件真实、准确、完整。
本上市保荐书中无特别指明的简称与招股说明书相同,部分合计数与各加数直接相加之和可能存在尾数上的差异,该等差异系因数据四舍五入所致。
一、发行人概况
(一)发行人基本情况
公司名称:北京零点有数数据科技股份有限公司
注册地址:北京市门头沟区石龙经济开发区永安路 20 号 3幢 B1-2604 室
注册资本:5,417.9830 万元
法定代表人:袁岳
成立日期:2012 年 2月 13 日(2016 年 7月 26 日整体变更设立股份有限公司)
联系电话:010-53896410
传真号码:010-53896001
经营范围:技术开发、咨询、转让、服务、推广、培训;市场调查;经济信息
咨询;社会信息咨询;商务投资咨询;投资管理;企业管理咨询服务;会议服务;企业形象策划;组织文化艺术交流活动;承办展览展示;广告设计、制作、代理、发布;数据录入、处理、加工;公共关系服务;软件开发;网页设计。(企业依法自主选择经营项目,开展经营活动;依法须经批准的项目,经相关部门批准后依批准的内容开展经营活动;不得从事本市产业政策禁止和限制类项目的经营活动。)
证券发行类型:股份有限公司首次公开发行股票并在创业板上市。
(二)主营业务情况
公司在科学的数据采集和分析方法的基础上,运用自主研发的在线数据集成技术和垂直应用算法两大核心技术,形成决策分析报告或开发数据智能应用软件,为公共事务和商业领域的客户提供数据分析与决策支持服务,是将互联网、大数据等新一代信息技术深度融合应用于主营业务的创新型企业。
(三)核心技术及研发水平情况
1、在线数据集成技术
公司在线数据集成技术,实现了样本调查数据、巡查数据、交互数据和大数据等多源数据的采集、清洗、筛选、结构化、标签化等加工处理,主要由以下四项系列技术构成。
(1)样本调查数据集成技术
样本调查数据集成技术,是公司针对线下面访、神秘顾客调查、线上样本收集等调查场景,基于互联网应用开发的问卷设计、调查引擎和数据处理系列技术。基于该项技术,公司开发了在线定量研究问卷设计系统和零点专业问卷调查引擎系统(以下简称“Q系统”),两项技术成果的基本情况如下:
在线定量问卷设计系统,是公司针对专业的调研问卷服务,提供的线上定量问卷快速设计系统。基于公司多年调研服务经验,公司将不同研究模型中的标准问题和常用问题布设在该系统中,研究人员可在线实现定量问卷的快速组题设计、文字选项修改、问题顺序调整、可选答案数量设计、问卷导出等相关工作,提升标准定量问卷设计的效率与质量。
“Q 系统”,是提供给专业的访问人员,针对专业抽样的样本进行调研访问的
工具,支持丰富的问卷题型和灵活的问卷配置,满足复杂问题逻辑使用场景需要,利用多重数据安全机制,保证了数据的安全和真实。公司可以通过“Q 系统”快速在线查询、分析数据,生成报告,并将数据可视化呈现,极大地提高了调研咨询的工作效率。
(2)交互数据集成技术
交互数据集成技术,是公司针对客户及其用户灵活、持续、快捷的沟通需求,基于移动互联网技术自主研发的数据交互采集和加工处理的系列技术。基于该项技术,公司开发了“答对”。
“答对”通过接入企业或政府的用户管理系统或直接植入其服务流程,例如嵌入客户方微信公众号、二维码布入政府服务大厅、内嵌于企业客户管理系统等,将客户服务流程中的各个关键点设计为交互触点,并针对性地设计交互问题。在用户交互过程中公司获取其主观态度、观点看法等非留痕数据,从而获取线上或线下服务流程中各关键点的用户交互数据。
针对每个用户的触点行为差异,“答对”可以实现千人千面的互动——差异化的交互形式、差异化的交互内容、差异化的个性激励。同时,利用密钥技术、子入口、追踪码、微信开放式认证、空间位置信息、数据防刷、红包防盗技术,具备多种用户识别筛查、用户行为数据追溯、保障数据准确与安全的能力。
针对海量用户高并发场景,交互数据集成技术通过算力自动水平扩展、集群交互拥堵分流、云资源统一回收管理、自预警等多项技术,可以确保大规模并发访问时系统稳定可靠、交互顺畅快速的能力。
公司将“答对”、垂直应用算法、可视化组件封装,开发出智能数据应用软件——“超能交互系统”,该系统可以实施用户口碑声量监测、用户满意度追踪、低满意度预警、潜客购买确定度判别等,并支持交互数据分析结果的可视化展示,形成信息采集、分析、展示、预警、指导并推进行动,实现数据应用闭环。
(3)巡查数据集成技术
巡查数据集成技术,是公司针对检查、评测、整改核查等通用场景,如针对城市管理中垃圾暴露、物料乱堆乱放、违法占道等问题,基于移动互联网、深度学习算法,自主研发的移动端巡查数据采集、结构化、标签化等系列加工处理技术。基
于该项技术,公司开发了巡查工具——“超能巡查”。
巡查员在巡查过程中运用“超能巡查”,可以采用录入、拍照、录音、录像多种方式,实时上报有关巡查问题的文本、图片、音视频格式等一手数据。“超能巡查”亦支持离线模式,无网络场景下依然能正常采集,联网后数据集中上传校验,满足极端环境下使用需求。
“超能巡查”通过深度学习算法,可以从上报数据中快速提取关键信息,加快数据审核速度;“超能巡查”还可以通过数据时间校验、空间位置与任务地理围栏比对、图片水印等多种方式实现数据多维校核、相互印证,确保数据真实性与有效性。
公司将“超能巡查”、不同场景下业务分析算法、可视化组件进行组合、封装,开发出智能数据应用软件——“超能巡查系统”,该系统可以按照权责归属将问题及时分配到相应责任单位,实现“任务建项—问题上报—问题审核—问题分配—问题整改—整改核查—核查审核—结果申诉”的全流程闭环管理。该系统也可以对巡查与整改数据进行实时可视化展示与分析,帮助管理者掌握问题分布规律、监督问题处理进度与效果。
(4)大数据集成技术
大数据集成技术是针对大数据的数据调取、清洗、结构化、标签化等系列加工处理技术。大数据主要包括外购大数据和客户内部大数据。
针对外购大数据,公司与银联智策、智慧足迹、国信宏数、高德云图等拥有基础大数据的公司达成采购协议,采购脱敏后的数据信息。
公司与智慧足迹和银联智策合作模式为:在遵循国家法规和供应商对数据信息保密要求的基础上,运用大数据集成技术,在供应商提供的数据存储和处理环境中,对脱敏后的底层数据进行数据清洗,利用模型及算法对数据进行加工处理,形成公司专属的数据集或分析结果。
客户内部大数据包括文本数据、内部管理系统数据等。以文本数据为例,公司在数据初步清洗、筛选后,结合专业知识库,使用算法将文本数据中关键信息结构化,并为结构化处理后的文本数据添加时间信息和空间坐标信息等。
2、垂直应用算法
经过大量的项目实践,公司形成了独特的业务理解,积累了丰富且成熟的应用场景研究模型,并随着业务的发展而持续创新扩展。公司基于研究模型将不同应用场景拆解为问题单元;运用统计分析方法、大数据算法、深度学习算法,开发了基础算法模块;根据具体的问题单元,将基础算法模块调用、组合为应用算法模块;针对不同的应用场景,将相关应用算法模块组合、封装成为特定的垂直应用算法。
(1)基础算法模块
①使用常用统计分析方法开发的基础算法模块
统计分析方法,是指针对样本调查数据等数据量较小的结构化数据分析常用的分析方法,更强调对数据分布进行假设,以强大的数学理论支撑解释因果关系。常用的统计分析方法有频数分析、均值分析、相关分析、结构方程、线性回归分析等。公司运用统计分析方法,开发出适用的基础算法模块。
例如,公司基于均值分析、结构方程、相关分析等分析方法,开发出对称量表指标评分算法、指标权重结构方程算法、指标权重相关分析算法等基础算法模块;再如,公司基于频数分析、相关分析、前沿距离法、多维尺度分析等分析方法,开发出 KAM-KANO 指标属性分类、对标找差算法、最优策略联合分析等基础算法模块,这些基础算法模块可以在公共服务和商业服务的不同应用场景问题单元中选择调用。
②使用大数据算法开发的基础算法模块
大数据算法,是指针对海量数据分析常用的分析方法。大数据通常包括主体、时间、行为、空间等不同维度的大量信息,具有数据体量大、数据维度多、价值密度低等特点。常用的大数据算法有支持向量机、随机森林、时间序列等算法;同时,由于引入了空间维度的数据,也包含了空间分析领域常用的空间聚类、空间相关分析等算法。
公司运用大数据算法开发出一系列基础算法模块,如品牌簇、数据空间站、等时圈计算、设施叠置率分析、品牌 DNA 识别、地理围栏归属判别等基础算法模块。这些基础算法模块可以在不同应用场景问题单元下被选择调用,以实现海量数据快速分析。
例如,公司在银联智策的实验室环境中,对 300 多个城市 300 多个典型品牌脱
敏后的消费数据清洗整理,构建区分不同品牌的特征指标;基于消费者行为学的市场细分理论,使用网络聚类、随机森林、极端梯度提升(XGB)、判别分析等大数据算法,开发出“品牌簇”基础算法模块。“品牌簇”体现了不同品类的典型品牌之间的关系和特征,以及品牌在不同城市的发展递进轨迹。“品牌簇”可以在品牌形象分析与关联营销、新市场进入等不同应用场景问题单元下被选择调用。
再如,公司在智慧足迹的脱敏数据处理环境中,将每个城市切分成 250 米*250米的网格,借助地理信息系统,使用网格分布式计算、空间索引、网格合并技术、空间聚类等大数据算法与技术,开发出“数据空间站”基础算法模块。“数据空间站”可以快速对网格内人群信息进行分布式汇总统计,分析不同商圈、区域的人群特征。“数据空间站”可以在城市网格化管理、商圈人群画像、网点最优布局与选址评估等不同应用场景问题单元下被选择调用。
③使用深度学习算法开发的基础算法模块
深度学习算法,是机器学习算法的一个特定领域,其依赖于分类明确、指向性强的大量高质量数据,通过隐层模型,进行自主学习。随着输入数据量不断积累,深度学习算法可以自我迭代和进化。
公司深度学习算法,主要涉及文本关键要素提取、文本内容分类,以及视频与图片分析中的异常检测、动作识别、物体分类等不同类别。公司使用深度学习算法进行运算与模型训练、模型迭代,最终形成文本关键要素提取技术、分类预测等基
础算法模块。这些基础算法模块可以针对不同应用场景下的问题单元被选择调用,以便从文本、图片、视频等海量非结构化数据中快速、智