贵阳高新区这家企业抢占词元经济中游赛道:不“囤”数据,专“治”数据

在不久前落幕的“创赢未来”创业大赛贵阳贵安选拔赛中,贵阳高新区企业表现抢眼,共有5家企业分获一、二、三等奖。其中,贵州数幄科技有限公司(以下简称数幄科技)凭借其“全链路AI语义原生数据治理与智能应用一体化平台”项目,荣获“产业发展+创业”赛道三等奖。

这家成立不到一年的企业,作为词元经济产业链中游的典型代表,正试图用一套“零数据存储”的智能治理方案,回答一个困扰无数企业的问题:为什么数据越多,用得越难?

图片

数幄科技团队正在讨论系统方案

词元经济,这一新兴经济形态的核心,在于将数据从原始的、杂乱的符号,转化为可识别、可流通、可定价的“词元”资产。其产业链上游是数据生产与采集,下游是数据应用与服务,而中游则承担着数据清洗、语义对齐、标准定义、可信治理等承上启下的关键职能。数幄科技所切入的,正是这一中游环节——不碰数据本身,只做数据治理,让企业分散在各个业务系统中的信息,变成口径统一、语义清晰、AI可用的战略资源。

“我们发现,在企业数字化转型的浪潮中,很多管理者都遇到过同样的困境:系统越建越多,数据越积越厚,可真到要用的时候,却发现——财务部的‘收入’和销售部的‘收入’对不上号。”数幄科技创始人杨超然举例,同一个客户常常在三个系统里有三个名字,一份跨部门报表要协调三个团队花两周才能拼出来。

“数据不是没有,而是散落在各个系统里,没人说得清哪个是准的。”杨超然说起这个问题时,语气很平静,因为这正是他决定做数据治理的起点。

杨超然毕业于新加坡南洋理工大学,核心团队成员来自字节跳动、阿里巴巴、华为、美团等一线科技企业,均具有国内外知名院校学术背景。去年11月,他在贵阳高新区创立了数幄科技,团队采取“两条腿走路”策略:本土团队负责客户需求洞察,常驻新加坡、中国香港的博士团队牵头算法攻关。

为了解决“数据治理”这一难题,数幄科技自主研发了“全链路AI语义原生数据治理与智能应用一体化平台”,该平台由四个核心模块构成,形成了一条从数据连接到智能应用的数据治理全链路。

底层的多源数据连接器负责把企业分散在各处的数据源连起来,让业务人员随时查看各系统数据,解决数据“找得到”的问题。

第二层的元数据管理中台解决的是“数据可不可信”的问题,让管理者像管理档案一样管理每一个数据字段——这个字段叫什么、什么格式、允不允许为空、谁有权看。“更关键的是,平台会把这些标准自动编译成检测规则,定期在数仓里跑一遍,哪些数据不达标一目了然。”杨超然说。

第三层的AI语义治理平台则让治理过的数据真正“用起来”,内置的语义编译器,可以将业务人员提出“上个月华东区销售额是多少”这样的问题,自动翻译成查询的“标准口令”,确保同一指标只有一个口径。

最顶层的自然语言智能应用工坊,可以让业务人员用自然语言直接生成数据应用——上午提想法,下午就能跑起来,无需写代码、等排期,解决数据“用得好”的问题。

“平台还将大模型能力融入数据治理全流程,业务人员像聊天一样就能完成数据分析。”杨超然强调,整套平台采用“零数据存储”架构——不保存任何一条业务明细数据,所有查询和质量检测都在企业自己的数仓里实时执行。

目前,该平台已正式发布。这家成立不到一年的贵阳高新区企业,正沿着“让数据从可见到可信、从可信到可用”的路径,一步一步把AI从概念变成生产力。


记者:杨   婷



编辑:胡家欢
统筹:李红丽
编审:王丹丹