在如今大数据时代,企业或市场的一举一动都会形成大量数据,因此数据驱动型企业的概念也应运而生。

相较于完全依凭经验决定决策,数据驱动企业使用更严谨谦卑的态度,以数据分析得出的证据作为业务决策的基础,在一定程度上加深企业对自身与外界的洞察,提高决策效率与正确率,从而创造更高的利润。

但要做到数据驱动决策并非画个仪表盘那么简单,它往往要求企业基于数据本身发现机会的能力,也就是说企业数据本身至少需拥有敏捷性、交互性、严谨性,且高质量。因此,构造优秀的数据管理系统来治理企业数据资产也必然成为数据驱动与商业智能的基础。

挑战:Multi D-system 复合数据生态

根据我们自由创始人科技了解与解决过的案例,当今数据管理的最大挑战之一是复合的数据生态,可以从数据存储的多样性商业环境的多重性两个角度解读。

数据库的多样性:

数据管理发展至今已有多种不同数据结构模型应用于各种数据库,其中以Relational关系型数据库与四种NoSQL数据库(Document,Key-value,Column-Oriented和Graph)最为广泛。

(这里要提一句,也是很多小伙伴的常见疑问:云数据库并不是某个特殊结构的数据库,而是各种类型数据库的云解决方案。关于它的优缺点我们日后会另开一章详细介绍。)

这些各不相同的结构模型赋予数据库不同的特性,适用于解决不同的数据结构。比如关系数据库虽然可以轻易解决库存与财务等数据,但处理社交媒体的图片内容则有些困难,这时可以搬出NoSQL的图数据库轻松处理。

因此,为了处理多种不同结构的数据,大部分企业会选用多个不同种类的数据库来存储数据。同时,为了更好地满足数据需求,一些NewSQL也将多重NoSQL的特点组合进单一数据库中,这样的数据库被称为multischema或 multi-model database,举例如MarkLogic

面对这些种类繁杂的数据库,如何选用最适合自己的数据存储方式,如何以最合适的结构存储数据,及如何在数据中心间交互协作,都是企业需要下功夫思考的问题。

初创死因
图源:Modeling Schemes and Notation(credit: DAMA DMBOK2)

数据商业环境的多重性:

除数据库的复合以外,还有数据商业环境的多重性。传统的数据管理系统往往是一体化中心化的,基于单一的商业生态系统进行部署,然而当代企业的数据并非仅仅储存在自己的数据环境中。当企业们使用诸如云数据库服务DBaaS、SaaS、第三方服务时,数据资产就会被分散在多个应用、平台与环境中。这样的数据去中心化特性和传统高度集成的数据管理模式显然相悖。

随着互联网科技和企业数据需求的发展,如果初创企业无脑沿用过时的数据管理策略,或任由数据分散在不同平台中不做管束,很有可能造成数据重复、滞后、无法交互等后果,使数据分析、数据驱动,甚至数据存储变得困难,这在竞品众多、需要快速迭代发展的市场中必然十分致命。

被数据管理拖累企业发展的问题并不罕见,早期初创企业可能由于数据量级过小自觉无需处理这样的问题,但越过第一阶段的发展期公司或许就因此开始面对“四处打补丁”的窘境,此时想要推翻原有数据结构重新部署耗时耗力耗财,使决策者陷入两难。

我们合作的一个Makeup科技初创就曾面临如此局面:

由于早期分不同批次开发并推出网站、实体硬件产品与APP,该公司的数据分别且重复储存在Shopify、本地MySQL数据库、google文档与AWS中,且这些数据中心各自独立,不进行交互与查重。这样杂乱的数据架构直接导致了网站与APP内容不匹配,用户信息需要手动更新,难以进行商业智能分析等等弊端。

后来经过我们自由创始人科技的帮助与梳理,为各个数据中心设计了合理的交互逻辑,将数据资产规范化、唯一化,解决了数据不匹配等问题,并未日后发展留足可拓展空间,同时为其定制了完善的数据分析与数据驱动决策流程。如今这家初创已经成功完成新的一轮融资,并达成用户指数级增长。

结束语:数据应当是帮助决策的利器,不要让它成为公司发展的拖累。选用合适且具拓展性的数据库组合、制定有远见数据架构(data architecture)与数据管理(data governance)与数据分析战略,同时及时根据企业发展与科技进步进行迭代更新都是极为重要的,且在公司早期就要开始着手,万不可忽视。

如果您也有类似的数据战略与管理问题或者困惑,都欢迎扫一扫下方二维码与我们交流!自由创始人科技在数据架构、商业智能等方向上都可以给您提供最高性价比的建议和解决方案。

我们一直保持学习、更新知识,希望我们的见解与知识能对您有所帮助。