注册 | 登录 关注微信 | 海创汇APP 中文 | EN | RU
首页 全部动态 详情

【海创汇创业故事】DataPipeline——助力企业寻找大数据时代的精益增长

2019-08-23

尤尼加速营

尤尼加速营,是海创汇重磅推出的创业加速服务品牌,以大企业产业资源赋能为核心,将创业项目发展需求与产业转型升级需求相结合,从全球范围筛选出优质项目,为其提供精创课程辅导、产业资源赋能、投融资对接、创客空间支持等全方位加速服务,为创业者开拓新视野、碰撞新思维、探寻新路径,为创业项目助力加速。

本期介绍的是海创汇尤尼加速营成员企业,DataPipeline(数见科技)。

DataPipeline成立于2016年3月,专注为客户提供批流一体的数据融合平台和解决方案。其核心团队分别来自谷歌、Yelp、亚马逊、IBM、甲骨文、中科院等国内外知名企业,借助数十年大数据开发和项目经验,帮助客户更敏捷、高效地实现复杂异构数据源到目的地实时数据融合和数据管理,从而支撑客户通过数据分析更精准地驱动商业决策和业务决策。

1 (9).png

数据集成市场已然形成

根据中国社科院发布的《中国大数据应用发展蓝皮书》显示,中国大数据行业正在快速发展,随着企业、政府对数据价值的认知不断提高,大数据的利用正成为新一代信息技术服务的发展方向。

1 (1).jpg

然而在现实中,中国企业在大数据流通、交换、利用方面大部分还处于起步阶段,关键原因是没有做好数据集成、数据清洗、数据同步等基础工作。究其原因,在于大数据的利用存在诸多问题:数据来源众多、体量巨大、储存分散、格式多样,形成大量数据孤岛。这些数据孤岛不可知、不可取、不可控、不可用,虽然数量庞大,却难以整合利用并从中获益。

目前传统的解决方法,通常是采用编写ETL脚本等方式进行数据迁移管理。数据处理耗时长,无法实时同步,缺乏高并发能力。同时,前期投资金额大,后期维护成本高。

这些问题的存在,催生了企业应用数据集成市场。在该领域中,既有Oracle、SAP、微软、Informatica等传统的国际巨头,也出现了DataPipeline这样令人眼前一亮的创新型中国本土企业。

DataPipeline,翻译过来可以称作“数据管道”。长期以来DataPipeline一直致力于帮助企业连接内外部的数据孤岛,实现数据的交换与融合。DataPipeline创始人陈诚曾经任职于谷歌、Yelp等知名企业,负责构建大数据应用软件,节省用户使用数据、数据流转的成本,提高数据利用效率。陈诚在数据应用方面深耕多年,拥有了充足的技术积淀,为创业打下了雄厚技术基础。

WechatIMG412副本.jpg

DataPipeline创始人 CEO陈诚

“大公司里搭建大数据应用平台也需要耗费巨大的人力、财力等资源,能否把平台做成相对标准化的解决方案,提供给更多的客户,而不需要自己去搭建,让他们能直接从产品中获得比较成熟的解决方案,赋能客户呢?”基于这个思考,陈诚于2016创立DataPipeline,目标是为客户连接一切数据、应用和设备。在陈诚看来:“现在大家常说的万物互联,其实连接的就是数据,实现的就是数据的流转与交换。为能帮助更多的公司、企业、个人做到这一点,DataPipeline想提供更好的服务和更好的软件。”

1 (4).png

认知数据应用集成赛道

随着时代的发展,科技的进步,DataPipeline所在的数据应用集成领域,也在不断发生变化。

第一,情况较以前更加复杂。复杂,体现在存储形式,原来可能只有一些数据库中的结构化数据,但是现在有结构化、半结构化、非结构化数据,云上、云下、混合云的途径,数据库和数据仓库的对象存储等。在过去的十年里,有太多的复杂度被加入到客户的需求当中来。 

第二,时效性更强。以前的数据流转比较慢,商业整体运转的速度也会慢一些。而现在企业根据数据做决策的速度加快,时效性也随之不断提升。

第三,对于数据或者是业务变化导致数据需求变化,从而导致数据架构变化,变化频率越来越快了。这就意味着用户的IT架构、软件和整体发展战略都需要能适应这种变化。  

面对这三大挑战,陈诚认为挑战与机遇并存,在此期间也必然会诞生新的机会。

1 (8).png

“之所以选择数据应用集成作为创业领域,就是考虑到其蕴含着较大的市场规模和潜力。首先数据和应用集成是所有大数据项目必不可少的组成部分,数据项目或者数据应用、大数据变现,一定要完成数据的采集、清洗、整合,采用自动化和实时化软件,让数据利用变成一个低成本,高效率的过程,否则就和传统数据应用过程一样效率低,成本高。其次,随着越来越多的大中型企业开始重视大数据,投入到相关项目或是产品中的资源也相对增加了。相关数据表明,2017年全球数据应用集成市场纯软件规模是320亿美元,如果包括人工在内,将达到3940亿美元”。陈诚表示,“如果我们把数据想象成商品,DataPipeline想通过构建一个智能化无人商店,让客户可以按照自身需求自由选择所需商品。在这个行业里有一句话叫‘Garbage in garbage out’,如果传递的数据是垃圾,那么产生的数据价值也是垃圾。DataPipeline一直致力于保障数据质量、来源都是可供、可追溯的。”

差异化与领先优势

虽然市场巨大,竞争的企业很多,但格局远没有定型。在新一代云化、大数据实时化的数据应用集成方面,相对来说新的玩家偏少。中国在数据应用集成领域的企业实际上是比较缺失的。就目前而言:一方面,一些企业偏重数据集成,一些偏重应用集成;也出现了像阿里这样做数据中台的企业,覆盖面会比创新企业广,或多或少都会有一些差异化;而在基础技术创新方面的企业更少。另一方面,市场上也有一些应用长达十年的工具,都是基于传统的软件架构;而新出现的偏云化,能部署在云上,以分布式架构支持大量数据和实时应用的工具还是比较少。

1 (3).png

为了在数据应用集成赛道上形成差异化优势,DataPipeline将目标客户集中在金融、零售、制造,地产、互联网行业,大多具有“大中型企业”、“数据价值密度较高”、“看重数据的时效性”等特征。

“我们的差异化战略主要包括五方面:第一,支撑有大数据应用需求的大中型企业;第二,应用可以部署在云上;第三,实时性要求高,与以前批量化的不太一样;第四,能够支撑业务、数据、架构的变化;第五,用户体验方面,更强调自动化、智能化”陈诚提到。

基于差异化功能和智能化的体验,DataPipeline目前已经成功服务了星巴克、金风科技、龙湖地产、财通证券、叮当快药等大型企业客户。在技术上,DataPipeline基于Kafka的开源框架,聚焦流式数据处理、高性能同步,快速解决数据融合问题。

在产品上,DataPipeline是一款批流一体的数据融合平台,无需任何代码,通过可视化图形配置界面在极短时间内便可完成实时数据管道连接,是一款提供数据管道搭建、数据任务管理、数据质量管控、可视化运维管理、错误队列管理、用户管理以及元数据管理等一站式的数据融合平台。

获得资本市场的青睐

2017年年底,DataPipeline完成2100万元的A轮融资,由经纬中国领投,峰瑞资本跟投。2019年4月,又获得了数千万元的A+轮融资,主要由BV百度风投领投,经纬中国、清流资本跟投。在资本寒冬的当下,这是非常难得的。

“目前企业服务或是产业互联网发展进入了快车道;应用数据集成市场增长可期,用户需求也比较大;资本愿意投资企业服务细分领域的头部企业;DataPipeline在市场上得到了客户的认可,客户也愿意为我们背书。” 陈诚说,“未来,我们会继续坚持既定的策略,坚持以技术驱动来服务客户。同时会持续投入资源在客户成功上,为客户带来更大的价值。”

有意向沟通DataPipeline解决方案请与我们联系

联系人:方老师 137-8064-7068

            崔老师 185-2415-3394

海创汇动图2.gif