大数据技术与行业应用融合正在加速,企业对大数据的需求变得日益旺盛,当其他公司还在大谈大数据解决方案概念时,一家由Teradata、华为、阿里等知名企业大数据科学家创办的创业公司——睿帆科技,早已研发出大数据科学平台、分布式分析型数据库等产品,并在通信、政府、公安安防、旅游等领域形成落地案例。

基于大数据产品,构建全新决策引擎

作为一家业内技术领先的一站式大数据解决方案公司,睿帆科技研发的底层大数据科学平台产品Baymax经过多年打磨,已经能够提供PB级的异构数据接入、存储、清洗、治理等数据处理能力,从而支持睿帆科技在面对通信、政府、公安安防、旅游等领域多样化的大数据需求时都能轻松应对。

与各个领域客户深度合作过程中,睿帆科技发现,目前客户对大数据技术的需求正在发生深刻的变化:

首先,传统数据仓库更多是对结构化数据处理能力强,对非结构化数据处理能力较弱,但大数据深度落地行业时,需要进行行业深度数据挖掘,处理非结构化数据能力不可或缺。

其次,大数据技术的落地从监测、洞察逐步迈向分析、决策过程中,不再是像传统BI一样,给出报表和分析结果,由业务人员做进一步决策,而是机器本身要能做一些简单决策,需要机器更加智能,能够理解业务逻辑。

第三,当大数据更加贴近应用时,客户群体正逐步由IT人员变成业务人员,需要降低大数据的使用门槛,让技术平民化,获得更好的用户体验。

基于上述需求的出现,睿帆科技逐步将大数据科学平台、分布式分析型数据库等产品加入到决策引擎中,满足不断产生的新需求。

在公安、政府等行业,睿帆科技采用分布式分析型数据库(雪球DB)应用方案,满足了客户对极速高并发在线即席数据查询的需求;而在通讯领域,睿帆的大数据科学平台(Baymax),可以使中国移动、中国联通、中国电信很好的解决数据日增PB级数据量的难题,从而极大提升客户对大数据的应用分析能力。

目前,睿帆科技是中国移动最大的大数据合作伙伴,为全国近一半的省份提供大数据服务支持。

睿帆科技CEO兼联合创始人 于海中先生

近期,记者来到位于北京的睿帆科技总部,与公司CEO兼联合创始人于海中先生进行了一场关于大数据技术和行业趋势的畅谈,他对睿帆科技的产品当前落地场景、面临的挑战,以及睿帆科技在大数据领域的实践进行了分享:

记者:当年创建睿帆科技的初衷是什么?

于海中:我在日本留学硕士毕业后,工作于日本最大的软件集成商NTT Data。工作中接触到车联网技术,此后从事了8年的车联网系统开发及运营,在这过程中充分认识到大数据技术发展及运用将会给企业带来革命性的发展。恰逢其时,我和几个就职于阿里巴巴、华为、Teradata的小伙伴商讨创业想法,大家一致认为,中国的信息技术发展速度全球领先,并且随着互联网、物联网、人工智能等技术的深度融合,必将催生庞大的大数据技术应用需求,大数据创业正当其时!于是,一拍即合果断选择创办了这家睿帆科技。

记者:睿帆科技的业务发展战略是怎样的?

于海中:睿帆科技的目标是成为全领域全行业的一站式大数据解决方案供应商。所以第一阶段,我们将业务主要聚焦在通信领域,服务于三大运营商,深耕结构化数据领域。目前,我们是中国移动最大的大数据解决方案供应商,为全国近一半的省份提供大数据支持服务。

下一步,我们要继续深耕通信运营商领域的同时加大公安安防、政府、轨道交通、金融等行业的投入,切入非结构化数据领域。18年我们已经与广东公安、广州地铁的重要供应商达成合作,相关产品和方案已经在落地试点,相信很快能够看到我们在这个领域的新突破。

远期,我们将打通大数据产业链上下游,目标成为全领域全行业的一站式大数据解决方案供应商。

记者:为什么会有这样的选择呢?

于海中:我们的产品优势在于比其他大数据产品处理数据量级要更大、稳定性更强和运行速度更快,只有在PB级数据、应用复杂的领域才能发挥优势,而运营商领域恰巧满足这些点。但运营商的数据多半都是以结构化数据为主,要想成为全领域全行业的一站式大数据解决方案供应商,还需要面对非结构化数据,所以我们的第二阶段战略是切入公安安防行业。

政府、金融和轨道交通行业也是时下对大数据需求比较高的行业,我们现有的产品即可满足这些行业的需求。

记者:能够服务像中国移动、中国联通、中国电信这种大客户,其核心的壁垒是什么?

于海中:首当其冲的当然是过硬的技术实力,我们是少数真正在实际环境中能够处理PB级数据的企业。纵观整个大数据行业,大数据处理产品竞争是相当激烈的,各家企业都以开拓市场为目的,利润空间有限。为了方便公司业务拓展,这些大数据公司对外宣传都具有PB级数据处理的能力,实则只是在模拟环境下做过相关测试。

 

实验环境和应用环境的大数据承载量、数据复杂程度及数据质量是不一样的,尽管在实验室场景下能完成PB级别以上的数据处理,但在实际应用场景下就会出现意想不到的问题,这些问题有时只会造成服务器卡顿,有时会出现宕机,甚至硬件损毁。

 

我们在实验室环境下早已具备PB级数据处理的能力,但在实际环境中第一次日增数据量达到500TB时,我们很紧张。当时专门增加了两名运维工程师24小时轮班观测。果不其然,在连续2天日增数据量超过500TB时,出现了在模拟环境下从未遇到过的问题。我们对此也作了充分的准备,按照预案一点点排查一直加班到凌晨2点,顺利解决。

 

后来当日增数据量达到700TB的时候,我们依旧有些小紧张。为了防止意外我们依旧安排了运维团队值守,但运维团队在观测3天以后服务器没有出现问题,我们就确信PB级以下数据都可以稳定的运行了。

直到现在,日增数据量已经达到近PB级别,我们的大数据科学平台在服务器上依旧保持稳定运行。

 

记者:长期来讲,客户群体定位都会以头部企业大客户为主吗?

于海中:基本上可以这么说。因为大数据行业的特殊性,注定在客群定位上睿帆科技倾向于大客户。在重点布局的通信领域,其对大客户的定义主要是三大运营商,在公安安防领域主要是一二线城市,这些客户大数据制度及标准完善,具有很强的大数据业务需求。

大数据科学平台Baymax截图

记者:能否重点介绍一下大数据科学平台Baymax?

于海中:大数据科学平台Baymax是我们自主研发的大数据处理平台。我们在长期与客户的接触中发现,企业客户对大数据的需求不明确,且引入大数据产品通常需要较高的人力成本用来开发。因此,我们在平台的“易用性”和“可视化”方面下了不少功夫,将大数据科学平台Baymax设定成可拖拽流程图形式,同时为其预置了多种数据处理节点和常用算法,使得企业技术人员无需拥有大数据底层开发经验,即可自主完成数据处理、数据分析、数据融合、数据管理、数据检索、流程开发、交互查询、模型部署、任务监控、流程管理、业务管理等多项功能,并加快项目实施进度。

 

记者:除了大数据科学平台Baymax,睿帆科技还有哪些产品?

于海中:我们还有分布式分析型数据库雪球DB。雪球DB主要服务于对查询效率及速度需求比较高的客户,雪球DB支持高并发在线即席查询,百亿级数据数百并发查询速度在毫秒之间。

记者:如此优秀的性能,适用于哪些场景呢?

于海中:比如公安安防领域的交通卡口。据统计每个交通卡口每天上传的数据超过1亿条,常规的大数据技术很难支持在这么高的数据量下极速查询,而分布式分析型数据库雪球DB刚好可以满足这个需求,目前已经在某省公安的安防系统中上线。

记者:能研发出来如此高性能产品的团队,我很好奇公司的团队架构是什么样的?

于海中:2018年我们团队扩大了一倍,目前有近60人,其中技术团队有30人,业务团队23人。从人数上就可以看出我们的团队架构有别于技术导向性企业,是业务和技术五五开,齐头并重。作为一家大数据企业来说,技术能力是绝对的核心,但既然是做TO B或者TO G的业务,业务服务能力也是决定企业长远发展的核心。

记者:您认为,做Hadoop相关业务的公司未来有机会做大么?

于海中:可能纯做Hadoop发行版机会不大了,但做更广泛一点的Hadoop服务商是很有前景的,比如说,公司有大规模团队帮客户做维护,或者找到更好地具体应用场景,提供一站式的大数据解决方案。

记者:睿帆科技2019年在哪些行业落地进展更快一些?

于海中:从发展速度来看,公安安防、轨道交通领域的大数据发展速度应该是最快的,公安安防领域在2019年将大数据作为非常重要的战略方向,大数据的需求非常旺盛,发展很快。其它行业,包括政府、金融等领域也齐头并进,不断地有项目落地。