明略数据创始人兼董事长吴明辉
从2015年开始,大数据就已经被移出了新兴技术炒作曲线。而当2011年8月首次出现该曲线中,当时预计大数据技术需要2年到5年才能进入企业的实际生产型应用中。从那以后,大数据就迅速被热炒。然而,就在2017年的今天,市场上依然看不到有效的商业模式。
根据国家信息中心《2017中国大数据发展报告》,2010年起开始大量涌现大数据创业公司,目前仍然呈现增长趋势。但调查显示,目前大多数创业公司仍处于天使轮和A轮阶段,仅有13.04%的企业处于B轮,仅有8.94%的企业到达C轮及以后,这说明多数大数据企业仍处于发展初期。
2017年,曾经是大数据创业公司代表的成功IPO,但其市值远低于之前的融资估值。除了基础技术平台和技术服务以及营销、客户和企业运营优化等应用外,是否还存在其它更有效的大数据与行业应用相结合的路径? 如何更有效地结合人工智能?2017年8月22日,即将宣布C轮的明略数据,作为一家中国大数据创业公司给出了自己的回答,这就是知识经济。
企业级知识图谱:一个独特的大数据商业化方向
2014年创业的明略数据,以大数据为创业方向。2017年初,明略数据提出了“行业人工智能大脑”,到了8月22日即推出了包括了中国市场上首个企业级知识图谱数据库“蜂巢”和企业级人工智能统一入口“小明”为核心的行业人工智能大脑“明智系统”,并明确提出了把企业级知识经济作为大数据与行业应用相结合的新方向。
以“明智系统”为代表,明略数据初步形成了包括数据处理、从数据治理到形成数据知识的知识图谱引擎CONA、用于存储的知识图谱数据库NEST(即蜂巢)、形成业务知识的行业大脑“明智”以及用于输出知识的新一代企业级人机交互平台“小明”,由此形成了一个把知识经济在企业级市场落地的大数据商业化模式。
之前,明略数据对外有MDP大数据处理和存储平台、大数据分布式计算平台、SCOPA可视化大数据关联关系挖掘应用平台即明略的上一代人机交互平台,而CONA和NEST都属于隐藏在这三大平台下的支撑技术系统。随着“明智系统”的推出,明略数据原有的产品架构将全面融入“明智系统”, “小明”也将和SCOPA并行成为明略数据的新一代企业级人机交互平台。
所谓知识图谱,可以理解为信息的结构,即用数据挖掘、信息处理、知识计量和可视化图形显示出来,揭示知识的动态发展规律。知识图谱在互联网领域最成功的商业模式就是搜索,此前谷歌的 Graph就构建了一个与搜索结果相关的知识体系,大幅提升了搜索的精准度。
明略数据创始人兼董事长吴明辉表示,把知识图谱应用到企业级市场,是大数据与企业应用相结合的一个新路径和新模式,有着巨大的商业价值。以前的企业信息化,是把企业流程结构化、电子化、自动化;而现在的智能化,则是把企业人员大脑中的知识提炼出来,形成企业及行业知识的结构化、电子化和自动化,这样才能够真正发挥大数据的价值。
大数据+人工智能=知识经济大时代
1996年,联合国经济合作与发展组织在一份题为《以知识为基础的经济》的报告中,对“知识经济”首次给予了明确的定义:“知识经济是建立在知识和信息的生产、分配和使用之上的经济。”一个区别于农业经济、工业经济的新经济形态开始兴起。
然而,直到近两年来,随着云计算、大数据和人工智能技术的全面成熟和相互融合,一个知识经济的大时代才真正开始。以深度神经元网络为代表的人工智能技术在2016年全面成熟,的、微软的CNTK和DMTK、加州大学伯克利的Caffe等开源人工智能框架和算法软件已经可以商用,各大公有云厂商也推出了大规模的人工智能云服务。
而深度神经元网络的输入数据,其本身就是带标签的数据信息,所谓“标签”就是人工标注的知识分类,比如人工把一张图标注为“花”,从而让深度神经元网络模型“认知”这张图代表了“花”。换句话说,标注数据的过程本身就是信息的结构化与知识化,经过深度神经元网络为代表的人工智能处理后就能形成可自动化输出的知识体系以用于决策支持。
明略数据的MDP大数据处理与存储平台,就能够实现数据的智能化打标签。MDP可实现数据资产管理、元数据管理、数据知识管理、数据质量管理等数据管理与数据治理功能,通过自动化、智能化的数据识别、分类、标签技术,发现、还原、构建和管理数据的数据字典、数据特征、数据轮廓、数据关系、业务涵义等,从而更快、更好、更直观的理解数据本质。
而明略数据的知识构建与管理平台通过规则和机器学习等手段,用大数据分布式挖掘技术,快速从信息中提取和构建知识,并对知识进行固化和管理。可快速应用人工智能技术构建业务模型,并在生产中快速部署和使用;同时提供规则、模型、工具等各种知识管理与分享功能,让知识能够在企业内部有效的积累和使用。
基于MDP、和SCOPA,明略数据在过去三年为公安、金融、工业等业务场景进行了数据治理,已经积累了几百条业务规则,其中包括为泰康人寿实施的基于知识图谱数据库的寿险营销分析平台、为某公安部门实施的基于知识图谱的关联关系研判实战平台、为中国中车实施的关键设备状态故障监测与自动分析等。
基于这些业务规则形成的知识图谱,如今被用于金融、公安和工业等三大“行业大脑”,成为机器大脑中的知识库,而自动化的知识体系通过人工智能交互接口“小明”输出,就能形成撬动知识经济的商业模式。
发现知识经济的创业路:产品经理主导的进化
2014年创立的明略数据,其前身是秒针系统,是一家大数据营销技术公司。2006年,吴明辉从北大计算机系硕士毕业后,带着自己的大数据处理平台科研成果创立了北京秒针信息咨询有限公司,“秒针系统”为核心产品。当年创立“秒针”主要是当时还没有等开源大数据技术,而吴明辉当时的大数据处理技术在国内处于领先水平,“靠着技术吃饭就行了”。
2014年的时候,发生了斯诺登事件,让吴明辉看到了历史上难得的商业机遇。于是吴明辉决定把“秒针”积累的大数据技术拿出来产品化,做国产的数据技术平台,这就是MDP以及由此创立了明略数据。在2014年的时候已经出现了不少基于和Spark的大数据创业公司,把和Spark等开源大数据技术进行商业化。技术的同质化,让吴明辉一边创立明略数据,一边思考未来的可持续竞争力来自哪里?
在推广MDP的过程中,明略数据开始接触各类客户,包括最早的银联。2015年的时候开始接触公安类客户,才发现在公安业务场景里真正把大数据用起来了,而且能创造很大的价值。而很多其它行业场景,虽然一上来就先建大数据平台,但建完了以后其实并不知道要做什么。公安业务场景率先发挥了大数据的业务价值,这促使吴明辉思考今后的方向,“最终还是要与行业应用相结合”。
“明略数据今天做的数据结构化,其实就是在构建行业知识和知识图谱。我们从最早做国产大数据技术平台,到后来开始思考数据的应用,最后找到了人工智能的方向,再通过人工智能走向知识经济,这就是我们发展的路径。”如今,明略数据正在构建各行业的知识图谱建设,通过明略知识工程完成人工智能的可复制行业应用。
吴明辉表示,明略数据致力于将人工智能应用到行业,提升行业知识转化为企业竞争力的效率,让企业和组织在专业领域更高效。而明略知识工程,指的就是“明智系统”。明略数据近400位员工中,75% 左右为技术专家,核心团队来自清华、北大等,他们正在一起创造知识经济的未来。
“大数据产业在过去三年里有很多创业公司都融钱了,但这一波有一点过火了。这个行业发展到今天,必须要把数据转换成价值,才会持续的增长。不能创造价值的公司,最终都会倒掉。”吴明辉表示,“人工智能也是一样,要把它真正的商业化。光靠VC打鸡血是不行的,最终企业一定要有自己的造血能力。”
明略数据经过36个业务领域的探索,与688位客户的深度接触,将图数据技术落地到行业应用中,构建了适合多维多层关系挖掘的企业数据架构,经过关系关联挖掘找到业务规律,为决策者提供用于解决问题的结构化信息——知识。如今,通过公安、金融、工业与物联网三大行业的客户一同构建行业知识图谱、开展决策智能自动化工程,明略数据找到了大数据落地的商业化新路径。
吴明辉说他本来是一个科学家,在创业过程中逐渐转型为产品经理,而明略数据今天的产品和产品方向就是产品经理思维主导的结果。“我是搞技术出身的,做企业以后就变成了产品经理了。我跟团队一直在聊,不管是做ToC的业务还是ToB的业务,最本质的方向是什么?就是思考客户需要,做什么样的产品能够产生和沉淀用户价值,这是核心。”
“互联网行业里开源的越来越牛,单纯做底层的引擎已经没价值了。这时候就会发现,底层的引擎再加上行业理解,才有可能把数据价值发挥出来。”吴明辉说,“当开始思考行业理解的时候,一种打法是做每个行业的个性化解决方案,这个过程会发现又跟传统企业级服务厂商一样了。而我们是一个产品公司,一定要思考怎么最有效率地提供服务,最后发现人工智能这样的引擎,所有客户业务一个引擎就能解决了。人工智能就像微信,一个应用就能集成所有的服务,而背后的引擎就是知识图谱。”
从大数据创业到“行业大脑”的商业模式,明略数据找到了一条与众不同的大数据和人工智能商业化路径。而这个方向的选择,也契合了全球即将进入知识经济大周期的阶段。这虽然是一种运气,但与吴明辉十多年的技术坚持、从科学家转向产品经理的勇气、不断探索商业化的决心等都密切相关。
接下来,明略数据还准备与更多的行业专家或团队合作,甚至可以是资本层面的合作,共同推进“行业大脑”。由此,一个知识经济的大时代,即将开始。(文/宁川)
有话要说...