企业应用历程回顾及未来展望(三): 云时代的BI
一家云计算公司为什么要投入如此多的资金去收购数据可视化公司,仅仅是为了提升数据分析和展示的能力,从而为企业提供更多的服务么?另外,传统的BI厂商和云计算厂商结合后,是否会加速数据上云的过程,提升PAAS平台的服务能力呢 ?未来,商业智能最核心的价值和竞争力是什么
商业智能又被称为BI,主要指商业领域的数据分析和可视化展示。提到BI,最近的一则新闻似乎在行业里引起轰动,那就是领先SAAS公司Salesforce花了150亿美金收购了知名BI公司Tableau。
一家云计算公司为什么要投入如此多的资金去收购数据可视化公司,仅仅是为了提升数据分析和展示的能力,从而为企业提供更多的服务么?另外,传统的BI厂商和云计算厂商结合后,是否会加速数据上云的过程,提升PAAS平台的服务能力呢 ?未来,商业智能最核心的价值和竞争力是什么 ?
带着以上这些问题,首先还是来看下传统BI的价值,传统的商业智能主要是为更好地制订战略和决策提供良好的环境,为特定的应用系统(如客户关系管理CRM、供应链管理SCM、企业资源计划ERP)提供数据环境和决策分析支持。
当面向特定应用的特定战略和决策问题,商业智能从数据准备做起,建立或虚拟一个集成的数据环境。在集成的数据环境之上,利用科学的决策分析工具,通过数据分析、知识发现等过程,为战略制订和决策提供支持。整个过程中,集成的数据环境和决策分析工具是十分重要和不要缺少的。
那么,云计算时代的商业智能和传统的BI相比有哪些不同或者说结合的方式呢?
一、基于云计算模式的BI
1.1 云计算与商业智能结合
BI其实就是一种可视化应用和数据处理的能力。BI上云其实也就是利用云计算提供的海量平台。BI与云计算结合,或者说把BI转移到云计算平台上,将很大程度提高BI的运行速度、数据存储能力、数据分析能力、决策判断能力等。基础架构对应的IaaS平台可以提供基础设施,如虚拟化服务器,而PaaS云能够提供海量的数据存储空间,有助于企业存储越来越多的信息和数据。
最上层的SaaS层面向终端提供服务,按照不同的部署方式,企业的商业智能可选择公有云、私有云和混合云几种。
1.2 IaaS与虚拟服务器、虚拟存储、数据仓库
IaaS是指将IT基础设施能力(如服务器、存储、计算能力等)通过互联网提供给用户使用,并根据用户对资源的实际使用量或占用量进行计费的一种服务。IaaS所提供的资源是富有弹性的,也就是说,当用户需要的时候能够立即提供,而当用户不需要时候能自动回收。
虚拟服务器能够再一台物理服务器上运行多种虚拟服务器。而BI的最核心能力其实是位于PaaS层的数据仓库。当然,创建data warehouse直接在IaaS的虚拟服务器上就能完成。
BI最后给管理者提供的决策建议,其准确度与数据仓库的数据有很大的关系。高质量的数据越多,推荐的结果也更加精准。目前的线下服务器存储能力难以负荷巨大的数据信息量。将DW迁移到云上,有助于更大信息量的存储和分析。
1.3 SaaS与BI应用
SaaS是一种局域互联网提供软件服务的应用模式,它能够以较低的成本为用户提供软件服务,无需软件的安装、管理和支持等复杂的流程,使用户能够获得比本地更好的体验。
从架构成熟度上,BI在SaaS的实现以SaaS服务架构的4级成熟度为前提。4级成熟度包括表现层、调度层、业务层与数据层。BI实质上就是应用而已,构建在云上,显示出极佳的效果。
表现层提供SaaS的展示方式,决定应用能够实现的用户体验水平。BI的服务对象主要是信息技术人员,而不是管理者,BI的可视化效果将影响管理者对决策信息的接受程度。
所谓的可视化技术就是通过计算机图形学和图像处理技术,将数据转换为图形或图像显示等。展示层将BI分析得出的信息与结果用可视化形式表示出来,信息表达、解释和评估的可视化有助于理解所获得的信息并检验信息的实用性。
调度层将客户端发出的请求调度到何时的业务处理服务器上,提高SaaS的交付性能与资源利用率。业务层和数据层为BI应用提供支持。
与云计算技术结合的BI自下而上可划分为三个部分:最底层为基础层,负责BI的数据仓库、存储处理计算等;中间层为平台等,提供编程接口、逻辑实现等功能;最表层为实现层,根据用户的个性化定制,把数据分析的结果呈现给用户。
1.4 私有云、混合云和BI的结合
所谓的私有云,有点像云计算的基础设施,使用虚拟化技术,位于私有数据中心。私有云之所以更受企业认可,是因为私有云比公有云更有私密的保护性。虽然因此其共享性受到影响,但是由于BI里面分析的数据都是企业内部数据,采用私有云可以对数据进行较好的保护。因此BI上到私有云上,不仅可以使数据得到一定的保护,还可以享受云计算带来的便利。
所谓的混合云,就是公有云和私有云的结合,是在云中存在两种或者两种以上云的类型。混合云涵盖了公有云和私有云的属性,使得用户的数据和应用能够根据不同需要在不同的云中迁移。它使企业既有自己的云计算环境,同时也能够使用外部公共云计算的服务。兼顾了公有云的成本优势和私有云的安全性,受到企业的欢迎。
1.5 基于云计算的BI的优点
BI上云主要有以下几个优点:
- 提供更强大的数据存储和管理能力:面对海量的数据,传统的数据仓库模式已经难以满足当今的需求。基于云计算模式的商业智能可以通过虚拟服务器、虚拟存储等服务,提供给企业更强大的数据存储和管理能力。
- 提供BI的实时性:企业的现状,包括业务信息、客户信息等不断变化,要做出更为准确有效的决策,这就对BI的实时性提出了更高的要求。基于云计算模式的BI具有更快速、高效、稳健的运行性能,同时扩展性极强。
- 硬件冗余自动故障切换:云计算将BI所需的数据、应用进行分块,建立在副本,保存在不同的服务器中,避免了物理硬件的损坏。
- 负载均衡:云计算BI能够将工作均匀分配到不同服务器上,避免个别服务器工作负荷过大,让BI性能发挥到极致。
- 个性化定制:将BI构建在云上, SaaS将从展现层、业务层、数据层等方面,提供更人性化、更符合企业自身的可定制化配置和用户可自定义功能。
- 成本低:基于云计算模式的BI更符合企业追求低成本的理念,有助于扩大BI在中小企业中的发展力度,吸引更多的企业商家选择BI。
1.6 应用前景
云计算模式下的BI,企业可将大量数据存储到云中,减少企业硬件成本,获得弹性的存储量大小。
在SaaS上,BI可提供不同的扩展包,分为基础包、专业包、企业包。企业可根据自身需要购买不同层次的扩展包,这三个包给企业提供了更多的选择。
BI所依赖的云,在现阶段主要是以私有云为主。虽然公有云的成本更低,但是安全性还有待时间的考证。然而,随着云安全性的不断提升,可以预见,BI将逐步有私有云迁移到公有云,毕竟公有云成本更低。
随着云计算技术的不断完善,BI必将逐步迁移到该平台上,不同类型的企业都会逐步尝试采用这种低成本、高效率、可扩展的模式,具有广大的市场机会。
二、基于云端的数据处理能力
相比于传统的OLTP和OLAP,云端的数据处理目前最核心的技术在于机器学习,这也是为什么最近Apache Spark变得越来越流行,大有取代hadoop之势。因为Apache Spark除了性能更好以外,更重要的是融入了先进的机器学习库,可以建立聚类和预测模型,高效实现业务场景。
从业务层面,传统的BI分析仅仅能够展示现有的数据统计信息,没有任何趋势分析和决策建议,对管理层无法带来实质性的价值。而借助人工智能技术,建立的数据模型具有前瞻性和参考价值,帮助管理者洞察业务关键信息。
标准BI和机器学习的结合模式如下图所示:
从运营成本层面,本地建立机器学习模型成本非常的高,不仅需要昂贵的硬件设施,而且必须雇佣专业的数据科学家。而数据上云以后,可以直接建设在第三方的IaaS和PaaS平台上,调用第三方供应商开发的机器学习模型也相对简单高效。当然这个也带来了接下来我们要讨论的一个企业担忧的问题 – 云端安全。
三、云端安全性探究
3.1 安全性隐患
云计算的安全性一直是备受关注的问题。云安全主要包括系统安全和数据安全。在云计算环境下,用户对云计算数据中心的强依赖性,以及云计算服务对网络条件的高要求,系统安全目前非常受重视。
虚拟存储等服务,实际上是将企业的内部数据外包给服务商,使得数据的私密性成为了云计算服务的一个困扰。但是建立正确的安全模型、选择正确的安全方法,那么在云计算平台上可以实现对数据、系统安全性的保证。
3.2 安全解决方案
在基于云计算的BI中,针对安全问题,可以封装一个安全层。云模式BI的安全模型构建主要包括三个层面的安全性保障措施:基础设施层、底部架构层、数据信息层。
在基础设施层上,根据安全防护需求,将云计算划分成几个安全域。各安全域之间通过防火墙进行隔离。虚拟机接收到的包必须经过虚拟网卡。这个虚拟网卡是通过 Host OS创建的,可对经过它的包进行过滤选择。倘若某个包是发往不允许接收的端口,则虚拟网卡会丢弃这个包,以免端口收到攻击。通过防火墙的隔离,确保安全域之间的数据传输的安全性和稳定性。
由于云计算需要建立在互联网上,因而对基础网络的安全性也有要求。云计算BI的平台应进行统一IP地址规划,对各部分再进行IP地址和数据链路地址绑定。此外还应建立异常流程监控体系,以防网络收到攻击。
在底层架构层上,主要针对的是IaaS服务。解决方法之一,就是将一系列虚拟机进行划分,在同一区域内的虚拟机拥有一致的安全水平,相互之间可以安全交换信息,并与非该区域的虚拟机隔离,通过特定的安全策略与可信虚拟域外的虚拟机进行通信。所有加入可信虚拟域内的虚拟机都需要事先通过安全认证。
在数据信息层里,可采取数据备份、身份认证、权限管理、加密传输等技术,实现对数据信息安全性和安全性的保护。为防止数据不慎损坏,需要对数据信息进行备份与恢复。通过对用户身份认证,确保以身份进行操作的操作者就是这个数字身份的合法拥有者,也就是保证操作者的物理身份与数字身份相对应。
结语
回到我们开始谈到的那则新闻,不难理解Salesfroce为什么要花大代价采购Tableau。主要还是因为Salesforce拥有大量的用户数据和云计算能力,而tableau拥有从数据仓库到数据分析和报表完整的BI产品体系,两者的结合可以增强彼此的产品和服务,将BI部署到云上,产生更强的竞争壁垒。
BI与云计算的集合是当下热门的问题。基于云计算模式的BI,其本质还是BI,云计算只是一个平台,它结合了两者的优势。云计算的海量存储、数据挖掘能力,为BI提供了良好的基础,同时其拥有的相比传统模式更为低廉的收费,使企业减少成本,有助于吸引中小企业的加入。
BI的核心竞争力在于机器学习等AI技术的植入。将BI与云计算结合,其强大的功能将为企业管理带来前所未有的助力。
本文由@静空一叶 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
- 目前还没评论,等你发挥!