疫情过后，走出寒冬后的人工智能何去何从

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

荆飞瑶

2020-05-26

0 评论 2932 浏览 8 收藏

11 分钟

千万不要浪费一场危机。

——丘吉尔

疫情期间，杭州的城市大脑，健康码、阿里全基因测序、CT影像等在疫情期间充分展示了中国以人工智能等为新基建的中国城市治理能力。

正在热议的两会，确定以新型基础设施建设为中心，以新发展理念为引领，以技术创新为驱动，全面发展5G、人工智能等新型技术，加速产业化的落地。

本文主要从目前人工智能领域存在的问题简要推演下，走出寒冬后的人工智能何去何从。

一、人工智能的生产原料（数据）遇到了什么问题

数据层应用现状：

（1）存不下——数字化浪潮下的海量数据存储挑战

数据量的急剧上增是数据存不下的重要原因，目前据全球统计企业的数据量从PB级向EB级迈进，数据量将从2018年的32.5ZB快速增长到2025年的180ZB。

由于存储系统仍为传统架构以及成本等原因，当前企业数据仅有不到2%被保存，数据“存不下”的问题日益严重。

存储扩展性不足：传统存储由独立的控制器与硬盘框组成，当容量不足时可增加新的硬盘框进行级联，但由于控制器的处理能力受限，存储的扩展能力非常有限。
存储协议类型单一：非结构化数据逐步成为企业数据的主体。随着电商、物联网等业务扩张，80%的新增数据由各类音视频、日志等非结构化数据构成。然而传统存储协议类型单一，无法同时满足块、对象、文件、大数据等多样性数据的存取需求，企业不得不为每一种新的数据类型新增一种存储设备，增加了高效利用存储资源的难度。
存储成本依然高昂：越来越多的企业选择将数据长期保存。2017年起，移动运营商因合规性要求，将其设备日志的保存周期从2个月增加至6个月。

这意味着其数据存储服务器的设备规模将增加至少2倍。传统的架构中，服务器因存储需求不断扩容，但CPU的使用率却始终处于较低的状态，资源得不到合理利用，无疑会对采购成本和维护成本造成更大的压力。企业不得不因为存储成本而放弃大量宝贵数据。

（2）流不动——由来已久的数据孤岛难题

孤立的数据价值并不显著，只有当数据像水一样流动起来，才能打破“数据壁垒”，最大化释放其价值。

数据的“三类孤岛”：

应用孤岛：不同应用产生的数据分别存放在不同的存储系统中，而且这些数据由于各自的特征，彼此之间是无法共享使用的，即形成“应用孤岛”问题；
管理孤岛：为对生产数据加以保护和使用，会将生产数据的一个副本，拷贝到各个系统（如备份、容灾、归档、开发测试和分析系统）中进行管理和使用。即便是同一份数据，为实现不同目的，还需分别存储、管理和使用，即形成“管理孤岛”问题；
地理孤岛：由于企业的更新换代，将存在多套存储设备，比如生产环境、非生产环境、云环境和边缘环境，企业的数据将存放在不同的地方，形成“地理孤岛”问题。

（3）用不好——数据供应不足造成应用复杂低效

海量的数据孕育了前所未有的机遇，也带来了巨大的挑战。甚至有人说，从来不缺数据，数据多了反而成为一种负担。也有人说，数据只是资源，而不是资产，很难产生价值。其根本原因是没有用好数据，数据没有释放价值。而影响数据价值释放的主要原因是数据供应不足，无法反馈业务本质，支持业务决策：大量数据未存储。

企业每天会产生大量数据，但传统的数据录入需要预先的人工规划，这导致大量非结构化数据以及一些新型的数据无法进入系统（例如IoT数据、视频数据、图片数据等）。数据的缺失会削弱对业务的感知，无法真实及时地反映出业务本质。

找不到数据传统企业通常通过数据表来管理和分析数据，规模较大的公司数据表甚至可以达到数百万张，而且分散在各个业务系统中。如果没有统一数据目录和全局数据视图，要在上百万张报表中找到特定的数据，好比大海捞针，无法应对灵活多变的业务需求。

接下来致力于数据融合，发掘数据价值，拥有数据的企业将不断重新定义人工智能行业的发展。