
未来是一个值得所有人思考的点,因为我们都将活在未来。也许更为遥远未来无法预测,但是眼前,2016年法国欧洲杯正如火如荼地进行着,小组赛已经取得一场胜利的德意志战车,能否如同大数据预测的那样,过关斩将最终获得冠军呢?大数据可以再展神奇吗?
不是我不明白
大数据分析帮助德国队赢得世界杯更多应该是商家的一种宣传,德国队赢得世界杯相信是自身实力使然,大数据分析应该属于锦上添花。但我们也需要承认,这个世界真的变了,高铁、飞机、互联网、智能手机、基因技术,人对世界的时空感知,对世界的改造能力出现了不同寻常的变化。

清华大学生命科学学院的生命科学与蛋白质计算是一个发生在我们身边的例子。据清华大学生命科学学院计算平台主任杨涛介绍:高性能计算和大数据分析支撑了当前生命科学研究的热点,其中包括基因组学、蛋白组学和转化医学等,大量对于基因和蛋白质组学的研究被转化应用于临床和治疗。

清华大学蛋白质设施计算中心依托国家“凤凰工程”成立,主要用于肝癌发病和研究,其中,直接电子探测器的发明和高分辨率图像处理算法的改进,是蛋白质科学研究的两大技术革命,有了更加快速的电影记录,就可以追踪图像漂移轨迹,从而对图像进行矫正,提升蛋白质探测的数据质量。李克强总理在参观该中心时指出:“你们的研究对于人类健康意义重大。屠呦呦已摘得诺贝尔奖,相信你们会创造出不逊于前辈的业绩。”
与蛋白质科学研究两大技术革命相伴的是数据和计算的临界点,其数据采集规模提升了至少100倍。“如果按照7GB/张计算,单台电镜每天产生数据量就有28TB,每年我们会产生接近10PB的数据,如果未来电镜照相有进一步革新,这个数据量还会提升。” 杨涛介绍说。

国家电网调度也面临着同样的挑战。全球能源互联网、泛在智能电网、源网荷互动,以及全业务统一数据中心都对于电力信息化建设提出了新的挑战。“以源网荷互动为例,气候变化随时会对清洁能源电量产生影响,例如阴天,太阳能发电就会减少,对于国家电网电力调度来说,要求对此采取有针对性地调度和应对。这显然离不开卓越的性能、扩展性强、高可用平台化设计,可以根据应用场景及时提供所需要的计算和存储能力。”南瑞集团信息系统集成分公司首席技术官徐戟先生说。

南瑞集团针对国家电网应用设计的瑞腾高性能一体机,其IO能力超越了100万IOPS,所采用的分布式存储节点,可以有效应对海量数据存储的需求。
在金融、在电信、在民航、在零售,获得业务洞察的时间正在变得至关重要。
“在这场数字化转型中,数据洞察正成为新一轮提升企业竞争力的‘战略资源’,带动数据分析市场的繁荣发展,”英特尔公司数据中心事业部企业应用总经理Patrick Buddenbaum 先生说。

Patrick表示:“为应对来自零售、电子商务、电信、金融服务等传统行业用户日益增长的对复杂分析的业务需求,英特尔正与全球的软硬件合作伙伴一起联手打造覆盖最新计算引擎、存储设备及网络技术的全新一代数据中心架构,来帮助企业加速构建更加高效、稳定、灵活可扩展的数据分析解决方案。”

解铃还需要系铃人
如果把海量数据和迅速增长计算需求比喻为洪水猛兽,而科技技术进步则是打开“潘多拉魔盒”的那把钥匙。解铃还需要系铃人,应对海量数据增长同样离不开科技这个手段。

众所周知,处理器的发展遵循摩尔定律,也就是当价格不变时,集成电路上可容纳的元器件的数目,大约每隔18~24个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18~24个月翻一倍以上。这一定律,在过去的50年间不断的到了印证。

业界已经习惯了英特尔的“Tick-Tock” 芯片发展周期计划,也就习惯了处理器的性能不断提升,以至强处理器为例,不论以通用计算和横向扩展为核心的E5,还是以关键业务应用和纵向扩展为核心的E7,总之每年一次E5或者E7至强处理器发布,都伴随着30%左右性能提升。前几天发布的最新英特尔E7 v4至强处理器也不例外,新的处理器家族在内存容量、性能以及可靠性方面较之上一代产品都均有显著提高。

新的E7 v4 8路系统最高可以支持24TB内存,为基于内存计算的数据洞察和决策应用提供了支持;性能方面,E7 v4系统相比基于IBM Power8的解决方案可提供1.4倍的性能,10倍性价比,以及仅一半的系统功耗。此外,为进一步降低计划内和计划外宕机的频次与成本,新的E7 v4产品集成包括英特尔可靠运行技术在内的超过70项硬件增强的RAS的特性。
“我们性能的比较数据,不仅体现在实验室测试,也体现在用户真实的应用场景中。”英特尔公司数据中心事业部副总裁兼数据中心平台应用工程部门总经理Donald D. Parker介绍说。

对于处理器频繁升级换代,也许你已经不以为意,甚至有些抱怨。就连英特尔在市场推广的策略上,也不再把升级换代的能源节省作为说服用户的利器,但你还是不能够贬低处理器技术进步带来的革命意义。
试想一下,如果没有计算能力阶梯型的不断提升,我们如何有能力来应对海量数据增长带来的挑战。所谓“数据洞察”,在小型机的时代并非没有意识到。所谓大数据,非结构化的数据,是一种低附加值的数据,经济能力的限制,让我们没有办法满足“数据洞察”“全数据分析”的需求,“好钢用在刀刃上”,当时的数据分析只能够应用在高数据附加值的结构化数据的分析上,以图文和报表为主。

这实在是不得已的事情。与此同时,当时至强处理器在企业级RAS特性上的差距,也决定了其通用市场应用的定位。经过10年左右实践积累,无论性能,还是RAS性能上,达到与RISC小型机相当的水平,一个新的时代完全到来。

小结
数据洞察与其说是技术应用,不如说是一个经济账,如果没有英特尔至强处理器技术的不断进步以及性能的不断提升,所谓大数据应用、数据洞察、人工智能等不过是水中花、井中月。可以说,也正是因为有了处理器技术的不断进步,让我们拥有足够的能力来应对和演绎这个越来越变化的世界!
文章来源:英特尔商用频道