载入中。。。 'S bLog
 
载入中。。。
 
载入中。。。
载入中。。。
载入中。。。
载入中。。。
载入中。。。
 
填写您的邮件地址,订阅我们的精彩内容:


 
2013诺贝尔物理学奖背后的计算机技术
[ 2013/10/29 19:47:00 | By: 梦翔儿 ]
 

近日在《量子杂志》上刊登了一篇文章,讲述了量子物理学研究的过程中,各种计算机技术的变迁,作者是物理学的专栏作家,文中并没有谈及专业的计算机技术细节,但也提供给我们一个新的视角去看待近年来计算机技术的发展。以下为译文: 
 

2013年诺贝尔物理学奖10月8日在瑞典揭晓, 比利时理论物理学家Fran?ois Englert和英国理论物理学家Peter W. Higgs因希格斯玻色子的理论预言获奖,2012年这一预言在位于瑞士的CERN(欧洲核子中心)粒子物理实验室中得到了证实。

 
 

在CERN的 LHC(大型强子对撞机)中,亚原子颗粒不停高速碰撞,产生新的粒子,四个监视器在持续记录这些粒子的情况,每秒产生的数据量高达5TB,相当于全球图书馆数据量的总和。这些数据被滤波算法处理后,99%以上的数据都被过滤掉了,但是每年这个系统需要存储和处理的数据仍然高达25PB。研究组正是在这数以十亿计的粒子对撞结果中提取到了希格斯粒子存在的证据。支撑这些数据计算的是遍布全球的160个数据中心,这个分布式网络的数据传输速率最高可达10GB/S。LHC解决大数据问题的方法反映了近十年来计算本质的戏剧性变化。

从摩尔定律到多核技术 
 

摩尔定律自1965年被Intel联合创始人Gordon E. Moore提出以来,就一直主导着计算机产业。根据摩尔定律,集成电路中的晶体管数量每隔两年会增加一倍,然而目前看来,这个速度是极具弹性的。麻省理工学院理论计算机科学家 Scott Aaronson认为“摩尔定律已经基本失效”。

自2005年以来,许多计算能力的增长都来自多核技术带来的并发性上。更快的处理器固然重要,但已不再居首位。斯坦福大学电气工程师 Stephen Boyd认为“5年来,处理器速度对于计算能力的提高已经不多了,解决问题的挑战并不在于如何利用一个超快的处理器,而是如何整合10万个较慢的处理器”。Aaronson指出简单地增加并行处理并不能充分解决大数据问题,这些问题更连续,有时可以分割成小任务分配给多个处理器,有时很难做到分割,并且这些处理器也很难得到充分利用。好比是20个人完成一项工作,通常情况下并不能达到20倍的速度。

数据传输的问题

研究人员在集成不同架构的数据集时也面临着挑战,同时在一个高度分布式的网络中有效传输数据也面临巨大困难。随着数据集的规模和复杂性不断增长,这个问题会变得愈发明显。据加州科技学会物理学家 Harvey Newman(他的团队开发了LHC的网格数据中心和横跨大西洋的网络系统)。他估计照目前的形势发展,LHC数据处理系统的计算能力将不能再满足需求,甚至需要重新设计。

内存与数据传输

数据传输有时比处理延时更耗时,Aaronson说:“计算机运行慢的原因不一定是微处理器的问题,还有可能是微处理器在等从磁盘传来的数据。”大数据研究人员更喜欢数据传输时间尽可能的少,因为存储在分布式网络或云端的数据会使情况恶化。

分布式计算

解决这个问题的方案之一是使用新的模式:除了存储,分析数据也采用分布式的方法。LHC的方案就类似于这种模式,对撞机中的产生的原始数据被存储在瑞士的CERN研究设备中,另外还有一份备份数据被按批量划分并分布到世界各地的数据中心。每个数据中心对各自的数据块进行处理,然后在处理下一批数据前,将处理结果发送给各地区的计算机。

Boyd的系统基于所谓的 一致性算法,他介绍说:“这是一个数学优化问题,用以前的数据‘教育’这个系统来处理未来的数据。”这个算法在SPAM过滤器中也得到了很好的应用。

当问题变得太大时,一致性优化方法非常有效,数据集被分割成块,分布在1000个“代理”中分别处理,并产生一个数据模型。关键是要满足临界条件:每个“代理”的模型可以不同,但最后这些模型要达成一致。

在Boyd的系统中,这个过程是迭代的,创建一个反馈环路,所有的代理会共享初始情况的一致状态,继而根据新的信息更新各自的模型,并达到新的一致状态。这个过程不断重复,直到所有的代理都达成一致。采用这种分布优化的方法可以显著减小每次需要传输的数据量。

http://www.ccf.org.cn/sites/ccf/nry.jsp?contentId=2765524352731

 
 
发表评论:
载入中。。。

 
 
 

梦翔儿网站 梦飞翔的地方 http://www.dreamflier.net
中华人民共和国信息产业部TCP/IP系统 备案序号:辽ICP备09000550号

Powered by Oblog.