Shi's profileItany有话说PhotosBlogLists Tools Help

Blog


    January 28

    热烈庆贺动车上线运营!

      今天高等流体力学终于考完了。这几天一直忙于应付他,以至于没有足够的时间来更新BLOG。现在考完了,终于可以抽时间更新一下了。这几天别人一直在问我什么时候回家,我说差不多是在二月十号。结果别人都说我回的晚。这也是正常的。因为我还要在这里上交两个期末作业,不是说想回去就回去的。而且,现在课题组的主力马上就要到云南做实验去了。我在家算是看家的一个了。这个时间实验台还要运作,主管不在,我只好临时的上去管管。我这里算是还比较幸运的,因为老板对于假期回家还没有什么限制。如果赶上某些老板,那么就真的郁闷了,假期还要在这里作工程,知道过年前两天才能回家,之后过完年马上就要回来的。赶上一个不和学生争成果,发钱自己不留着而分给下边小弟,对人比较宽容,不是对很多私人的安排横加干涉的老板,是比较幸福的。
     
      言归正传。今天开行的动车组并没有提速,仍然按照现有的列车运行图执行,所以现在的限速仍然是160kph,而不是他的最大速度200kph,可以认为是在正式运营之前的演习。然而,正式得益于此,现在的票价也是按照既有列车执行,而不是按照动车组的上浮票价来执行的。适逢今天是星期天,现在正是广大车迷体验动车组的好时机,因此海子铁路网、东方车迷网等都有强大阵容出现。然而伴随着华东区车迷的兴奋的是,其他地区的车迷只能是望车叹息了。在实验阶段,动车组在北京西-西安,北京西-石家庄-汉口,北京-沈阳-哈尔滨,北京-济南-青岛,北京-上海,上海-南京,上海南-杭州,上海南-南昌,深圳-广州,成都-重庆之间进行了多次实验,以至于大家都认为在现阶段运营时会安排动车组在这些线路上边运行。尤其是胶济,由于是新建客运专线加上既有线提速,被刘部长称为第六次大提速的标志性工程,济南局也认为是板上钉钉的事情,甚至时刻表和票价都透过新闻媒体对外进行了宣传,然而铁道部的电报终结了这些梦想。有序现在的动车组交车情况相对于预想稍微迟缓了一些,现在既有的动车组无法支持这么广泛的开行计划,因此铁道部只能把其他路局的动车组调往上海局,集中开行上海-南京,上海-杭州这两条线路上边的动车组列车。至于其他动车组的开行,并不是说就这样黄了,而是稍微有所延迟。虽然看起来现在上海局是最风光的,但是毕竟实际意义并不是特别大,主要还是象征意义。个人相信在春运前后动车组就会相继上线运行的。
     
      现在执行任务的都是CRH2动车组。上一篇文章里边并没有对CRH2进行太详细的介绍。这里边稍微细化一下。
     
      我们首先来看CRH2的编组:4M+4T,8节编组,基本上是Mc+T+M+Tp+M+Tp+M+Tc。在这里边Mc代表动力控制车,在列车的一端,之所以叫做动力车,因为他的转向架上边是有电机的,可以产生牵引力,而叫做控制车,是因为他有一个驾驶室,并包含列车的控制逻辑电路。下边的T是拖车,和普通的客车车厢差别不大,就是乘客乘坐的,没有动力。第三位M是动力车,转向架含有电机。第四位Tp是拖车,但是他的车顶安装有集电弓,能够从接触网上边采集电能,驱动整个列车运行。最后一位是Tc,控制拖车,没有动力,但是含有一个驾驶室。其中,每个牵引电动机的功率是300kW,这样4个动力车,8个转向架,16根动力轴,每个车轴上边一个电动机,总功率是4800kW。这个功率相对于现在的SS7E,是恰好相等的,但是SS7E在运用中要牵引18节车厢,而这个动车只是区区8个车厢,这样单位重量的牵引功率大大增加了,可以有效的克服现在电力机车在平道上边可以保证160kph的高速运行,而一旦遇到长大坡道平衡速度就会下降到110-120kph的问题。另外,虽然电动机的总功率加起来还是这么多,但是电动机的数量大大增加了,产生的总牵引力也增加了不少,启动加速度可以达到0.406m/s^2,这个已经是很不错的数值了。现阶段的CRH2的运行速度可以达到200kph,但是未来会进一步提速到300kph。这个时候可能会出现功率相对紧张的情况,有可能会改变编组的方式,变为6M+2T,这样总功率会增加为7200kW,应付300kph是足够了。
     
      现在随着动车组的正是曝光,我们可以看到现在的坐席主要分为两种:一等软座和二等软座。其中,一等软座是采用2+2布局,也就是和我们现在列车的RZ的布局是相似的,而二等软座的布局采用3+2布局,也就是和现在的YZ的布局是一样的。虽然这种命名方式可能会有把现在的硬座改成二等软座来骗钱的嫌疑,但是不管是二等软座还是一等软座,相对于现有的列车是有不小的改进的。得益于新干线E2的优秀血统,现在动车的座位是朝向一个方向的,在列车换向运行时,只要按下座位上边的按钮,就可以转动座椅180度,使座位变为朝向列车的运行方向。另外,在行李架的设计、灯光、座椅等细节方面也是有很多精妙之处的。对于票价,我们可以稍微参考一下前一段时间泄露出来的济南-青岛的动车组票价。需要稍微提醒大家的是,由于现在青岛车站正在停运重修,以便迎接奥运会的帆船赛,所以始发或者终到青岛的列车现在都是转移到了四方。济南-四方的距离是387km,目前的硬座48元、软座75元,使用动车达速200之后更为二等座96元,一等座115元。也就是说,动车组二等软座的票价差不多相当于硬座票价的2倍,而二等软座差不多是2.5倍。这个价格还是稍微偏高的。然而,比较利好的消息是,在春运和暑运期间,动车组的二等软座是可以享受到学生票优惠的。到时候可以摆出学生证比较便宜的乘坐优质车了。
     
      现在在既有线上边,动车组确实显得比较鹤立鸡群。现在这种客货混跑的格局,动车组的开行对于现在的货运是会带来比较大的麻烦的。在动车组达速之后,比如在京沪上边,将会有5种不同的列车运行:200kph的动车组,160kph的25T直特及部分特快,140kph的25K特快和快速,120kph的25G快速、普快和普客,80kph的货列。这样,相互之间的会让将会是一个非常头痛的问题,也是一个制约运营效率的大问题。如果对于普通的旅客列车更加频繁的会让高速动车组和快速列车会是现在的旅行速度更加缓慢的话,那么对于速度只有80的货运列车来说这简直是一场灾难。为了解决这些问题,一个是大力修建客运专线。就上海、南京、杭州、合肥集群来说,在不远的将来将会实现客运专线的互通,而和其他城市群之间也将通过高速铁路进行连接。这样,动车组就可以真正发挥出公交化、舒适、快速的特点,而既有线上边的相对低速的列车也不会由于待避时间太长而延长了旅行时间。另一方面是提高客列和货列的速度。现在将要实现的一个计划是东车西移,将现有的时速为120的25B、25G型车体转移到西部相对较差的线路上边运行,并大力更换25T型车体,开行160kph的特快列车;货运上,新造的70、80系列车体都是可以达到120kph运行要求的,加上新到的运行速度为120kph的HXD家族的货运机车,就可以将货运的速度提高到100以上。通过这一点,不仅能够提高客运的旅行速度、运能,还可以保证货运量有所增长。
     
      最后在介绍一下CRH2之外的三款动车的最新消息。庞巴迪与四方合作的CRH1现在已经到了上海,但是现在线上运营实验还没有展开,只是刚刚接车,所以现在还不清楚将会执行什么线路。而西门子与长春客车厂、二七机车车辆厂合作的CRH3现在还没有露出芳容,不过他并不着急,因为他的目标是在北京2008年奥运会的时候投入到北京-天津的客运专线的运营当中,现在时间是比较充裕的。现在阿尔斯通与长春客车厂合作的CRH5已经有整车下线了,不日就会抵达中国。值得特别指出的是,未来在北京-沈阳-哈尔滨,以及沈阳-大连两个方向上边运营的就将是CRH5,而CRH5又是在意大利Savigliano工厂生产的,算是意大利车。支持意大利的某人应该去坐一坐~
     
      顺便做一下下期预告:现在新的货运电力机车HXD家族的三个兄弟已经陆续下线了。下一篇将会针对这三个兄弟…… 敬请期待
    January 09

    AMD或许作为VPU供应商更加合适

      这段事件网络连接又是时断时续。连Elsevier和EI Village都没有办法连接。更郁闷的是,EI Village连清华大学的国内镜像都没有办法接通。真是非常郁闷,查个论文都非常不便,完成期末作业只好糊弄糊弄了。
     
      期待已久的学位证终于拿到了。自从上次办完成绩单,实际上已经没有什么问题了。过完年就领到了。可是并不是像上一批,给的是理学学士,这次给的是工学学士,让人比较郁闷。我认为还是一个理学一个工学比较完美的。现在居然变成了两个工学。现在回想当年那些上双学位的日子,还历历在目。在要考离散数学的时候,上厕所的时候拿着教材就去了,等完事之后才发现自己没有带纸,好在手机还在身上,立刻呼叫救援,不然就真的套牢了。到香港交换之前,决定元旦时候回家看看,坐在Z74上边,还在看编译原理,回家几天也是没有清闲,结果回学校之后,发现在1月3号考试已经考完了,真是哭笑不得,只好等到第二年重修;毕业之前,大家都是欢天喜地的度过最后的时光,我还在每天和需要最后一批补考的兄弟们一样,每天看看书,计算机网络,数据库导论,人工智能,虽然平时作业都没有上交,但是最后成绩出来之后,居然相比师弟成绩还要好一些,真是不知道怎么回事,难道是被我这种“活到老,学到老”的精神所打动?反正经历了两次重考,经历了去香港之后的降级,经历了大大小小决心上的动摇和抉择,最后终于拿到了。
     
      我是比较懒的,得过且过,然而这个双学位我经过反复的思量是一定要拿到的。首先,我已经为了双学位失去了很多了,在大二的时候本来加入了机器人比赛的团队,但是就是因为时间不够,去了两次就退出了。实际上机器人比赛是一个非常美好的事情,经过锻炼,在实际工程上的能力要强悍的多,这个在一位师弟的身上表现的非常明显。完全从功利的角度上边,放在简历上也是相当大的筹码。类似的事情还有一些。如果连学位都得不到的话,那就真的是鸡飞蛋打了。其次,身边有不少人都得到了双学位。在最初报名的时候,我就是最高调的一个,现在“沉舟侧畔千帆过”,岂不是一个莫大的讽刺。不管是小随、兵兵陈、风哥,还是平时不着调的可吹,都拿到了,前几个是工商管理的,可吹和我同样是计算机的。在这一点上我是不甘于居人后的。再次,在一些公司在招聘的时候,双学士学位是作为硕士的待遇来算得。即使我现在要奔向博士了,但是一个学位总是相比一个什么认证来得更加有含金量,这个也将增加在这个方向上边的竞争力。最后,每个学分60,既然投资者已经花钱了,我要是半途而废了,那就对不起父母的投资了。我是一个契约论者,如果自己违约了,在良心和道德上压力是很大的。好歹现在目标是达成了。
     
      现在AMD公开展示了R600,配置了512bit的显存,一个新的纪录又诞生了。如果一切正常的话,那么其工作频率也会比较高,甚至有可能会突破1GHz。现在G80高高在上的郁闷将会不再,而是改成被打倒的郁闷。在这里就不自己写了,因为有大牛写了一个很好地科普文章,这里转贴过来:
     
    G80架构在我个人看来,根本就不适合游戏

      个人认为,对于图形渲染,如果只考虑效率,G80当然是最好的体系。但效率不等于效能,效能是综合个方面因素,尤其是当前半导体工制造艺水平之后的一个综合性的结果,综合从效能上来看,G80并不是最优的体系。也就是说,如果NV需要一款拥有跟G80类似的图形渲染效能的GPU,完全可以用更少的代价(晶体管)办到。我只能猜测,NV这次的野心不只在图形领域。

      R600相比之下就务实得多,它是一款实实在在为游戏而生的GPU,虽然AMD肯定不会止步于此,诸如CTM之类的一些东西很快就会被推到应用层面,但从目前已经透露的R600架构来看,R600的首要设计目标就是为了3D渲染。让游戏跑得更绚更快是这个架构最主要的任务。

      那么,让我们来稍微详细的看一下G80与R600设计侧重点之间的区别

      G80与以前的GPU,最大的区别就是标量化渲运算单元和多执行诸架构,这两点是G80最引以为傲的革新,但也是争论最大的改进。
        
      所谓标量化(scalar)运算单元,是相对于之前GPU的矢量化(vector)运算单元而言的。

      我们知道,在图形处理中,最常见的像素都是由RGB三种颜色构成的,加上它们共有的信息说明(Alpha),就一共是4个通道。Vertex数据也一般是由x,y,z,w四个坐标构成,这样一共也是4个通道。对3D图形进行渲染,其实就是改变RGBA四个通道或者x,y,z,w四个坐标的数值。所以,为了方便,GPU的基本渲染单元从一开始就被设计为能同时完成一个象素渲染或者几何转换。数据的基本单元是scalar(标量),就是指一个单独的值,GPU的ALU里进行的一次这种变量操作,被称做1D scalar操作。由于GPU的一个ALU在一个时钟周期执行了4次这样的并行的运算,所以ALU的操作被称做4D vector操作,也就是矢量操作。一个vector(矢量)就是n个scalar(标量),一般来说n=4。所以,GPU的ALU指令发射端只有一个,但却可以同时计算4个通道的数据(在GPU上一般是3D+1D),这就是SIMD(单指令多数据流)的意思了。

      对于图形渲染来说,这种SIMD的设计真是再好不过了,因为VS和PS部分进行的大部分运算都是4D vector(3D+1D),它只要用一个指令端口,就能单周期完成4倍的运算量,所以自打GPU诞生开始,基本的运算单元就一直是这种vector SIMD设计。
    但G80却打破了这种传统,将最基本运算单元统统改成了scalar,也就是标量ALU。这样对于基本的vector操作,就需要多个周期,或者将它们拆分后用更多的运算单元才能完成。有什么样的东西值得NV这样冒险呢?

      原来,NV认为,现在的GPU指令,长度并不一致,对于add,mul这样的指令,GPU能单周期完成,但对于诸如sqr这样的复杂指令也需要多个周期才能完成,对于这些需要多个执行周期的指令,过“大”的4D ALU显然“不合算”。而GPU的编译器即使经过大量优化,编译出来的shader也指令也会长短不一,五花八门,操作数既有4D,也有1D、2D、3D。对于通常执行能力为4D的ALU来说,让它跑1D或者2D指令,而由于SIMD天生的单发射端口限制,不可能同时跑两个或多个,而跑一个单周期内它的运算能力就填不饱。这样就很“划不来”了。这就是SIMD的指令并行性问题。在GPU中,如果标量和矢量指令能够并行,比如3D+1D,那么这被称做co-issue。但正如上面所说,面对复杂的shader环境,co-issue不可能是每时每刻都有效的,因此通常的4D ALU在这里就存在一个浪费问题。而对于1D ALU,就不存在上述问题了。如果把1个4D ALU分成4个小的1D ALU放在一起进行图形渲染,因为各自都有自己的指令发射端口和控制资源,所以能保证理论上100%的运行效率。 在G80上,NV率先引入了这种纯标量的渲染单元,所以G80的底层执行单元被称做MIMD(多指令多数据流)架构。

      G80的每个ALU的计算能力都不强,但它们不存在“浪费”问题,效率很高。然后通过增加运算单元的数量(128SP),提高频率(shader 1.35GHz)来增加运算能力。

      这样的做法,看上去一切都完美,既有高效率,又有强运算能力,但真的是这样吗?

      在能够co-issue的程序中,4个1D Scalar ALU与4D Vector ALU的运算能力是一样的,但1D Scalar ALU因为有4个发射端口,4份控制单元,其占用的晶体管数量将远远超过4D Vector ALU。按照EJI的说法,算上ALU的其他辅助资源,4个1D ALU的体积将是1个4D ALU的2-3倍,对于GPU而言,这是一个灾难性的数字。或者有人会说,那无所谓,在运算能力相同的情况下,1D ALU效率高啊。但你是否有想过,与其做一堆庞大臃肿的1D标量ALU,不如干脆用同样的晶体管,做它一半数量运算能力超过它一倍的4D ALU不是更合算! 而实际上,R600就是这么做的...

    G80的多执行诸体系(Multi-Threading)

      实际上这个并不能算G80的首创(我觉得,第一块能够真正称得上Multi-Threading的GPU,应该是Nvidia NV40,虽然还很简陋,但它有完善的控制体系和threading资源,整个流水线的工作也通过线程分发器来管理。R4XX只支持SM2.0,也只针对线性shader而设计,纵然它也通过threading来掩盖延迟,但并不能算),但G80却是最完善的Multi-Threading GPU,它有极为庞大的register资源,能维持4096个平行线程(看看你的CPU,4核心QX6700也不过是4线程而已),甚至引入了整数指令集来方便管理。当数据送至G80图形核心的流水线之后,会首先被送入一个叫做Thread Control Unit的地方,相当于G80图形核心整个流水线的仲裁和控制机构。这个类似于处理器的线程管理单元会将所有的着色单元的数据平行的拆成超过4000个平行的Threading(线程),并动态监测整个shader array流水线的工作状况。一旦它发现其下某个着色单元由于等待数据或工作完成而处于闲置状态,就会马上递交一个新的线程供其执行。这样让整个流水线保持极高的运行效率。 
     
      而且,富裕的Threading对于掩盖流水线延迟和动态分支都有极为重要的意义,详细介绍请看Eji兄的这篇文章,字太多不打了。   
    http://we.pcinlife.com/thread-506629-1-1.html
       
      相比之下,R600依然维持512-1024之间的一个Thread数目。

      一直到这里,我们发现Multi-Threading又是一个几乎完美的东西,它对GPU的任何一个部件的效率提升都有帮助,而且给予了GPU克服存储器延迟的力量,那么,我到底要说什么呢?

      实际上,跟标量化渲染单元一样,Multi-Threading确实是提高GPU运行效率的好东西,而我认为它的不足之处也跟标量渲染单元一样:实现起来代价太带,将用来实现它的资源花到别的地方,对于游戏来说效果可能更明显。

      想想看吧,我们能从G80如此多的Thread中得到什么?流水线效率?别扯谈了,效率高怎么了,R520具备512threading,低延迟的硬件化线程分配器,支持batch為單位的threading交换,效率还不高?同频下还不照样被200多threading,分配管理体系也不完善,延迟大得多,每threading能抓到的资源也少的G70打得满地找牙。G70不过是多装了8个Pixel Shader而已。不过后来R580 ATI也清醒了,Threading资源没有任何变化,依然是512个,但PS增加3倍,从16到48,现在同频下轮到G71满地找牙了,呵呵。

      OK,我知道到这里那些天骄党们回贼心不死,拿R520的分支性能来说事,那么就彻底讲清楚。流水线平行度的问题已经是老生长谈,动态分支(Dynamic Branch)可以用来融合Shader,但不代表其他提高平行度的途径已经完蛋。一个充满分支和跳转的Shader对游戏的帮助理论意义大于实际意义。在3DMark06这种已经有用到相当复杂的Shader的程序中,Dynamic Branch也只是当作调味剂而不是主菜来用的。至于Branch在shadow filter的edge soft中的应用...恩,我想说的是,绝大部分情况下edge所占的部分都不多,而且随着分辨率的提升,这个部分的比例会越来越小。引用RacingPHT兄的话来说,也许我们还得感谢Branch-----它让一个只能跑15FPS的DEMO提速到了30FPS-----虽然它之前能跑300FPS。问题是:Filter一定要这么做吗?我想FEAR的SoftShadow已经给了一个表率。

    G80 VS R600(传言)的数据对比(统统根据官方材料而订) 
     
    shader吞吐能力: G80 1350MHz*128*3flops(mul+mad并行)=519GFlops VS  R600 1000MHz*64*12Flop=(mad+add并行)=768GFlops
    显存带宽: G80 86.4GB/S(384bit GDDR4) VS R600 over140 GB/s (GDDR4 over 1.1GHz)

      综上所述,G80不可谓不先进,效率不可谓不高,但他面对"暴力"的R600(说得好听点就是“将每一个晶体管都用于游戏”的R600),胜算实在不高。
     
     
      非常感谢 来不及思考 的新年大文。实际上,现在看来AMD在微架构上也没什么创意,事实上下半年的K8L的提升是比较有限的,想要达到Conroe的水平还是如同登天。虽然AMD给出的数据是比较美好,但是总所周知,处理器的关键不是在于执行单元的多少,而是整个前端和后端的和谐。一个好的处理器不能用执行单元堆出来。就好像FM里边有的人数值很高,但是并不好用一样。K8存在的诸多瓶颈在AMD的K8L下边并没有解决,也不可能解决。实际上,现在AMD除了依靠HT总线的互联结构的优势,在未来Intel采用CSI总线之后是没有什么优势的。在制程上边亏吃的就更大了。但是如果是AMD使用自己的生产线来生产VPU,那么情况就不一样了,和TSMC生产的NV的芯片相比优势是比较大的。
     
      我希望AMD作为VPU的生产商存在,而不是CPU。
    January 01

    准光复暨新年感触

      前几天BLOG基本停摆了。台湾海域的一场地震,中断的光缆包括:中美海缆、亚太1号、亚太2号海缆、FLAG海缆、亚欧海缆、FNAL海缆。中国、台湾地区、新加坡、马来西亚、韩国、日本的往来通信及到米国方向去的通信被迫中断。由于Win Live! 的服务器是摆在米国的,我的BLOG也随之停摆了。现在正好是新年,无意之中发现居然光复了。那么就抓紧时间更新。个人认为,在中断之后,虽然海缆暂时不通,但是到欧洲方向的地面光缆还是通畅的。这个时间差不多正好是运营商之间互相商谈,之后中国电信、网通得到相应的许可,调整了路由表,把以前经过受损电缆的数据报路由到地面链路,经过大西洋的海缆,到达米国。然而这样的话,带宽还是比较窄的,现在只能做到“通”,但是距离“畅”还是需要比较长的时间。
     
      这次海缆中断,使我稍微有一点感想。本来以为牢不可破、坚不可摧的互联网在一场地震之后居然就瘫痪了。很多事情,就像连上网线或者ADSL拨号连上之后就可以到达米国的网站一样,平时我们都在正常的使用着,我们都以为是天经地义,本应如此的,实际上是构建在如此脆弱的基础之上的,以至于时刻具有失去的可能。现在每年花着家里的钱,每次回家就是回去享受的,想吃什么吃什么,想上网上网,什么活都不干,以为父母最大的希望就是自己回去,然而却没有注意他们已经逐渐的老了,他们在这几年之内就要退休了,他们快要成为老年人了,他们不能在照顾我,而需要我们的照顾了。现在每天走在大街上,基本上可以安详平静的走过,而不用担心炸弹爆炸,发生案件警察会来处理,城市的基础设施在建设,收入在增加,生活在一天天的重复之中渐渐的变得比以前美好,而在非洲、南美,在刚刚绞死前元首的伊拉克,情形却不是这样的。我们每天走在大地上,丝毫不会考虑是不是在下个时刻地球就不在了,事实上,只要那个核大国按下按钮,这个想法就会变成现实。小到家庭的天伦之乐,大到世界的和平、稳定、发展,这些看似理所应当的事情,实际上下边的基础并不牢固,不珍惜和精心的维护,是会失去的,是会追悔莫及的。
     
      新的一年在打字的时候已经到了。回顾2006年,我的本科毕业了。我的学历从原来的本科再读,变为现在的安全科学与工程系安全工程专业工学学士,硕士在读,和计算机科学与技术系计算机科学与技术专业理学学士。我前脚离开了这个校门,送走了相识四年的同学,后脚又回到了这个校门,结识了来自四面八方的新同学。对于保研的人来说,这一年的生活是平淡的,并不像远渡重洋的人那样转过日月换新天,也不像考研的人那样柳暗花明又一村,更不像工作的人那样朝辞暮归赚大钱。上半年早晨睡到自然醒,下午看看书写写毕业论文,晚上看看电影或者动画片;暑假漫长,看看电视,上上网,随便看看书,出去转转;下半年又回到本科低年级的生活,上课,看看书,只不过上网的时间增加了,有的时候看看动画片,或者帮老板干干活。实验室还是那个实验室,老师还是那几位老师,师兄还是那一群师兄,只有时间静静的流淌。今年自己也几乎没有什么长进,不管是在专业上边,还是在各种知识上边,或者是在综合能力上边。最大的收获就是在上个学期快要结束的时候奋力学习计算机网络基础、数据库原理、人工智能三门课程,还有这个学期学习火羽流、流体力学。非常失败。本来想要看看英语,系统的学习一下机车车辆工程,在看看体系结构、图形学等方面的书刊的。没有实现。
     
      现在是07年了,我把07年的第一时刻献给了BLOG。07年想干什么,心里现在并没有什么想法。哀莫过于心空空啊。然而今年注定是不平凡的一年。Intel的45nm技术将在下半年投产,新的处理器家族,从双核芯的Penryne,到四核心的Yorkfield,再到带有超线程技术的四核心处理器Bloomfield,都在路线图上边展现出美好的面容。这些处理器虽然主要还是基于现在的Core微架构,但是会对于其中的大量细节进行调整,比如分之预测、内存消歧的算法,有可能会增加L1缓存的数量,并且增加内部缓冲器的数量。Core架构是一个非常优秀的架构,然而由于出货时间的问题,现在的Conreo处理器的优化并没有做的非常完全,其理论性能还没有被充分的挖掘出来。可以期待,随着这些优化,新处理器的效能会得到较大的提升。另一方面,新的45nm制程将能够允许在一块管芯上边集成共享L2缓存的4个核心,并且其运行频率有可能会达到前所未有的4GHz,性能非常令人期待,并且价格不会是火星价。随之问世的还有新的Berlake芯片组,尤其是高端的X38芯片组,除了稍显无聊的1333FSB之外,将会支持PCI Express 2.0总线,单根连接速率达到全双工各向500MB/s,并回提供两根全速的x16插槽,每个可以提供各向8GB/s的带宽,可以接驳两个GPU,也可以是两个另外的协处理器。虽然PCIe 2.0规范是主板向下兼容的,显卡并不会向下兼容,也就是说,在X38上边可以使用现在的PCIe1.0,但是未来的PCIe 2.0的显卡不能接在现在的主板插座上边。现在显卡对于总线带宽的需求并不是很强烈,现有的PCIe 1.0 x16,甚至是x8都可以满足高端显卡的需求,未来PCIe 2.0的显卡的普及会比较缓慢,开始只会集中在高端显卡,但是未来的美好前景从此开始谱写了。同时DDR3 1333也将在这个芯片组上边得到支持,新的内存标准开始普及。从这一点来看,我对新的一年充满了期待。
     
      等一下就睡觉了。睡着之前要想想07年要干什么了~ 不管怎样,不能像06年这样水了。我过了生日就是23岁了。放在以前,孩子都能走路了。一定要坚定不移的向已经工作的人士学习,每天定时起床,上午工作下午工作,晚上加班,过一个跨越式发展的一年。