/>
但这些常规手段,以林先动和陆教授的经验,肯定都试过了。
问题到底出在哪里?
陈星的目光在白板上缓缓移动,最终停留在了cpu核心的微架构图上。
“林博士,我们这个核心,是基于arv7指令集,自主设计的微架构,对吧?”
“是的,陈总。”林先动立刻回答,“我们参考了ar官方的rtex-a8设计,但在分支预测和乱序执行单元上,做了我们自己的大幅度改进,理论上,同频性能会比a8更强。”
“乱序执行……”陈星嘴里咀嚼着这个词,一个被无数事实证明过的念头,忽然从记忆深处闪过。
他走到白板前,拿起笔。
“我们的乱序执行窗口,或者说rob(重排序缓存器),设计了多少项?”他问。
林先动愣了一下,没想到陈总会问得这么具体。他回答道:“为了追求极致的单核性能,我们设计了32项的rob。这在目前的移动处理器里,算是非常激进的方案了。”
“问题,可能就出在这里。”
陈星的手指,在“乱序执行单元”那个方框上点了一下。
“我们毕竟是第一次做这么复杂的处理器,经验不足,我很理解。”陈星的声音不大的说。
“乱序执行的逻辑本身就极其复杂,窗口开得越大,相关的调度逻辑、依赖判断逻辑、结果转发逻辑就越庞杂,这些复杂的逻辑电路堆叠在一起,必然会导致某些关键路径变得过长,时序延迟暴增。”
“性能和频率,本身就是一对矛盾体。我们过分追求理论上的ipc,却忽略了频率这个更关键的因素,ipc再高,频率上不去,最终的绝对性能还是空中楼阁。”
陈星转过身,目光扫过林先动和陆远江,语气变得果断。
“我的建议是,砍掉一半!”
“把rob从32项,直接砍到16项,甚至更少!把整个乱序执行单元的逻辑简化下来,优先保证时序收敛,把频率给我提上去!”
“我们现在要做的,是先生存,再发展!先让芯片能用,能跑起来,再去谈什么极致性能,我们不能一口吃成个胖子!”
整个会议室,一片死寂。
砍掉一半?
这……这怎么行!