广告

用PowerPC实现高带宽 TCP/IP 性能

2006-9-11 08:09 3817 0 7 分类: FPGA/CPLD

2006年9月11日8:08:41


   


今天,实现线速 TCP/IP 性能仍旧是一项重大设计挑战。在本文中,我们将讨论限制 TCP/IP 性能的单位字节和单位包的处理成本,并给出在基于嵌入式处理器的应用中实现千兆位以太网 TCP/IP 性能最大化的技术。

  千兆位以太网性能的获得是通过利用多端口 DDR 存储器控制器,在嵌入式 PowerPC处理器局部总线 (PLB) 接口与两个数据端口之间分配存储器带宽而实现的。每个数据端口连接到一个直接存储器访问 (DMA) 控制器,从而允许硬件外设对存储器进行高带宽访问。


  系统架构
  存储器带宽对高性能网络连接应用来说是一个重要考虑事项。通常,外部 DDR 存储器为处理器和一个或多个高带宽外设(如以太网)所共享。一个多端口存储器控制器负责将可用存储器带宽高效地分配给处理器接口和流式外设,包括以太网。流式外设通过点对点流式接口由直接存储器访问 (DMA) 控制器链接到存储器。DMA 控制器实行分散-收集 (scatter-gather) 机制,由此将多个缓冲区转换到以太网或其他流式外设上的一个数据流,或相反。以太网外设对发送和接收路径同时实行校验和卸载,以优化 TCP 性能。下图显示了上述系统的一种框图。


051219012363781.jpg



  TCP/IP 单位字节处理成本
  当处理器处理有效载荷数据时就会产生单位字节处理成本。这种类型的两个最常见的操作是缓冲区复制和 TCP 校验和计算。缓冲区复制意味着重大处理开销,这有两个原因:
  1. 大部分复制都不是必要的。
  2. 处理器不是高效的数据搬运工。


  TCP 校验和计算代价高昂,因为需要对每个有效载荷数据字节进行计算。支持嵌入式 TCP/IP 的应用(如医疗成像)要求使用接近线速的 TCP 带宽,以便通过千兆位以太网可靠地传输图像数据。数据是从高分辨率图像源生成的,而不是处理器。这种情况下,引入零复制软件 API 并将校验和计算利用FPGA 逻辑结构实现,将彻底地消除单位字节处理成本。"零复制"是用来描述一个 TCP 软件接口不会发生任何缓冲区复制的术语。Linux 和其他操作系统已经引入了用于此目的的软件接口,商用独立 TCP/IP 栈厂商如 Treck 也提供了类似的零复制特性。这些软件特性允许消除用户应用程序与 TCP/IP 栈或操作系统之间的缓冲区复制。


  系统的分散-收集与校验和卸载特性为零复制功能提供了所需的硬件支持。分散-收集特性是 DMA 控制器的一种灵活性,它允许软件缓冲区位于任意字节偏移处。这避免了处理器复制未对齐或碎片化的缓冲区。


  校验和卸载是以太网外设的一种特性。它允许当以太网帧在主存储器与外设的硬件 FIFO 之间传输时,在 FPGA 结构中进行 TCP 有效载荷的校验。这些系统特性消除了代价较高的缓冲区复制与处理器校验和操作,让处理器专心执行协议操作和用户功能。


  TCP/IP 单位包处理成本
  单位包处理成本与涉及包的发送或接收的操作有关。包中断、硬件接口和头处理等,都是单位包处理成本的例子。中断处理成本对处理器和存储器子系统构成相当大的负担,特别是在传输小包时。中断结合 (Interrupt coalescing) 是此类系统中用来缓解这种压力的一种技术,它将中断处理成本通过多个包分期摊还。DMA 引擎将一直等待,直到出现 n 个要处理的帧,然后才中断处理器,其中 n 是一个软件可调的值。


  通过减少传输帧的数量,大尺寸包(9,000 字节的巨帧)的传输具有相似的效果,由此可得到中断数。它把单位包处理成本分摊在一个较大的数据有效载荷上。


  设计实现
  实现这种体系结构的一个例子是赛灵思公司的千兆位系统参考设计 (GSRD)。它面向基于 TCP/IP 的协议与用户数据接口(如高分辨率图像捕捉或光纤信道)之间的高性能桥接。GSRD 的组件包含解决 TCP/IP 系统的单位字节处理成本和单位包处理成本的特性。对于需要使用嵌入式操作系统的应用,可提供 MontaVista Linux端口和来自 Treck 的商业独立 TCP/IP 栈,以满足具有最高带宽要求的应用。GSRD 使用巨帧可提供高达 890 Mbps 的发送 TCP 性能,可采用赛灵思公司目前最新的 FPGA 技术来实现。 GSRD 可以从 http://www.xilinx.com/gsrd/ 下载得到。

广告

文章评论 7条评论)

登录后参与讨论

year_month_day_658891873 2008-11-19 17:57

不好意思哈,因为老有提示跳出来,所以就这样了,呵呵

year_month_day_658891873 2008-11-19 17:55

拜读了博主的博文,觉得博主非常厉害, 我从事电路也快2年了,以后希望能多多向你请教

year_month_day_658891873 2008-11-19 17:54

拜读了博主的博文,觉得博主非常厉害, 我从事电路也快2年了,以后希望能多多向你请教

year_month_day_658891873 2008-11-19 17:54

拜读了博主的博文,觉得博主非常厉害, 我从事电路也快2年了,以后希望能多多向你请教

bsz 2007-6-15 09:09

功力强呀!

zhqr2004019_331862034 2006-11-4 09:05

好强啊,支持一下

cocappjj_256384531 2006-9-11 09:44

up
相关推荐阅读
chwb02_817835118 2012-11-22 08:47
Altera Quartus II软件12.1版借助强大的高级设计流程,加速系统开发
Altera公司 (Nasdaq: ALTR) 今天宣布,推出Quartus® II 软件12.1 版——在CPLD、FPGA、SoC FPGA和HardCopy® ASIC设计方面,性能和效能在...
chwb02_817835118 2012-11-17 23:26
介绍28nm创新技术,超越摩尔定律
在工艺方法基础上,Altera利用FPGA创新技术超越了摩尔定律,满足更大的带宽要 求,以及成本和功耗预算。Altera Stratix® V FPGA通过28-Gbps高功效收发器突破 了带...
chwb02_817835118 2012-11-17 23:22
Altera与Northwest Logic联合开发RLDRAM 3存储器接口解决方案
Altera公司 (NASDAQ: ALTR)与FPGA高性能知识产权(IP)内核领先供应商Northwest Logic今天宣布,开始提供硬件成熟的1,600 Mbps低延时DRAM (RLDR...
chwb02_817835118 2012-11-17 23:21
Altera电机控制开发工作台前所未有的提高系统集成度、可扩展的性能和灵活性
Altera公司(NASDAQ: ALTR)今天宣布,新的电机控制开发工作台前所未有的提高了电机控制系统设计的系统集成度和灵活性,而且性能还可以扩展,同时大幅度缩短开发时间,降低风险。工作台包括一...
chwb02_817835118 2012-11-07 11:05
Altera OpenCL统一的异构编程
观看OpenCL怎样为异构计算提供统一的平台。在这一演示中,我们将为GPU编写的NVIDIA代码重新定位到Stratix V FPGA上。  ...
chwb02_817835118 2012-11-07 10:58
Altera宣布业界首款支持FPGA的OpenCL工具——进一步加速了FPGA在异构系统中的应用
Altera公司 (NASDAQ: ALTR)今天宣布,提供FPGA业界的第一款用于OpenCL™ 的软件开发套件(SDK) (开放计算语言) 的软件开发套件,它结合了FPGA强大的并行体系结构以...
我要评论
7
0
广告
关闭 热点推荐上一条 /2 下一条