预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

DSP并行处理系统的设计 我从中国知网上找了篇论文——《多DSP并行处理系统的设计与开发》。在简单阅读后,我结合并行处理与分布式系统这一课程,谈谈自己的一些理解和收获。 虽然DSP技术得到了飞速的发展,出现了高速DSP芯片,但是在图像、视频以及大数据处理场合地方,使用单个DSP芯片还往往还是显得捉襟见肘,不能满足系统的需求,这就迫切需要把多个DSP组成互联系统,以增强整体数据处理能力减少任务的执行时间。 各DSP厂家为适应这种需求,先后推出了并行DSP。并行DSP在传统DSP基础上提供了如下两大功能:与外部设备交换数据的外部总线、串口、中断、握手等信号线;专门的并行控制口线,能够方便地构成多DSP并行处理系统。 多DSP并行处理系统的基本性能取决于组成系统的几个要素:处理单元、并行处理系统网络结构、并行算法、任务分配方法,他们之间紧密联系、互相依赖。 多DSP并行处理系统设计的核心是实现多DSP之间的通信控制及数据交换。并行处理系统网络包括处理单元通信口、矩阵开关组成的网络硬件,以及控制路由选择、消息转发、虚通道等操作的网络软件。其功能主要是为各处理单元提供数据交换的通道,并负责子任务传送和控制调度信号的传递。处理单元之间的网络结构大致可分为两类:一种是共享总线或共享存储器系统,称之为紧耦合式并行系统;另一种是各处理单元有各自独立的数据存储器而通过通信口相连的分布式并行系统,称为松耦合式系统。 文章中列举了现今世界上两家顶级DSP芯片制造商(ADI公司和TI公司)的两款性能优异的并行DSP芯片——ADSP21060/4TMS320C40/60。在对两种通用并行DSP性能参数比较之后,得出结论:ADSP21060/40在速度上更快一些,特别是做FFT运算,而且它的片内RAM很大。TMS320C40/60通信口的使用则更加灵活,可以收发全双工工作,并且可分裂成12个单向通信口,而DSP21060/40的通信口是半双工工作的。所以在做系统设计时,我们可以根据实际问题的特点,选择一款合适的芯片——不要最好,而要最合适。 针对ADSP21060/40这款芯片,多DSP并行处理系统可有以五种结构形式:共享总线式多DSP并行处理系统、基于Link口的多DSP并行处理系统、基于SPORT的多DSP并行处理系统、基于HPI/IDMA的多DSP并行处理系统、基于数据交换的多DSP并行处理系统。具体选择那一种方式,应视具体情况而定。文章中详细介绍了五种结构形式,下面对共享总线的结构简单描述下。 共享总线就是系统中所有DSP的外部总线(地址、数据和访问控制总线)都直接连接在一起,各DSP片内存储器和IOPort寄存器(也映射成存储器地址)以及挂接在总线上的外部存储器、外设都作为共享资源被各个DSP访问。每个DSP有唯一的IDx,使用总线请求信号/BRx中的一个作为它使用外部总线的请求,并根据固定优先或循环优先机制来获取总线控制权而成为主处理器,其它均为从处理器,处理器寻址空间被统一映射。主处理器对从处理器的访问是通过读写(/RD、/WR)和确认(ACK)等控制信号握手完成的,并可在主从处理器间建立DMA(DirectMemoryAccess)传输。另外,主处理器还可以向所有从处理器作广播式数据传送:在存储映射空间中有一块存储区定义为广播式数据区,向它写入数据等价于向所有处理器同时写入此数据,而确认信号ACK则由所有从处理器“相与”合成。共享总线系统对总线访问是直接的,具有速度快、迟延小的优点,在实现数据共享的过程中常常省去了数据传输步骤,从而也节省了宝贵的片内存储器资源。ADI公司的SHARC系列高性能浮点ADSP2106X提供了共享总线所必要的控制握手信号线/BR1-6、ACK、/SW以及片内总线仲裁功能,使最多6片ADSP2106X无需外部控制电路直接相连就可以组成一个存储空间统一、DSP相互之间既紧密耦合又相对独立、数据传送效率极高的共享总线式并行处理系统,如图1所示。 图一 基于ADSP2106X的共享总线式并行处理系统 ADSP2106X适于组成共享总线系统的独到之处是它有大容量的片内存储器,使ADSP2106X大多数时间下的取指令、存取数据都是在各自片内完成的,与外部总线无关。这样各片ADSP2106X可以较高的效率独立工作,外部总线的压力也大大减轻。但其缺点主要在于对总线的特别依赖,当处理器数目增加、处理器间数据交换频繁时,总线瓶颈的限制将突显出来。因此共享总线系统适于处理器数目较少的场合。在对实时性要求很高的场合,可将众多ADSP2106X分组为若干共享总线子系统,子系统之间可用其它通信链路口连接,这样组成的混合式多处理器系统可以达到比单纯的分布式存储系统更高的工作效率。 此外,我也查找了些资料,对比了解下不同连接的拓扑