cpubbs论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

LabVIEW+单片机学习套件全套教程资料下载[免费]LabVIEW论坛精华列表贴USB0816数据采集卡《LabVIEW宝典》
LabWindows/CVI论坛精华贴NET0816以太网数据采集卡RC0210远程设备授权系统 关闭关停锁定打开设备 户外分布式数据采集
NET1624低速高精度以太网数据采集卡WIFI0824SD无线WIFI网络数据采集卡脱机运行 SD存储 小尺寸微型 串口采集远程采集 安卓 手持移动采集 纪录仪
查看: 324|回复: 0

解决DSP设计面临的终极挑战

[复制链接]
发表于 2017-5-17 16:03:27 | 显示全部楼层 |阅读模式
多年来,数字信号处理器 (DSP) 设计人员一直在应付这样一项艰难的工作:提供占用空间小的高性能芯片,而且要不影响灵活性和软件的可编程能力。
由于新的应用程序发展速度惊人,提供的 DSP 必须在功率、性能和使用寿命上跟上这种速度,应对当前面临的挑战,并准备好应对未来的应用。这些高性能多核心 DSP被越来越多地应用在电信接入、改进数据率GSM服务(EDGE)和基础设施设备领域,用来处理语音、视频和无线电信号。
以前,电信设备制造商使用专用的 ASIC 或 DSP-ASIC 组合来达到自己的目标。现在,这些新的 DSP 可以替代那些繁琐的解决方案;如果足够强大,它们还可以实现以前的解决方案所无法实现的灵活性。对于那些必须在网络部署中持续使用多年的接入和基础设施设备,而言, 这些灵活的解决方案是大有裨益的。假如这些类型的设备和应用程序的使用寿命得到延长,那么,成功的关键就是灵活性、适应性和现场可编程性。
在目前的技术条件下,ASIC 在灵活性或现场可编程性方面不如 DSP,但 DSP 的能耗较大,这让芯片设计人员左右为难。不过,还是有希望:新一代的多核心 DSP可以同时做到高性能和高能效。做到这点的技术是存在的,但必须先解决“功率耗散”(功率极限)问题。
功率极限
目前,芯片功率耗散的源头有两个:以泄漏形式出现的静态现象;以开关运算形式出现的动态现象。在采用 90 纳米和以下工艺的 CMOS 技术中,这种功率耗散现象最为明显。但是,新一代的 DSP 设计不仅能减轻和避开这种功率极限,而且实际上可以提高基础设施、接入和 EDGE 设备的处理能力,同时限制功率消耗和热量耗散。
部分特定CMOS 技术下的能耗界定的关键度量指标:
•电源电压
•门开关速度
•门输入电容
•门功耗
•每个 MAC 运算消耗的能源
研究表明,同等功能(如 MAC 单元)的功率密度(即单位面积的功率)在 0.13 微米(含)以上的芯片中相当稳定。但是,到达90 纳米时,这个指标会突然升高。
Power/Areaversus Silicon Technology
功率/面积与硅技术
Powercrisis at 90 nm and below
90 纳米及以下工艺的功率极限
um
微米
nm
纳米
在采用 0.13 微米技术以前,DSP 设计能够在提高性能的同时降低功率,从而可以在单个芯片中植入更多的电路。这主要是通过减小尺寸并降低电压实现的。采用了 90 纳米技术后,所有这一切就都行不通了。
现在面临的是以性能换功能的问题,这是设备制造商所不愿遇到的情况:在一个芯片中植入更多电路但降低性能,或者减少电路数以减少功能。
由于“功率极限”的情形继续存在,设计人员一直在通过增加功耗来获得性能和功能方面的优势。但是,这会带来一种新的风险:达到热量耗散的极限。所产生的问题可能已经在当前市场上最新一代的通用多核心 DSP 中出现。
零-和博弈:静态能效
因为性能是基础设施、接入和 EDGE 应用的主要目标,因此设计人员一般并不关心零待机功率问题。因此,通常采用通用硅工艺来优化性能,而不会选择低泄漏的硅。选择低泄漏的硅可以降低待机功率,但也会降低速度和性能。
这就要求有选择地使用晶体管。
在使用电池的设备中,高电压阈值 (HVT) 可能是最佳的;但在基础设施应用中,首选的是标准电压阈值 (SVT) 技术。
例如,假如某个设计使用 HVT 逻辑运算,并且电源电压为 1.2V,则将连续产生 20mW 的泄漏功率。如果以最大容量运算,则将消耗 1W 的动态功率。
使用 SVT 逻辑运算的相同设计在电源电压为 1.0V 时可以实现几乎相同性能,产生的泄漏功率多出 4 倍 (100mW),但动态消耗的功率只有 694mW (1.02 /1.22 = 0.694)。
因此,泄漏较高的 SVT 设计消耗的总功率只有 790mW,而相比之下,HVT 设计的消耗总功率为 1.02W。前者比后者节能 23%。
HVT 设计和 SVT 设计的功耗比较
Anunused module can be disabled anytime using an enable signal. Associated logicand clock trees contained in a disabled module will therefore stop consumingpower.
可以使用激活信号随时禁用未使用的模块。被禁用的模块中包含的相关逻辑和时钟树会因此停止消耗能量。
Anunused module can be disabled anytime using an enable signal. Associated logicand clock trees contained in a disabled module will therefore stop consumingpower.
可以使用激活信号随时禁用未使用的模块。被禁用的模块中包含的相关逻辑和时钟树会因此停止消耗能量。
module0is enabled
module0已激活
module1is enabled
module1已激活
module2is disabled
module2被禁用
mclk isgrounded
mclk 接地
MODULE0(array of gates and flip-flops)
MODULE0(门和触发器阵列)
MODULE1(array of gates and flip-flops)
MODULE1(门和触发器阵列)
MODULE2(array of gates and flip-flops)
MODULE2(门和触发器阵列)
性能
两种设计实现的性能相同。
尽管与人们预料的情况相反,这一示例表明,使用较高泄漏的 SVT 逻辑与使用低泄漏的 HVT 逻辑相比,可以在总体上节能,这是因为后者电路中的开关活动量很大。对于乘法和累加 (MAC) 电路,这种设计特别有用;但如果用在低活动因素的电路(如 RAM 电路或测试电路)上,则会出现相反的结果。因此,SVT 逻辑适用于基础设施中“始终打开”的设备。
动态化:能效优化
时钟树和逻辑切换都会导致动态能耗,必须在新一代多核心 DSP 中进行处理。通过不断优化这两种耗能因素的设计,可以极大地改进能效指标。
        北京翼凌云科技有限公司简称青翼科技,位于北京中关村高新技术产业核心区,是一家快速发展中的高科技企业。公司致力于高端嵌入式智能系统的集成和开发服务。青翼科技一直引领最新的DSPFPGA技术,为客户提供最新的硬件技术、一体化的验证平台和可实战化的解决方案。青翼科技研发了一系列基于DSP数字信号处理系统。研发的产品包含Camera Link智能图像分析平台、高速实时数据处理平台、数据高速采集记录与 仿真模拟平台、音视频图像压缩存储平台、光纤交换平台、超声信号检测、北斗卫星 通信平台、软件无线电平台等领域。应用TI DSP XilinxAltera公司的 FPGA,先后研发了CPCICPCI expressVPX架构的开放式平台。青翼科技的地址;北京市昌平区科星西路106号院5号楼1012室;公司电话;010-50976375    15811214467   李工    公司网址;www.tsingetech.com

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|cpubbs论坛. ( 粤ICP备09171248号 )

GMT+8, 2025-4-5 06:46 , Processed in 0.382923 second(s), 7 queries , Gzip On, File On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表