你的位置:电感厂 > 先锋技术功率电感

嵌入式ARM多核处理器并行化方法

2016-07-28 12:28:45      点击次数:
上一篇:DLP大屏幕显示系统光源深度对比综述 贴片电感

  ① 并行化程序的性能取决于程序中串行化部分,程序性能不会随着并行线程数目的提升而不断提升;

  ② 嵌入式多核处理器相对于PC处理器而言,其总线速度较慢,并且缓存(Cache)更小,会造成大量数据在内存(Memory)和缓存(Cache)问不断拷贝,因此在进行并行化优化的过程中,应考虑缓存友好性(Cache friendly);

  ③ 程序并行化执行线程数目应当小于或等于物理处理器的数目,线程过多会造成线程间抢占处理器资源,致使并行化性能下降。

  2 OpenMP并行化优化

  2.1 0penMP工作原理简介

  OpenMP是一个基于共享内存模式的跨平台多线程并行的编程接口。主线程生成一系列的子线程,并将任务映射到子线程进行执行,这些子线程并行执行,由运行时环境将线程分配给不同的物理处理器。默认情况下,各个线程独立执行并行区域的代码。可以使用work-sharingconstructs来划分任务,使每个线程执行其分配部分的代码。通过这种方式,使用OpenMP 可以实现任务并行和数据并行。

  嵌入式ARM多核处理器并行化方法

  图2 任务并行模型

  任务并行模式创建一系列独立的线程,每一个线程运行一个任务,线程之间相互独立,如图2所示。 OpenMP使用编译原语session directive和task directive来实现任务分配,每个线程可以独立运行不同的代码区域,同时支持任务的嵌套和递归。一旦创建任务,该任务就可能会在线程池(其大小等于物理线程数目)中空闲的线程上执行。

  数据并行也就是数据级并行,对任务中处理的数据进行分块并行执行,如图3所示。C语言中的for循环最适合使用数据并行。大电流电感

  • Yaffs2文件系统中对NAND Flash磨损均衡的改进 摘 要: 针对以NAND Flash为存储介质时Yaffs2文件系统存在磨损均衡的缺陷,通过改进回收块选择机制,并在数据更新中引入冷热数据分离策略,从而改善NAND Flash的磨损均衡性能。实

  • 为了加强小型、高效电感电抗器的开发和销售,实施 阿尔卑斯绿色器件株式会社(位于东京都大田区,代表取缔役社长:岛冈基博)和东邦亚铅株式会社(位于东京都中央区,代表取缔役社长:手岛达也)就有关线圈项目的业务合作达成共识,并于10月

  • 电池组管理实现了另一次飞跃
    对电动汽车可行性的怀疑已经平息很久了。现在的主要问题是:“新型大功率电池技术可渗透多远、多宽和多深?”也许答案并不令人意外,没人真正知道确切的结果。不过,考虑一

  • 保障系统信号完整性测量,您必须知道的探头ABC
  • 6通道与单通道球幕投影系统比较
  • 放大器输入保护...福兮祸兮?
  • FPGA的系统设计实现方案
  • 我是个新手那位老师能帮下忙,我想一个SG3525 输
  • 嵌入式视觉技术--潜力巨大,有待开发
  • 步进电机和驱动器的选择方法
  • 宽带阻抗测量仪的设计——阻抗测量理论及其方法
  • 非隔离buck的功率电感的内阻与温升
  • 盘点无人驾驶主流主动安全技术