自主可控高性能GPU芯片开发

高性能计算 图形处理 数据分析 计算能力

高性能GPU(图形处理单元)是计算设备中的关键组件,负责渲染图像、视频和其它视觉内容。近年来,由于虚拟现实、人工智能和高分辨率游戏等图形密集型应用和技术的兴起,对高性能GPU的需求显著增加。高性能GPU在各个应用领域有着广泛的应用,已是国家经济的支柱技术。在当今紧张的国际环境和脱钩的压力下,中国研发自己的高性能GPU显得极其重要。 开发高性能GPU是一个复杂的系统工程,涉及硬件设计、软件设计、先进制程工艺及开源架构和应用集成。开发高性能GPU涉及的许多关键步骤和注意事项,涵盖架构设计、性能优化、软件开发、功耗管理和制造工艺等各个方面。 GPU研发可以归纳为以下:图形处理单元(GPU)是一种专用电子电路,旨在快速操作和更改内存,以加速在帧缓冲区中创建图像,以输出到显示设备。高性能GPU是现代计算设备的重要组件,可实现在游戏、人工智能、科学计算和视觉设计等领域的广泛应用。除了芯片硬件开发之外,还有软件框架开发,包括GPU上运行的固件、Kernel Driver、User Mode Driver、Windows Systems。集成这些系统有很大的挑战。 开发高性能GPU有一系列的困难和挑战,包括: 架构设计:GPU的架构包括处理单元、内存子系统、互连和专用硬件组件(如:纹理单元)。高效且能够处理复杂的图形和运算处理任务的架构极其重要。 软件栈开发:GPU编程需要编写高效的算法、优化并且执行代码以及利用专门的库和框架。软件开发包括驱动程序、编译器和工具。集成开源软件是开发人员能够充分利用到的巨大的开原生态工作之一。 性能优化:最大化性能同时最小化延迟,该瓶颈对于GPU开发至关重要。这涉及优化架构、平衡工作负载以及实施高效的数据处理技术。 测试:GPU是个大系统芯片。除了模块级测试、芯片级测试,还需要整机和多机互联测试。 功耗管理:管理功耗和散热对于高性能GPU来说至关重要,以确保稳定性、可靠性和效率。必须设计多个电源域,并由软件根据需要自动管理。 制造工艺:使用先进半导体制造工艺对于GPU最终性能至关重要。开发高性能GPU需考虑使用最优的生产工艺。同时,也要考虑当前国际形势对可使用工艺的影响。 综上所述,开发高性能GPU是一个充满挑战的大系统过程,需要硬件设计、软件优化和先进工艺技术等方面的专业知识,以及多年经验的积累。研发过程中涉及架构设计、软件开发、可使用IP及制造工艺等领域。在当前国际大环境中,每一个环节都要有研发人员的多年技术积累和灵活应对挑战的能力。 依据国家对高性能GPU的国产自主可控的需求,从图形学理论的基础解析开始,对各种应用场景的算法和算力要求进行了全面分析,定义出完全自研的、面向超标量流处理的架构及核心IP,打造系列产品作为高性能GPU的国产替代,解决卡脖子问题。该国产GPU应遵循国际标准OpenGL&OpenCL,满足高质量图形显示的可编程设计,可形成高性能通用图形处理器板卡、模组、系统等多种形式的产品,采用双精度Tensor Core,实现了自GPU推出以来,高性能计算性能的巨大飞跃。GPU可兼用于显示设备和智算设备。结合80GB的高速GPU显存,可将10小时双精度仿真缩短到4小时以内,HPC应用还可以利用TF32将单精度、密集矩阵乘法运算的吞吐量提升高达10倍,提供功能强大的端到端AI和HPC数据中心平台,并应用于深度学习训练、深度学习推理、高性能计算、高性能数据分析,加速当今时代的重要工作。

推荐机构: 中国图象图形学学会

2024年度

基于CTCS的市域铁路移动闭塞技术的突破

铁路运输 市域铁路 中国列车运行控制系统 移动闭塞

CTCS(中国列车运行控制系统)具有良好的互联互通基础和可扩展性,为进一步提升CTCS在市域铁路上的集成化程度,减少运维成本,节约工程投资,提高运输效率,实现多层次网络互联互通,需要对市域铁路列车运行控制系统进行技术创新。如何实现基于CTCS的市域铁路移动闭塞系统?需要构建基于CTCS的市域铁路总体技术方案,形成基于CTCS的市域铁路移动闭塞标准体系,研制适用于市域铁路的相关装备样机,搭建实验室仿真测试平台,完成样机设备的实验室仿真测试,并进行现场验,以实现关键技术的突破。 市域(郊)铁路是城市中心城区联接周边城镇组团及其城镇组团之间的通勤化、快速度、大运量的轨道交通系统,是实现多层次轨道交通网络互联互通和区域“一体化”“高质量”发展的关键环节。 基于CTCS的市域铁路移动闭塞技术具有系统集成化程度高、轨旁设备少、运维成本低、行车间隔小、工程投资少、可持续发展等特点,同时继承了CTCS体系的互联互通优势,能更好地服务于市域铁路。 基于CTCS的移动闭塞技术在市域铁路领域尚在研发、未有应用,其实现存在着诸多难题,主要包括:构建基于CTCS的市域铁路移动闭塞总体技术方案,形成基于CTCS的市域铁路移动闭塞标准体系,研制适用于市域铁路的相关设备样机,搭建实验室仿真测试平台,完成样机设备的实验室仿真测试,在试验线路现场验证。 难题难点在于: 1、降低运维成本 市域铁路CTCS-2级列控系统采用轨道电路进行列车占用检查,但轨道电路易出现“红光带”的问题,产生原因既有工务的钢轨锁定不良,支距杆、轨距杆绝缘部分损坏;也有电务的扼流变压器损坏,发送盒、接收盒故障;还有供电的牵引回流不畅等原因。轨道电路出现“红光带”会引起列车停车,解决故障可能会需要运维单位工务、电务、供电等多部门联合处理,需要大量的运维成本。 基于CTCS的市域铁路移动闭塞取消轨道电路、有源应答器等设备,可减少维护工作量,降低运维成本,需研究车载多源融合定位方法,并在保证列车运行安全的前提下,综合考虑定位精度、技术发展和成本等,是总体技术难点之一。 2、提高运输效率 市域铁路采用的CTCS2+ATO列控系统属于固定闭塞制式,在列车通过能力方面,通过理论计算分析,基本能满足行车间隔180s的要求。但对于个别线路、个别区段或个别时段的大客流量情况,可能需要更小的行车间隔,更灵活的列车运行或列车编组,进而对系统能力有更高的要求。 移动闭塞技术能缩短行车间隔,提升运输效率。目前,移动闭塞设备主要有CBTC和CTCS-N两种。CBTC单线运营指标良好,但不满足市域铁路的互联互通需求,其网络化运营能力仍需要不断的技术创新和工程验证,进展缓慢;CTCS-N继承了CTCS体系互联互通的特点,实现了区间移动闭塞,但未具备全线路移动闭塞、自动驾驶、自动折返等功能。基于CTCS的移动闭塞技术可实现全线路移动闭塞、自动驾驶、自动折返、互联互通,相关系统功能、技术指标的确定是总体技术的又一难点。 3、节约工程投资 市域铁路采用CTCS-2级列控系统且停靠8辆编组的动车组时,贯通式车站到发线有效长度为400m;上海市域铁路某线路根据相关文件优化到发线有效长度为370m,但规模还是较大,仍需优化。 基于CTCS的市域铁路移动闭塞技术拟采用在出站信号机外方设置防护区段的技术方案,既能保证接发车行车安全,又能进一步减少到发线有效长,进而减小车站建设规模,节约工程投资。 如何应用出站信号机外方的防护区段实现列车运行安全,也是总体技术难题之一。 4、多层次互联互通 基于CTCS的市域铁路移动闭塞技术保留了CTCS2+ATO列控系统的车载功能,既可以实现与国家干线铁路及都市圈城际铁路的互联互通,也可以在市域路网内互联互通,具备小间隔、高密度及灵活运营的优点,同时可为与城市轨道交通互联互通运营打下基础,真正实现“四网融合”的目标。 基于CTCS的市域铁路移动闭塞创新技术路线,是以CTCS-N新技术为基础创新还是以成熟CTCS2+ATO为基础进行叠加需要进行严谨比选。为保证设备级的互联互通,需要多个设备厂家和设计院共同参与、深入研究,并经过完整功能的现场验证。其技术路线的选择、设备功能确定、技术实现方法及现场验证等都是总体技术的难点。 上海市域铁路要实现路网内部互联互通、与长三角地区近沪城际铁路互联互通、与国铁干线互联互通。上海申铁投资有限公司(简称上海申铁)作为市域铁路建设主体,已开工建设5条线,分别是机场联络线、南汇支线、嘉闵线、示范区线、南枫线,其中机场联络线将于2024年底开通CTCS2+ATO(含自动折返)。

推荐机构: 中国铁道学会

2024年度

共22页 转到