一种服务器n 1冗余电源功率控制系统及方法与流程
发布时间:2021-07-28 | 发布者: | 浏览次数: 次本发明属于服务器电源技术领域,具体涉及一种服务器n 1冗余电源功率控制系统及方法。
背景技术:
随着互联网行业的迅速发展,服务器性能不断提高,高功率服务器的供电冗余和整机功率节能问题越来越被业内人士所重视。高功率服务器一般要求电源支持冗余设计,psu电源为2个或2个以上同规格并联,同时高功率服务器一般都需要支持4个。目前常见的冗余设计方式为3 1冗余,即当某一个psu电源发生故障时实现系统冗余,剩余3个psu电源仍可支持服务器工作,不会导致服务器出现宕机的现象。
目前针对psu电源3 1冗余设计,多节点服务器的实现方式如下,当某个psu电源出现故障时,系统仍然可以正常工作,同时不会出现宕机现象。但是如果psu电源故障前系统电流负载超过剩余psu电源的最大负载能力,则在psu电源出现故障后,需要将各个计算节点模块的性能下降到当前电源可支持的最大性能。
现有技术中的4psu电源的多节点服务器能够支持3 1条件下的功率封顶,只能对所有供电的负载同时触发封顶冗余机制,不能够根据客户的业务需求选择性的针对某几个计算节点单独进行触发,若某个psu电源出现异常,则会导致客户中的重要业务的计算节点出现业务中断或者性能下降,进而造成重大损失。另外,不进行cpld的硬件触发而至通过bmc软件进行功率调整,会导致处理时间过长,进而服务器会因为电源过载时间过长而宕机。
技术实现要素:
针对现有技术的上述不足,本发明提供一种服务器n 1冗余电源功率控制系统及方法,以解决上述技术问题。
第一方面,本发明提供一种服务器n 1冗余电源功率控制系统,包括:多个psu电源、多个比较器、cpld、bmc和负载;所述多个比较器均与cpld连接;所述比较器与所述多个psu电源一一对应连接;所述负载至少有一个,且所述负载与cpld连接;所述cpld与多个负载之间分别设置多个使能开关;所述bmc通过使能信号线与使能开关连接;所述bmc通过pmbus管理总线与psu电源连接。
进一步的,所述cpld包括逻辑与门电路和缓冲存储器,所述逻辑与门电路和缓冲存储器连接,且所述逻辑与门电路和缓冲存储器之间设置有cpld使能开关。
进一步的,多个psu电源与bmc通过present信号线连接。
第二方面,本发明提供一种服务器n 1冗余电源功率控制方法,其特征在于,包括:
bmc根据各cpu的工作重要性设定所在计算节点的优先级,将优先级低的计算节点作为目标节点;
cpld确定n 1冗余电源系统中某一psu电源存在故障,控制目标节点的cpu以最低功率运行;
bmc计算非故障psu电源提供的最大功率之和,所述和作为封顶功率,并监控系统总功率;
目标节点提高其cpu的运行功率,直到系统总功率回升到封顶功率。
进一步的,在所述bmc确定n 1冗余电源系统存在故障psu电源之前,包括:
bmc采集n 1个psu电源的实时总功率和最大功率规格;
bmc计算n个psu电源的最大功率规格之和,得出功率阈值;
bmc计算各个psu电源实时功率之和,得到故障前的实时总功率;
当所述故障前的实时总功率大于功率阈值,bmc打开目标节点的cpld使能开关。
进一步的,所述bmc计算非故障psu电源提供的最大功率之和,所述和作为封顶功率,并监控系统总功率,包括:
bmc通过pmbus总线监控正常工作的psu电源的实时功率;
bmc计算所有正常工作的psu电源的实时功率之和,所述和作为系统总功率。
进一步的,在所述cpld确定n 1冗余电源系统中某一psu电源存在故障之后,所述方法还包括:
bmc发出故障告警通知用户需要进行电源修复。
本发明的有益效果在于,
本发明提供的一种服务器n 1冗余电源功率控制系统及方法,提出在n 1冗余电源系统中,支持某一psu电源故障后,能够尽量保证服务器整体的运行效率,当某一psu电源故障时,系统能够选择处理关键工作的cpu持运来的高功率状态,保证服务器能够正常处理关键流程,使其他cpu降低运行功率,从而保证了剩余计算节点的业务能够正常运行的场景,为客户提供更优的电源冗余故障保护方案。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例的系统的结构示意图;
图2是本申请一个实施例的方法的流程示意图;
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
下面对出现的关键名词进行解释:
pch全称为platformcontrollerhub,是intel公司的集成南桥;
intelme是intelmanagementengine的简称,中文翻译为英特尔管理引擎。
下面将参考附图并结合实施例来详细说明本发明。
如图1所示,本申请实施例提供一种服务器n 1冗余电源功率控制系统,包括:四个psu电源、四个比较器、cpld、bmc和八个负载;四个比较器均与cpld连接;所述比较器与所述四个psu电源一一对应连接;所述八个负载均与cpld连接;所述cpld与八个负载之间分别设置多个使能开关;所述bmc通过使能信号线与使能开关连接;所述bmc通过pmbus管理总线与psu电源连接;所述cpld包括逻辑与门电路和缓冲存储器,所述比较器均与cpld的逻辑与门电路连接;所述逻辑与门电路和缓冲存储器连接,且所述逻辑与门电路和缓冲存储器之间设置有cpld使能开关;四个psu电源与bmc通过present信号线连接。
在本实施例中,所述四个psu电源为负载供电,bmc通过present信号线检测到psu电源上电时,bmc提前分析系统实时总功率和,bmc根据分析结果采取是否打开cpld使能开关,若当所述故障前的实时总功率大于n个psu电源最大功率规格,则bmc发送gpio_override信号给cpld,当其中一个pus电源发生故障时,比较器通过分析电源的异常电压,输出alert信号给cpld,逻辑与门电路和缓冲存储器发送指令,根据计算节点的工作重要性的高低,控制部分cpu以最低功率运行;bmc计算故障后三个正常的psu电源提供的最大功率之和,所述和作为封顶功率,并监控系统总功率;目标节点的pch中的intelme提高目标节点的cpu的运行功率,直到系统总功率回升到封顶功率。
图2是本发明一个实施例的方法的示意性流程图。其中,图2执行主体可以为一种服务器n 1冗余电源功率控制系统。
如图2所示,该方法100包括:
步骤110,bmc根据各cpu的工作重要性设定所在计算节点的优先级,将优先级低的计算节点作为目标节点;
步骤120,cpld确定n 1冗余电源系统中某一psu电源存在故障,控制目标节点的cpu以最低功率运行;
步骤130,bmc计算非故障psu电源提供的最大功率之和,所述和作为封顶功率,并监控系统总功率;
步骤140,目标节点提高其cpu的运行功率,直到系统总功率回升到封顶功率。
为了便于对本发明的理解,下面以本发明一种服务器3 1冗余电源功率控制方法的原理,结合实施例中对服务器3 1冗余电源系统进行管理的过程,对本发明提供的n 1冗余电源功率控制方法做进一步的描述。
(1)选择目标节点:bmc根据各cpu的工作重要性设定所在计算节点的优先级,将优先级低的计算节点作为目标节点;
(2)预先判断是否需要对电源进行功率控制:bmc采集3 1个psu电源的实时总功率和最大功率规格;bmc计算3个psu电源的最大功率规格之和,得出功率阈值;bmc计算各个psu电源实时功率之和,得到故障前的实时总功率;当所述故障前的实时总功率大于功率阈值,bmc打开目标节点的cpld使能开关。
(3)psu电源故障处理:当n 1冗余电源系统中psu电源存在故障时,cpld控制目标节点的cpu以最低功率运行,其他工作性能比较重要的计算节点的运行功率不受影响,仍然保持高功率模式运行。
(4)对cpu的运行功率进行控制:bmc计算故障后n个正常的psu电源提供的最大功率之和,所述和作为封顶功率,并监控系统总功率;计算节点的pch中的intelme提高目标节点的cpu的运行功率,直到系统总功率回升到封顶功率,最小程度的减少psu电源故障对系统的影响。
(5)用户告警:在所述bmc确定3 1冗余电源系统存在故障psu电源之后,bmc发出故障告警通知用户需要进行电源修复。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
技术特征:
1.一种服务器n 1冗余电源功率控制系统,其特征在于,包括:多个psu电源、多个比较器、cpld、bmc和负载;所述多个比较器均与cpld连接;所述比较器与所述多个psu电源一一对应连接;所述负载至少有一个,且所述负载与cpld连接;所述cpld与多个负载之间分别设置多个使能开关;所述bmc通过使能信号线与使能开关连接;所述bmc通过pmbus管理总线与psu电源连接。
2.根据权利要求1所述的一种服务器n 1冗余电源功率控制系统,其特征在于,所述cpld包括逻辑与门电路和缓冲存储器,所述逻辑与门电路和缓冲存储器连接,且所述逻辑与门电路和缓冲存储器之间设置有cpld使能开关。
3.根据权利要求1所述的一种服务器n 1冗余电源功率控制系统,其特征在于,多个psu电源与bmc通过present信号线连接。
4.一种服务器n 1冗余电源功率控制方法,其特征在于,包括:
bmc根据各cpu的工作重要性设定所在计算节点的优先级,将优先级低的计算节点作为目标节点;
cpld确定n 1冗余电源系统中某一psu电源存在故障,控制目标节点的cpu以最低功率运行;
bmc计算非故障psu电源提供的最大功率之和,所述和作为封顶功率,并监控系统总功率;
目标节点提高其cpu的运行功率,直到系统总功率回升到封顶功率。
5.根据权利要求4所述的一种服务器n 1冗余电源功率控制方法,其特征在于,在所述bmc确定n 1冗余电源系统存在故障psu电源之前,包括:
bmc采集n 1个psu电源的实时总功率和最大功率规格;
bmc计算n个psu电源的最大功率规格之和,得出功率阈值;
bmc计算各个psu电源实时功率之和,得到故障前的实时总功率;
当所述故障前的实时总功率大于功率阈值,bmc打开目标节点的cpld使能开关。
6.根据权利要求4所述的一种服务器n 1冗余电源功率控制方法,其特征在于,bmc计算非故障psu电源提供的最大功率之和,所述和作为封顶功率,并监控系统总功率,包括:
bmc通过pmbus总线监控正常工作的psu电源的实时功率;
bmc计算所有正常工作的psu电源的实时功率之和,所述和作为系统总功率。
7.根据权利要求4所述的一种服务器n 1冗余电源功率控制方法,其特征在于,在所述cpld确定n 1冗余电源系统中某一psu电源存在故障之后,所述方法还包括:
bmc发出故障告警通知用户需要进行电源修复。
技术总结
本发明提供一种服务器n 1冗余电源功率控制系统及方法,包括:多个psu电源、多个比较器、cpld、bmc和负载;所述多个比较器均与cpld连接;所述比较器与所述多个psu电源一一对应连接;所述负载至少有一个,且所述负载与cpld连接;所述cpld与多个负载之间分别设置多个使能开关;所述bmc通过使能信号线与使能开关连接;所述bmc通过pmbus管理总线与psu电源连接。本发明解决了psu电源故障时,系统能够选择处理关键工作的cpu保持原来的高功率状态,使其他cpu降低运行功率,从而保证了剩余计算节点的业务能够正常运行的场景,为客户提供更优的电源冗余故障保护方案。
更多psu电源内容,请访问。
转载请标注:东东工作室——一种服务器n 1冗余电源功率控制系统及方法与流程