實現不斷電智慧備用電池(第四部分):BBU架的操作

作者:ADI應用開發工程師Christian Cruz 及資深韌體工程師Marvin Neil Cabueñas


摘要

本文介紹ADI用於開放運算計畫開放機架第3版(OCP ORV3)備用電池單元(BBU)架的硬體和軟體。其主要功能是建立BBU模組之間的通訊,並透過為此類應用精心打造的圖形化使用者介面(GUI)向使用者呈現可讀數據和資訊。

引言

備用電池架是OCP ORV3架構和資料中心應用中電源管理系統的重要功能,對於不斷電供應系統(UPS)來說尤為關鍵。這些架子經過精心設計,專門用於存放和管理備用電池,是確保關鍵設備在停電和電壓波動情況下穩定運行的重要保障。

在如今技術高度發達的時代,可靠備用電源系統的重要性不言而喻。資料中心、電信樞紐和伺服器機房的穩定性對公司營運非常重要,因此強大的備用電源系統必不可少。在此種背景下,備用電池架作為這些系統的基礎,在各產業中發揮著關鍵作用。這些架子是高效存放BBU的基礎樞紐,有助於提升儲備關鍵電力的可用性,其主要作用是容納和管理多達六個BBU模組,每個模組都精準對齊以容納與電源轉換器配對的鋰離子電池。這些架子的結構經過悉心設計,巧妙地將空間利用效率和可存取性融為一體,令維護工作更加便捷,更換操作也更加簡單。

電池備用架的一大優點在於能夠集中管理和組織BBU模組庫存。一個規範的存放系統有利於對BBU模組進行追蹤、標記和維護,進而減少誤放或混淆的風險,這對於關鍵情況尤其重要。此外,此集中化的存放系統還為電池健康監測提供了高度便利性,更加便於定期進行檢查、測試和更換操作。

BBU架有多種尺寸和配置,可滿足不同產業和機構的個性化需求。部分架子採用模組化設計,提供了彈性,可適應未來電力需求的發展。同時,這些架子上裝有整合監控系統,可即時提供電池狀態資訊。此外,電壓水準、溫度、模組活動和剩餘容量等詳細資訊也一目了然,方便進行預防性維護,並確保電池在關鍵時刻隨時可以提供電力。

BBU架概述

根據OCP對ORV3新架構的定義,開放機架電源架構由集中式可擴展電源架和BBU架組成,BBU架透過公共母線將電力分配給有效載荷裝置(IT設備)。此規範對適合放入開放機架的BBU架做出了定義。BBU架將包含六個BBU模組,具有5+1冗餘能力,為機架內的所有有效載荷提供直流電源。當交流電源斷電時,BBU架可以在指定的備用時限內持續提供備用電源,功率最高可達電源架的最大額定值。BBU架的備用時間使得機架可以在不同電源之間切換而不影響IT設備運行,並且應用程式可以在電源斷電前安全轉移或關閉。

Figure 1. BBU shelf configuration in an OCP ORV3 architecture.

圖1. OCP ORV3架構中的BBU架配置1

架微控制器韌體

BBU應用中使用MAX32625作為架微控制器,此為一款超低功耗 Arm® Cortex®-M4 微控制器,在應用中需負責多個程序。

  1. 透過Modbus®協定與主機通訊
  2. 透過Modbus協定與模組通訊
  3. 處理模組的定期充電
  4. 系統控制模式

透過Modbus協定與主機通訊

在圖2中,架微控制器發揮的關鍵作用是充當專業Modbus伺服器,透過穩健的RS-485介面與主機建立無縫通訊,主要功能是持續地即時從眾多模組收集資料。隨後將所採集的資料傳送到主機,用於填充動態GUI應用程式,進而提供更直覺的圖形展示。當從主機接收到通訊時,架微控制器充當「守門員」,有條不紊地驗證每條消息的有效性和完整性。微控制器確認消息的真實性滿足要求後,會利用保持暫存器中儲存的訊息量快速地擬定答案。這個精心設計的回應包含主機所需的答案,答案並會以結構化的方式呈現。

Figure 2. (a) A module-to-shelf communication diagram and (b) A shelf-to-PC communication block diagram.

圖2. (a)模組到架的通訊示意圖,(b)架到PC的通訊方框圖。

然而,當傳入的消息受到異常污染時,架微控制器不會發生故障,而是會迅速承擔起有效通訊者的角色,根據Modbus協定以錯誤消息進行回應。此錯誤通知會向主機發出異常警報,以便後者採取適當的糾正措施。

本質上,架微控制器的重要性體現在其所扮演的多元角色上——其既是資料管道,又是資料完整性守護者,並且是回應式資訊提供者。這些都有助於在Modbus驅動的交互領域中建構強大而可靠的通訊框架。

透過Modbus協定與模組通訊

在圖2中,架微控制器的關鍵作用變得明晰,其在Modbus用戶端和Modbus伺服器的角色之間無縫轉換,協調複雜而高效的通訊生態系統。當與許多BBU模組交互時,架微控制器扮演Modbus用戶端的角色,發起並維護與每個唯一模組的對話。這些BBU模組充當Modbus伺服器,不斷使用最新資訊更新其保持暫存器。在同步工作時,架微控制器還以迴圈方式遍歷BBU模組環境,定期擷取來自每個模組的遙測資料。這些包含有用洞察的資料被小心地儲存在微控制器的記憶體中,以便在主機提出問題時可以隨時做出回答。

不過,架微控制器的用途不僅限於BBU系統內的用戶端-伺服器交互,還可以轉換為Modbus伺服器,根據請求將收集的資料傳送到主機,在主機和眾多BBU模組之間架起重要橋樑。與此同時,它繼續發揮Modbus用戶端的作用,管理與BBU模組的交互,並確保資訊是最新且準確的。

本質上,架微控制器具備多功能性和適應性,能夠彈性充當用戶端和伺服器,促進主機與BBU模組之間的交互。此種相互聯繫顯示其有能力維持穩固的通訊結構,進而提升整個系統的效率和可靠性。

處理模組的定期充電

根據OCP要求,BBU模組必須定期充電,因為電池組在待機時會漏電。BBU模組每10天只能充電一次,因此架微控制器必須監控和管理哪些BBU模組需要充電。架微控制器透過Modbus協議命令來確定哪些BBU模組需要定期充電,然後啟動相應的定期充電操作。OCP確立的標準決定了系統架構中BBU模組的基本需求。這些模組是系統的關鍵組成部分,必須定期充電,因為電池組在待機期間會發生電流洩漏。換句話說,定期充電是保持最佳性能和運行可靠性的必要操作。

系統控制模式

最後,OCP建議增加用戶控制項來覆蓋BBU模組操作。透過Modbus,用戶可以調整單個BBU的運行狀況,以確定其是否需要充電或放電。

BBU架圖形化使用者介面(GUI)

BBU模組GUI分為若干部分,負責向使用者提供重要資訊,以下將詳細介紹具體部分和功能。參見圖3。

  1. 模組運行狀態指示燈
  2. 模組內部溫度讀數
  3. 模組故障指示表
  4. 風扇轉速指示(單位:rpm)
  5. 電源轉換器指標資訊
  6. 電芯資訊(電壓和溫度)

Figure 3. A BBU module.

圖 3. BBU 模組。

模組運行狀態指示燈

GUI上至少有4個LED指示燈:

  • 藍色LED表示BBU模組處於充電工作模式
  • 第一個琥珀色LED表示BBU模組處於放電模式,並為資料中心的背板提供備用電源
  • 第二個琥珀色LED表示BBU模組處於壽命末期(EOL),需要更換
  • 紅色LED指示BBU模組發生故障

模組內部溫度讀數

除了BBU運行狀態外,模組的內部溫度也會顯示在GUI中。電池堆和電源板內至少放置了九個溫度感測器。LTC2991向主MCU提供數位溫度讀數;而 ADBMS6948提供電池堆的類比溫度讀數。

模組故障指示表

GUI的故障表描述了模組運行期間觸發的不同類型故障。模組故障如下:

  • 過壓保護(OVP)
  • 過流保護(OCP)
  • 過溫保護(OTP)
  • 過放電保護/過充電保護
  • 風扇關閉

電源轉換器指標

GUI是一項重要資源,可在模組運行時,為電池堆和背板提供重要運行指標。這些指標範圍很廣,涵蓋了輸入、輸出電壓以及電流等關鍵資料。模組運行和GUI之間的這種動態交互讓使用者得以完整即時地瞭解系統性能和能源動態。

電芯訊息

GUI會顯示電池堆電芯電壓和溫度水準。這些資料對於確定電池堆的健康狀態(SOH)和充電狀態(SOC)非常重要。

BBU模組GUI中有一個包含簡單摘要和使用者控制功能的視窗。這個特定選項卡可以監控所有六個BBU模組,同時支援對特定BBU進行單獨控制,包括執行運行決策。圖4直覺的呈現了相關內容。

  • 位址選擇器
  • 架系統控制
  • 架系統參數
  • 架故障和均流

Figure 4. BBU modules summary GUI.

圖4. BBU模組摘要GUI。

位址選擇器

用戶可以透過策略性地精準選擇BBU槽位址來順利存取指定的BBU模組。這種策略分配並不是隨機的;這是為了防止Modbus通訊衝突而採取的預防措施,透過預定義一組BBU架槽地址來實現。

架系統控制

賦予用戶修改BBU操作的許可權,讓使用者可以指令特定BBU模組在運行期間充電或放電。選擇強制放電模式會導致升壓電壓從48 V升高到51 V,從而有利於背板供電,同時讓資料中心內的電源單元(PSU)保持運作而不受干擾。這種細微的控制,可確保BBU功能與大型基礎設施的無縫運行之間保持卓越平衡。

架故障和均流

摘要表中會顯示在六個BBU模組上檢測到的任何故障並通知使用者,可以迅速定位BBU架中任何故障。此外,在BBU模組並行或冗餘操作期間,均流匯流排指示器顯示當背板負載為最大值時,匯流排電壓為7 V,當峰值負載操作有效時,匯流排電壓為10.5 V。

總結

BBU架是實現可靠電源管理系統的關鍵元件。這些架子牢牢地相互連接,為備用電池系統創建了一個穩定的環境,是高效管理的核心樞紐。如此便能實現無縫運行,保持關鍵系統不間斷,避免受到斷電和電壓波動影響。BBU架為資料中心、電信網路和任何需要UPS的環境提供重要保護,其主要使命是確保營運的連續性,提高可靠性,並保持電源基礎設施穩健運行。本系列的下一篇文章將介紹如何為BBU輔助電路選擇合適的元件,其中的標準和建議將有助於為關鍵設備選擇恰當的電源零件,並減少設計不規則性。

參考電路

David Sun。 「1.1版開放運算計畫開放機架V3 BBU架」。開放運算計畫,2022年9月。