相比于大型算力中心、校级机房以及大型业务机房,这种适用于学院级别甚至课题组级别和中小型企业的机房的要求并不太高,更多地还是考虑成本、省事。这个时候就可以考虑适用于中小型模块化机房(一般不超过60平米),其优势在于标准化程度高、建设周期短、适合高校实验室和小型算力场景。
但模块化机房也并不是简单买几个机柜放进房间,不同的规格之间也存在较大的成本差异。我们材料人为此整理了几个需要提前考虑的因素,供老师们参考。我们也出了一个链接,简单填入一些需求,就可以输出适用的方案。
一、先选房间
首先要判断这个房间是否具备长期放置高功耗、高发热、重型设备的条件。
老师需要重点关注:
· 房间面积是否足够
· 梁下净高是否满足,建议不低于 2.6m
· 门洞、走廊、电梯是否能让机柜进场
· 是否靠近强电井或配电间
· 是否靠近外墙,方便空调室外机安装
· 是否有冷凝水排水条件
· 房间上方或周边是否有水管、卫生间、开水房等漏水风险
二、再算功耗
模块化机房选型的核心参数是IT 设备总功耗。IT 总功耗不但要把服务器功耗算作在内,还要把存储设备功耗、网络设备功耗、未来扩容预留功耗都计算在内。
接着根据功耗再来选机柜。机柜选型不能只看 U 位够不够,还要看单柜功率密度。对于42U机柜而言,很多时候并不是放不下而是功率不够。
| 机柜类型 | 单柜功率参考 | 适用场景 |
| 通用计算 / 存储柜 | 4-6kW/柜 | CPU 节点、存储、交换机 |
| GPU 高密算力柜 | 8-10kW/柜 | 多卡 GPU 服务器、AI 训练 |
| 更高密度机柜 | 10kW 以上/柜 | 需专项制冷和供电设计 |
对于偏小型的机房,最好是选择10KW以下的机柜。另外,根据我们多年运营超算经验,很多时候CPU、GPU实际功率并没有根据各配件相加起来那么大。例如我们一个3.6KW的机柜,就可以放6台4U Intel 至强铂金8488C甚至8581C双路服务器。
三、空调怎么选
机房空调的制冷量选型应在IT总功耗的基础上增加安全冗余,一般可乘以制冷安全冗余系数1.2-1.3,用以覆盖夏季极端高温、管路损耗及空调长期运行衰减。若房间存在外窗、西晒、隔热较差等情况,还可适当考虑建筑微环境热渗入影响。例如若 IT 总功耗计算为 22 kW,则精密空调总制冷量应规划约为28.6 KW。注意这里的KW是制冷量,不是功率。两者之间存在着一个精密空调制冷能效比,通用变频机组常规取 3.0 左右。
空调形式可以这样选择:
| 场景 | 建议空调形式 |
| 2~3 柜,功率较低 | 可考虑机架式空调 |
| 多台 GPU 服务器,高热密度 | 优先考虑列间式空调 |
| 任务连续性要求较高 | 可考虑 N+1 冗余 |
| 房间已有普通空调 | 只能作为辅助,不建议作为主要制冷 |
四、供电与UPS怎么选
大楼输入的市电总容量必须能够完全覆盖整个微模块在极端满载情况下的总功耗(含算力、制冷及综合损耗)。
机房总配电容量可按以下方式进行前期估算:
S 总配电容量(kVA) ≈ [P IT 总功耗(kW) + P 空调输入功率(kW)] ÷ PF × δ
其中:P 空调输入功率 ≈ Q 空调总制冷量(kW) ÷ COP
PF 为系统综合功率因数,前期可按 0.85~0.90 估算;δ 为配电安全裕度系数,前期可按 1.15~1.20 估算。
若采用三相 380V 供电,估算工作电流可按:
I(A) ≈ S 总配电容量(kVA) × 1000 ÷ (√3 × 380)
这个电流代表了机房在最极端恶劣的工况下(如夏天空调满负荷制冷、服务器全部满载跑大模型、UPS同时在大电流充电),向大楼电网索取的最大持续工作电流。这个值决定引线电缆的物理截面积、确定主控断路器的额定整定值。以下是工程线缆级配落地建议:
| 机房总输入容量 | 推荐阻燃交联铜芯电缆截面积 | 上游一级配电箱主控断路器额定电流 |
| ≤ 25 kVA | 5 × 10 mm² | 50A / 3P |
| 26 ~ 45 kVA | 5 × 16 mm² | 80A / 3P |
| 46 ~ 60 kVA | 5 × 25 mm² | 100A / 3P |
| > 60 kVA | 5 × 35 mm² | 125A / 3P |
对于允许中断、可通过检查点恢复的计算任务,可不配置整套大容量 UPS,以降低预算、承重、电池维护和消防压力。但管理节点、核心交换机、存储设备、监控系统等关键设备,建议根据数据安全要求配置小容量短延时 UPS 或安全关机策略。当然这样建议并不是计算节点遭遇频繁断电就没有问题,而是认为现阶段价格不菲的电池储能技术可能不是优解。与其加上这套沉重的保险,还是去保障供电更好。如果是业务根本无法接受停电,那肯定还是要上UPS,甚至有的地方还备柴油发电机。
UPS 选择建议:
| 场景 | UPS 建议 |
| 允许断电后重算 | 可不配置 UPS |
| 只需保护管理节点、存储、网络设备 | 小容量短延时 UPS |
| 计算任务不能中断 | 长延时 UPS,但需核算电池、消防和承重 |
五、承重怎么判断
模块化机房虽然占地不大,但设备重量集中,尤其是 GPU 服务器、精密空调和 UPS 电池柜。高校普通实验楼的楼板承重通常需要由学校基建或后勤部门确认。若承重值不明确,不建议凭经验判断。
如果计算结果接近或超过楼板承重,应考虑:调整机柜摆放位置;分散高重量设备;取消或减少长延时电池柜;增加槽钢或工字钢散压底座;尽量靠近主梁或承重结构布置。承重是模块化机房选型中最容易被忽略、但后果最严重的问题之一。尤其是带 UPS 电池柜的方案,一定要提前核算重量。
六、动环监控怎么选
高校课题组往往没有专职机房运维人员,夜间、周末和寒暑假可能长期无人值守,可以按使用场景选择:
| 场景 | 建议配置 |
| 设备较少,人员经常巡检 | 基础温湿度和烟感监控 |
| GPU设备价值较高,假期无人值守 | 温湿度、水浸、烟感、电力监测 + 远程告警 |
| 校园网限制较多 | 可考虑短信或电话告警 |
| 实验室人员流动频繁 | 门禁 + 摄像头 + 操作留痕 |
可以微信咨询材料人客服cailiaoren010,进一步沟通模块化机房方案。
