首页 鸿研 需求 视频 产品 专栏 招聘 活动 社区 APP下载 登录/注册
材料人发布鸿研智慧计算集群管理平台
材料人计算客服小张     2026-04-07 微信扫码分享  
轻量化、独立安全、低成本的计算集群管理系统

作为长期为高校科研院所提供中小型计算集群的服务商,我们深知老师们更希望把有限的预算投入到计算节点上。然而,对于集群管理工作,既繁琐又不能忽略。为了帮助中小型计算集群管理者更好地管理集群。我们材料人在基于4年的鸿研云超算管理经验基础上,特别制作了面向管理员监看的版本——鸿研智慧计算集群管理平台。系统将免费提供给购买我们集群硬件的老师。


软件特点

1:非侵入性架构设计,采用轻量化的Python/SQLite架构,完全独立于底层集群管理系统运行。我们仅通过标准化的状态信息传输(如Python接口),确保了对现有核心系统的零干扰和极低部署门槛。

2:摒弃花哨功能,界面高度聚焦管理员的“决策需求”,精简至十数个关键页面,实现秒级状态掌握。

3:个性化定制。整套系统在基于设计框架内实现集群、空调、监控等个性化定制。


集群功能

1:算力大屏。展示当前算力使用率、当前运行任务数、累计历史任务、注册人数等基本信息。可选2D或3D展示。

2:节点状态。展示当前各节点状态,包括跑任务核数、占用内存量、CPU温度等。

3:作业队列。包括目前正在运行的任务。

4:历史任务。展示目前集群内所有已完成的任务情况,包括任务ID、用户名、分配核数、起止时间、计算核时、入账核时等信息。

5:计费账单。记录每一个任务所计算的核时数,以及增加用户的可用核时数。

6:用户信息。展示每位用户的核时额度、资源配额、可用核时、已消耗核时、原生核时(基于sreport)、账号有效期、账号状态等。

7:操作流水。记录包括管理员在内对集群及管理节点操作。

8:集群操作。停止特定任务、重启节点、限制用户配额等重要功能。


机房功能(需定制)

1:动环监控。基于封闭冷通道微模块的各项指标监控。

2:AI视觉。基于YOLO视觉识别模型,自动识别机房内异常行为。

3:告警中心。实时记录各项预警指标。根据需要提供短信、微信预警。


更多功能也可以根据客户需求定制。


暂无留言
专栏最新文章