再讲一个真事.
按照管理规定, 10万元以上的仪器, 属于贵重仪器. 管理方会派送一个《XXX学校贵重仪器使用记录》这么一个记录本, 要求, 每次使用都要填写 时间, 姓名/课题组, 事由, 结束时间, 仪器状态.
按照这个规定, 计算集群, 也是贵重仪器了. 也必须按照管理规定填写《贵重仪器使用记录》这个记录本了....
可是, 这个计算集群, 是Linux系统, 然后, 实际上, 同一时间, 会有好多用户, 登录在线, 进行自己的计算任务或者分析数据, 或者监控计算进度等等.
各位不觉得, 填写这个手写的记录本, 不符合实际情况吧?
然后领导告诉你, 必需填写, 这是规定.
管理员, 填写为每天巡视机器8次, 按照巡视结果填写机器状态, 被管理方通报批评, 没有按照管理规定进行.
然后, 为了应付管理方的检查, 某一时段, 一堆研究生, 就手动填写, 编造内容, 以便符合管理方的合规要求.
也有视察的领导说, 走看看你们购置的集群. 到了机房, 双眼空洞盲目, 指着机柜问, 这就是集群, 不就是放了一堆机器吗? 这是集群? 和他们买的一个个机器, 有啥却别?
不能说这位莅临视察者是傻子, 但是肯定是外行.
看集群, 不是先问问多少核心, 多少内存, 内存带宽能到多少, 单机读写多块, 多机器并行, 读写能做到多少?
而后聊聊, 用什么网络, 最高支持I/O能维持到什么水平? 机器整体让热如何? 满负载时候, 功率多少? 空调配置? 机器不在满负载情形下, 节点能否自动休眠以节省能源?
最后再聊聊, 软件部署, 采用什么方案?
调度采用什么模式? 队列资源可否动态调整?
数据备份采用什么策略.....