超聚变G5500 V7和智算融合平台
招标
发布时间:
2025-11-13
发布于
--
收藏
公告内容
项目编号
立即查看
项目预算
立即查看
采购单位
立即查看
供应商
立即查看
采购代理
立即查看
公告详情
您当前为:【游客状态】,公告详情仅对登录用户开放,
登录/注册
后查看完整商机。全国免费咨询热线:400-888-7022

超聚变G5500 V7和智算融合平台

发布时间:*开通会员可解锁* 14:58:12

截止时间:*开通会员可解锁* 15:08:09

基本信息:

申购主题:超聚变G5500 V7和智算融合平台

送货时间:签定合同后7天内完成交货及安装、调试达验收合格标准

报价要求:

安装要求:免费上门安装(含材料费)

付款方式:货到验收合格后付款

收货地址:******

备注说明:

采购明细

序号 采购内容 数量/单位 预算单价 品牌 型号 规格参数 质保及售后服务 附件
1 高性能GPU计算服务器 1.0 超聚变 G5500 V7 1、4U机架式高性能异构计算服务器, 内存:DDR5 64G *8 支持PCIe4.0协议,提供超高内存带宽,可搭载≥8片GPU,支持≥8块3.5”/2.5”热插拔硬盘,提供存储和数据读写性能。 2、CPU:2颗 6530,32核心 CPU主频2.8GHz/256MB二级缓存32核心64线程 3、内存:8*64GB 3200MHz DDR5 LRDIMM 4、硬盘1:2* SSD 960G/SATA/2.5" SSD固态硬盘 5、硬盘2:1*7.68TB PCIe*Gen4 NVMe U.2 2.5in SSD固态硬盘 计算存储网卡:1块 100GB/s 双口光纤网卡 业务口网卡:四口电口千兆以太网卡 电源:2700W白金电源,支持2+2冗余 ▲6、安全传输管理系统要求,具备手机端远程自助报修功能,在手机端可扫描设备上的二维码进行远程协助报修维护。(提供该功能的截图证明); ▲7、文件白名单过滤:内置常见的mpeg、mpg、rm、m4v、asf、mov、avi、swf、wav、MP3、MP4、mid、ac3、bmp、jif、jpg、png等多种格式文件并支持文件过滤格式自定义,集成杀毒软件,拦截潜在的风险以实现免疫和拦截目的。(提供隔离集成杀毒功能截图证明); ▲8、国产产品,原厂制造,非 OEM 产品。拥有自主知识产权,病毒隔离厂家具有内核加固防护技术研发能力,可保障后续产品的连续性。(须提供该功能截图佐证); ▲9、白名单过滤支持深度检测,可对文件格式进行深度扫描,防止病毒文件通过修改后缀蒙混过关。(提供该功能截图佐证); ▲10、支持文件AI智能学习,对于新的文件格式通过上传文件即可智能学习以实现深度检测。(提供该功能截图佐证)。 按行业标准提供服务
2 智算融合平台 2.0 AMAX PlatforMax 1.提供统一的中文web管理界面,支持web界面中英文切换,客户通过pip安装命令行客户端,连接集群进行操作,系统所有功能均对外提供Restful API,方便用户进行二次开发。 2.提供基于 Python 应用的开发环境功能,算法数据和环境可根据实际需求定制开发功能(提供功能证明截图) 3.平台支持集群管理员、分区管理员、项目管理员、普通用户等多种角色;基于不同的角色,用户只能访问系统特定的功能;基于不同的角色,用户只能访问系统的特定范围的资源(镜像、数据等)。 4.支持用户组创建、删除(需确认)、编辑、将用户加入或移出用户组 5.支持用户创建、删除(需确认)、编辑、用户组、分区、项目、存储卷和资源配额设定 6.支持按照分区划分集群资源,分区可以关联不同的数据卷、设置资源配额 7.支持分区中创建项目,项目可设置数据卷和资源配额,添加和移除项目成员 8.安全员管理插件:提供安全员角色功能,安全审计员能对系统使用进行审计工作,提供对不良用户以及违规使用情况进行系统操作记录审计的功能;(提供功能证明截图) 9.支持公共镜像、分区镜像、项目镜像、私有镜像多层级镜像管理。用户私有镜像之间、分区镜像之间、项目镜像之间进行隔离,没有共享情况下无法访问 10.支持用户间分享私有镜像、项目镜像、分区镜像,支持定义分享深度 11.支持管理员对管理范围内镜像在所有管理用户间进行公开分享 12.支持将分享的镜像同步到用户私有、项目或分区镜像库 13.平台内建镜像仓库,本地保存和使用所有私有、项目、分区和公共镜像 14.提供Tensorflow、PyTorch、MxNet、CUDA、Gromacs、NAMD、LAMPPS各个版本镜像,用户可以下载到平台中使用;支持PaddlePaddle镜像和Ubuntu 22.04 VNC镜像下载使用 15.拥有NGC账号的用户可以从Nvidia NGC下载镜像到平台中使用 16.用户可以下载Intel oneAPI镜像到平台中使用 17.用户可以搜索docker hub镜像,并下载镜像到平台中使用,上传docker镜像tar,平台解压并加载镜像到平台镜像仓库 18.上传dockerfile文件,平台根据dockerfile生成镜像保存到平台镜像仓库,使用docker push命令从客户端推送镜像到平台镜像仓库,使用docker pull命令从平台镜像仓库拉取镜像到客户端 19.用户可以通过web console使用命令行安装包,修改配置并保存镜像,在Web GUI中定义pip包名称,选择版本并安装到镜像中,可以通过在Web GUI中选择conda env,定义conda包名称、选择版本并安装到镜像中,可以通过在Web GUI中编辑或者上传requirements文件,平台根据文件内容安装包到镜像中, 20.平台支持将运行中容器保存为镜像,用户创建交互式任务时,根据选择的交互式任务类型,对镜像进行自动配置,查看平台镜像列表,包含镜像的名称、标签、创建时间等信息。用户在Web GUI中查看镜像中OS、Kernel、Python、PIP和Conda包等信息;启动任务时可根据镜像元数据过滤镜像,当用户在平台中进行镜像上传、下载、配置等动作时,可以查看到详细的消息和进度 21.平台限制镜像的最大尺寸,超过尺寸的镜像不可保存,支持设置镜像尺寸限制,可以根据需求进行更改,自动清理镜像垃圾,回收镜像仓库空间,避免存储资源的浪费 22.平台支持对资源进行横向扩展,无缝添加新的节点。用户在Web GUI中查看节点资源配置,查看节点CPU、GPU、内存、网络、硬盘等使用情况和历史曲线。 23.支持对平台资源进行逻辑分区,每个分区设置CPU、Mem和GPU使用配额,分区中任务申请的资源总和不能超过分区限制,分区、项目和个人配额中,可以针对不同GPU类型设置不用的GPU配额;GPU配额支持小数,用户在Web GUI中查看分区资源的使用情况 24.支持在分区资源中创建项目,每个项目设置CPU、Mem和GPU使用配额,项目中用户创建的任务申请的资源总和不能超过项目限制 25.支持设置用户CPU、Mem和GPU使用配额,用户配额和项目关联,用户在项目中的任务申请的资源总和不能超过该项目中用户资源配额限制 26.创建任务时,用户可以查看节点上剩余资源,避免因单个节点资源不足导致任务调度失败。创建任务时,检查分区、项目和个人配额是否满足任务资源需求,不满足不予提交。创建任务时,可以开启任务资源自动适配模式,该模式下任务申请资源数量会自动设置。 27.管理员可以开启交互式任务运行时长限制,当交互式任务运行时间超过限制,平台删除任务并释放资源 28.管理员可以设置交互式任务数量限制,当数量超过限制时,用户无法提交交互式任务,可以配置交互式任务资源模板,用户提交交互式任务时,单任务无法超过模板资源限制,可以设置交互式任务空闲时长限制,交互式任务空闲时长超过限制,自动删除,可以查看交互式任务空闲时长,并且删除空闲时间过长的任务。 29.支持基于底层基础硬件的共享功能,基础硬件共享由基于硬件的算法支持,共享需求提供1/2,1/4,1/8功能(提供功能证明截图) 30.平台支持常用的分布式存储例如gluster、lustre等,分布式存储支持IB高速网络和RDMA,数据读写效率高,支持NAS共享存储,NFS数据支持本地数据缓存,提高IO性能,支持创建NAS卷以及分布式存储卷,支持不同的分区、项目使用不同的存储卷,支持查看卷的使用百分比,展示卷关联用户的使用空间统计排名,支持公共数据、分区数据、项目数据和个人数据等多级数据管理。 31.用户在Web GUI上进行数据上传、下载、删除、压缩、解压、复制、移动和内容浏览,通过ftp进行数据的上传、下载等操作。 32.支持用户间分享私有数据、项目数据、分区数据,支持定义分享深度,不同用户的私有数据相互隔离,用户不同的项目数据之间相互隔离。 33.用户删除web文件后,文件在回收站中保存一定时长,在有效时长之内,可以通过回收站恢复;管理员可以开启关闭回收站功能并设置数据保存时间。 34.针对用户指定存储空间配额,用户存储空间大小不能超过配额限制。 35.视觉算法应用运行期间,能提供基础环境的监控功能,监控指标包含最大值,最小值,平均值等数字化信息,并针对数字信息在同界面提供实时曲线图展示功能,提供算法数据类型,应用程序入口,执行器等显示功能,针对运行期间的应用,提供Log展示功能(提供功能证明截图) 36.用户提交任务启动模型训练,提交时指定入口程序、工作目录、机器学习框架、资源需求、分区和使用的镜像。 37.用户通过自定义的Shell脚本启动训练任务,支持基于PS模式的TensorFlow框架的多机多卡分布式训练。基于Horovod的分布式训练,支持Tensorflow、PyTorch、MxNet。 38.分布式训练支持容器之间通过基于SR-IOV的高速虚拟网卡通信 39.启动模型训练任务时,支持通过key-value对的形式设置超参数。 40.支持使用TensorBoard、Visdom、VisualDL、MxBoard等工具对Tensorflow、PyTorch、MxNet的训练过程进行可视化 41.根据任务的CPU、GPU和Mem的需求,以及对GPU卡型号的选择,使用k8s动态调度任务到最优的节点上,保证资源使用的效率 42.用户提交任务可以选定优先级,管理员可以调整任务队列顺序和任务的优先级 43.用户可以预约任务执行的时间和频率 44.GPU可以在多个容器之间进行共享 45.支持在平台中使用oneAPI Basekit、oneAPI AI Kit,OpenVINO等镜像创建任务 46.运行失败的任务会在指定次数内自动重启 47.提供基于英伟达和英特尔环境下的标准视觉算法应用环境包集成功能,英特尔环境包需提供不同硬件环境的可执行编译功能,提供用户可直接在平台内进行环境包下载,也可通过平台提供的对外环境进行官方环境包下载的功能;(提供功能证明截图) 48.用户查看当前被调度、正在运行,暂停和已完成的任务,按照用户名、分区、项目、任务开始日期等条件查询任务,可以删除、暂停和继续任务,查看任务分区、项目、资源需求、开始结束时间和成功状态与消息。 49.显示训练任务的CPU,GPU和Mem的实时使用率,任务运行结束时统计任务运行过程资源的使用情况,实时查看任务训练过程中的log输出。 50.支持对AI交互式任务进行重启,当任务状态发生变更(创建、删除、错误中断)时发送邮件通知用户,创建任务时,支持对shm大小进行设置。 51.用户通过自定义任务模板,设置模板参数,可以快速启动任务,提高效率 52.模型开发调试支持Jupyter交互式任务,启动Jupyter notebook进行交互式开发和调试。支持JupyterLab交互式任务,启动JupyterLab进行交互式开发和调试。支持VNC交互式任务,启动图形化任务,通过Web VNC连接并在PyCharm中进行开发和调试。支持Terminal交互式任务,启动Terminal,通过ssh连接容器进行开发调试。 53.针对支持ssh的交互式任务,在本地IDE中进行代码同步和远程调试。用户通过Web GUI查看列表,查看任务自定义端口信息。创建任务时,用户可以自定义端口。 54.AI功能下支持大模型部署,支持在集群中使用ollma/vllm一键部署DeepSeek系列模型,支持导出训练好的模型。训练完毕的Tensorflow模型使用TensorServing进行部署,对外提供服务和测试功能。 55.提供节点、分区、集群层次的统计报表,方便管理员进行资源使用的统计,通过节点IPMI链接查看IPMI详细信息,帮助管理员定位硬件故障和问题,监控节点服务运行状态,可以在Web GUI上查看节点上重要服务是否运行正常,统计系统总体资源配置、CPU、GPU、Mem使用率,节点状态,分区资源消耗和任务运行情况,使用直方图显示节点CPU、GPU、Mem、网络IO、运行容器数量的实时统计,节点详情中查看任务详细状况,节点中任务通知用户。 56.显示节点CPU、GPU、Mem、网络IO的历史曲线图,使用直方图显示分区CPU、GPU、Mem和任务运行的实时统计,分区详情中查看任务详细状况,显示分区CPU、GPU、Mem的历史曲线图,从分区、用户、集群、任务类型等各个层次和维度展示当前GPU的空闲和占用状态,支持按种类查看GPU卡的使用。 57.使用图表方式对用户在选定时间段内的CPU、内存和GPU使用进行统计,支持监控管理节点磁盘使用率、服务状态,支持监控计算节点僵尸进程和D状态进程。 58.管理员对节点CPU、Mem、磁盘、GPU等设置告警阈值,并设置告警通知方式,当指标超过阈值时,发送告警邮件并在节点健康状态中显示异常。 59.支持Ubuntu 20.04、Rocky 8.10 Linux操作系统。服务器重启后,自动启动平台服务,支持使用benmark工具包对集群性能进行测试评估 60.用户注册功能:应提供清晰开关,支持一键开启或关闭用户自行注册功能。支持对注册时的字段进行定义和管理,支持用户自行注册(提供功能证明截图) 61.公众号功能:用户登录时可以选择关注软件公众号,关注后可在线查看用户手册包含普通用户与管理员手册,同时支持获取最新软件相关资讯和相关操作步骤,为用户提供一个随时、随地、随身查看官方文档和寻求帮助的便捷渠道。(提供功能证明截图) 按行业标准提供服务
潜在客户预测
点击查看详情>
合作机会