微博
加入微博一起分享新鲜事
登录
|
注册
140
在 Kubernetes 上部署解 LLM 推理工作负载 https://developer.nvidia.cn/blog/deploying-disaggregated-llm-inference-workloads-on-kubernetes/
请登录并选择要私信的好友
300
在 Kubernetes 上部署解 LLM 推理工作负载 https://developer.nvidia.cn/blog/deploying-disaggregated-llm-inference-workloads-on-kubernetes/
赞一下这个内容
公开
分享
获取分享按钮
正在发布微博,请稍候