将晦涩难懂的技术讲的通俗易懂
发布时间:2024-09-22 20:37:10
allreduce 算法 通信过程:1. allgather 阶段。优点:带宽利用率高,因为在每个通信步骤中,所有节点都在同时发送和接收数据。缺点:延迟较高,尤其是当节点数量较多时,由于需要进行 2*(n-1) 次通信。tree allreduce:采用树状拓扑结构进行通信 通信过.........【阅读全文】
发布时间:2024-08-18 17:03:39
大模型训练中的adam算法和相关优化——lvyilong316 想要了解adam(adaptive moment estimaation,自适应矩估计)算法,必须先了解一阶矩和二阶矩。一阶原点矩一阶原点矩就是期望,更简单来说就是平均值。比如现在有5个数,分别是1、2、3、4、5,它们的期望计算方式如下.........【阅读全文】
发布时间:2024-07-14 16:00:42
流量控制和拥塞控制首先,我发现现实中大家讨论流量反压/限速过程中经常搞混流量控制和拥塞控制。流量控制是作用于接收者的,它是控制发送者的发送速度从而使接收者来得及接收,防止分组丢失的。所以流量控制的核心是防止接受端处理不过来。而拥塞控制是作用于网络的,它是防止过多的数据注入到网络中,避免.........【阅读全文】
发布时间:2024-06-09 20:48:05
gpudirect 虚拟化 在ai和hpc场景,gpu间需要大量的交换数据,gpu通信性能成为了非常重要的指标。nvidia推出的gpudirect就是一组提升gpu通信性能的技术。 传统上,当数据需要在 gpu 和另一个设备之间传输时,数据必须通过 cpu,从而导致潜在的瓶颈并增加延迟。使用 gpudirect.........【阅读全文】
lvyilong3162023-06-06 15:06
zhangtongjian12:你好,请教下,“qemu和vhost-user前后端协商过程”中讲到的初始化多队列时,多队列初始化时,对应的kvm中断机制中irqfd和ioeventfd是和队列数目对应的吗?还是一个虚拟机就一个irqfd和ioeventfd?
和队列对应
|zhangtongjian122023-06-02 10:29
你好,请教下,“qemu和vhost-user前后端协商过程”中讲到的初始化多队列时,多队列初始化时,对应的kvm中断机制中irqfd和ioeventfd是和队列数目对应的吗?还是一个虚拟机就一个irqfd和ioeventfd?