diff --git a/ops/c_api/grouped_matmul/grouped_matmul_doc.md b/ops/c_api/grouped_matmul/grouped_matmul_doc.md index 2dd2bafb8c9d3fd0adcd8abcd8e0df252785f197..392bef1e7508aa2845ccea49afa61d28f19e6328 100644 --- a/ops/c_api/grouped_matmul/grouped_matmul_doc.md +++ b/ops/c_api/grouped_matmul/grouped_matmul_doc.md @@ -2,7 +2,7 @@ ## 描述 -`grouped_matmul`(分组矩阵乘法)算子针对输入张量 `x` 与权重张量 `weight` 按照分组信息 `group_list` 逐组执行矩阵乘法操作,可选地支持bias(偏置)、scale(缩放因子)、per_token_scale(token级缩放)和antiquant_scale(反量化缩放)等参数。每组输入和权重做独立矩阵乘法,并拼接形成整体输出。该算子适用于高效实现分组全连接、Mixture-of-Experts (MoE) 等需要基于动态分组的场景,并针对Ascend芯片做性能优化。 +`grouped_matmul`(分组矩阵乘法)算子针对输入张量 `x` 与权重张量 `weight` 按照分组信息 `group_list` 逐组执行矩阵乘法操作,可选地支持bias(偏置)、scale(缩放因子)、per_token_scale(token 级缩放)和antiquant_scale(反量化缩放)等参数。每组输入和权重做独立矩阵乘法,并拼接形成整体输出。该算子适用于高效实现分组全连接、Mixture-of-Experts (MoE) 等需要基于动态分组的场景,并针对Ascend芯片做性能优化。 ### 计算公式