From 5e6296f57ccd1ee9865d9c0c3b43d3d05b2f2ec5 Mon Sep 17 00:00:00 2001 From: HighCloud Date: Fri, 21 Nov 2025 12:47:06 +0800 Subject: [PATCH] test ci --- ops/c_api/grouped_matmul/grouped_matmul_doc.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/ops/c_api/grouped_matmul/grouped_matmul_doc.md b/ops/c_api/grouped_matmul/grouped_matmul_doc.md index 2dd2baf..392bef1 100644 --- a/ops/c_api/grouped_matmul/grouped_matmul_doc.md +++ b/ops/c_api/grouped_matmul/grouped_matmul_doc.md @@ -2,7 +2,7 @@ ## 描述 -`grouped_matmul`(分组矩阵乘法)算子针对输入张量 `x` 与权重张量 `weight` 按照分组信息 `group_list` 逐组执行矩阵乘法操作,可选地支持bias(偏置)、scale(缩放因子)、per_token_scale(token级缩放)和antiquant_scale(反量化缩放)等参数。每组输入和权重做独立矩阵乘法,并拼接形成整体输出。该算子适用于高效实现分组全连接、Mixture-of-Experts (MoE) 等需要基于动态分组的场景,并针对Ascend芯片做性能优化。 +`grouped_matmul`(分组矩阵乘法)算子针对输入张量 `x` 与权重张量 `weight` 按照分组信息 `group_list` 逐组执行矩阵乘法操作,可选地支持bias(偏置)、scale(缩放因子)、per_token_scale(token 级缩放)和antiquant_scale(反量化缩放)等参数。每组输入和权重做独立矩阵乘法,并拼接形成整体输出。该算子适用于高效实现分组全连接、Mixture-of-Experts (MoE) 等需要基于动态分组的场景,并针对Ascend芯片做性能优化。 ### 计算公式 -- Gitee