让跨境电商“懂文化”:AI内容生成在全球民族特色品类中的实践
Source: Alibaba Cloud Tech

1. 概述
跨境电商平台想要精准服务穆斯林、印度裔等特定民族群体,满足其宗教信仰、文化习俗和生活方式的差异化需求,必须对民族群体偏好的品类有清晰的理解。民族品类是指具有特定民族、宗教或文化属性,能够满足特定人群信仰规范、文化习俗、生活方式需求的商品类别,涵盖服装配饰、食品饮料、美妆个护、母婴玩具、家居园艺、珠宝首饰、鞋靴、礼品、工艺品等大类。这类商品具有强烈的文化属性和认证要求(如 Halal 认证、素食标准),既是功能性产品,更是文化认同、宗教实践和传统传承的载体。国际站传统类目体系难以精准识别和匹配此类商品,导致供需两端连接效率低下。
本方案基于大模型 AI 能力,构建民族品类知识生产体系,通过构建民族特征专业术语知识库辅助大模型理解文化内涵,实现民族品类与国际站叶子类目的智能匹配,以及从候选商品池中精准识别符合民族品类特征的商品,并通过人工评测和反馈机制持续优化数据质量。
依托自研的大模型内容生产平台,实现任务流程编排、Prompt 在线调试、批量任务管理、数据评测干预等全链路能力,显著提高产研运协同效率,通过小参数模型+知识库的模式替代大参数模型,大幅降低大模型调用成本。通过平台提供的评测能力,加快了从评测到优化的迭代过程,从之前 5-10 天缩短至 1 天以内,极大提高了产研运间协同效率。
经多轮评测与迭代优化,商品挂载错误率从8.4%(4067 样本中 342 个错误)降至1.8%(4421 样本中 80 个错误),数据质量显著提升。最终交付民族品类详情表、商品挂载关系表、目标人群圈选表等数据物料,可应用于首页导购、搜索云主题、推荐云主题等前台场景。
民族品类示例如下:

线上效果如下:


线上效果示例
2. 方案整体设计
2.1 设计思路
根据以往通过大模型挖掘和生产知识的实践经验,在业务场景落地过程中,可分为以下四个阶段。

预研阶段
拆解业务目标,定义 Prompt 的背景、任务、目标、输出格式等,调试不同的模型,关注模型的响应耗时,评估模型的数据准确度、数据完整度、指令遵循程度,不断地反馈优化,直到拿到符合预期的效果。
准备阶段
准备大模型任务所需的数据,如依赖的数据底表、当前业务领域的知识库等。对于批量大模型任务,需要将 Prompt 模板化,以便在执行时动态构建 Prompt。
执行阶段
很重要的一点是,需要控制数据处理速率,尤其是在大规模批量调用大模型这样读取快但消费慢的场景,大模型服务方通常会对大模型调用进行限流,因此,需要对处理速率进行严格控制。同时,遇到上下游服务不稳定导致任务异常时,支持任务中断恢复、重新消费等容错手段,来保证系统和任务能又快又稳定的运行。
评估阶段
为保证整体业务的数据质量,需要对每个子任务进行大模型产出结果的评估,支持对结果集进行查看,来评估大模型准确率,衡量整体数据质量。当整体数据质量都不够好时,需要回到预研阶段重新调整方向,同时也支持对大模型结果进行标注干预,可以将新增的、质量低的、错误的数据重新回流到执行阶段进行重跑。
2.2 方案流程设计
2.2.1 知识生产

流程如下:
1. 前置准备,构建民族特征的专业术语知识库,用于大模型在理解民族品类与挂载国际站叶子类目和国际站商品的任务中,更好的理解专业术语的含义,提高模型输出准确率,提升整体数据质量;
2. 民族品类挂载国际站类目,结合民族特征知识库,通过大模型将民族品类与国际站叶子类目进行匹配,得到民族品类和国际站叶子类目的关系;
3. 对大模型产出的民族化品类与国际站类目进行大模型结果评测,对挂载不合理的类目进行干预,保证后续数据的准确性;
4. 将大模型产出的民族品类挂载国际站类目数据与运营评测结果融合,作为下一步输入;
5. 将民族品类关联的叶子类目下所有 ggs 品取出,作为下一步挂载的候选品池;
6. 民族品类挂载商品,结合民族特征知识库,通过大模型将民族品类与候选池中商品进行匹配,得到民族品类和国际站商品的挂载关系;
7. 对大模型产出的民族品类挂载的商品进行大模型结果评测,对挂载不合理的类目进行干预,保证后续数据的准确性。
2.2.2 知识应用
将产出的物料应用在前台场景,如首页导购、搜索云主题、推荐云主题中。

2.3 大模型内容生产平台
通过大模型内容生产平台编排上述流程,支持大模型任务、数据处理任务的配置,可适配不同的业务场景,同时管理每个任务的生命周期,支持任务节点配置、任务复用、任务状态监控、数据分区管理、数据评测和干预能力,提高产研运的整体协同效率。

任务管理(编排、执行、预览)

任务状态追踪与管理

大模型结果评测示例1(知识相关)

大模型结果评测示例2(商品相关)
2.4 民族特征知识库
基于性能和成本上考虑,使用参数量大的模型,效果好但是开销可能会很大,基于任务的复杂度,决定采用小参数模型+知识库的模式,亦可以达到很好的效果,且成本大大降低。通过知识库 和 RAG 技术也可以保证模型输出的稳定性,降低大模型的幻觉率。同时也可以将知识沉淀下来作为数字资产为后续业务场景提供数据支持。
构建民族特征的专业术语知识库,用于大模型在理解民族品类与挂载国际站叶子类目和国际站商品的任务中,更好的理解专业术语的含义,提高模型输出准确率,提升整体数据质量。
示例如下
知识库切片示例:

3. 民族品类匹配国际站叶子类目
3.1 大模型输入数据准备
示例
3.2 民族品类匹配国际站叶子类目大模型任务
3.2.1 Prompt设计
...
{ethnic_cate_attribute}
{keyword}
{ethnic_cate_en_name}
{ethnic_cate_cn_name}
{ethnic_cate_id}
结合input_data中给出的叶子类目信息与ethnic_cate_info中给定的民族化品类的信息,逐项分析input_data中的每个叶子类目与民族化品类是否匹配
跨境电商B2B外贸行业专家
只输出纯净的JSON数组数据,禁止使用XML、Markdown或其他格式包裹,确保可被直接解析为JSON
String
判断依据,需结合关键词和五大特征进行严谨说明
satisfactionReason
String
是否匹配,输出:Y或N
satisfaction
String
民族化品类id,来自ethnic_cate_info中的ethnic_cate_id,原样输出
ethnicCateId
String
类目id,来自输入数据中的cate_id,原样输出
cateId
[{"cateId":"","ethnicCateId":"","satisfaction":"","satisfactionReason":""}]
禁止添加额外说明、注释、标题或结尾语句,仅返回JSON数据
satisfactionReason内容应准确、简洁、有据可依,避免主观判断
输出前校验字段完整性:cateId、ethnicCateId、satisfaction、satisfactionReason 缺一不可
输出必须是合法JSON数组,所有键和值均使用双引号包裹
禁止编造、修改input_data的叶子类目数据,保证输出的数据准确性
逐条分析每一个类目,不能遗漏
严格按照task步骤执行,不得跳过分析环节
{categoryData}
3.2.2 提交大模型任务
结合输入表与 prompt 模板,构建 prompt,可以在线编辑,实时调用大模型接口,查看模型返回结果,将合适的 prompt 保存。

3.2.3 任务管理
在百炼平台批量提交离线推理任务,预览提交的任务状态,当任务完成后自动解析导入至输出表。

3.3 ODPS任务-评测集处理导入
在大模型输出的基础之上,需要进行一定的数据处理,提供更多的信息,方便运营同学进行评测,通过触发 sql 手动任务,关联品类信息表 与 类目表,将 sql 结果导入到结果评测表。
3.4 结果预览与评测
3.4.1 结果预览
1. 展示民族化品类详细信息;
2. 展示其下叶子类目匹配原因;
3. 展示匹配的叶子类目下的商品数,作为品类候选品量,评估品类商品候选规模;

3.4.2 结果评测
建立该环节的反馈表,将用户干预的行为记录在反馈表中。提供结果集评测和干预能力,对大模型生产的民族化品类与国际站叶子类目的关联关系进行评测。
CREATE TABLE IF NOT EXISTS searchwork.table_feedback_df (
cate_id STRING COMMENT '叶子类目id',
ethnic_cate_id STRING COMMENT '民族化品类id',
operate_type STRING COMMENT '操作类型: add:添加,del:删除',
operate_reason STRING COMMENT ' 操作原因',
operate_timestamp STRING COMMENT '操作时间戳'
)
COMMENT '民族化品类关联叶子类目表-干预表'
LIFECYCLE 365;干预方式,支持品类与叶子类目的删除和添加操作。

后续使用数据时,将运营评测和干预的结果,与大模型生成的结果进行融合,作为最终结果。
3.5 总结
本环节通过大模型批量推理实现民族品类与国际站叶子类目的智能匹配,结合在线评测工具支持运营人员对匹配结果进行干预(删除/添加),将 AI 生产结果与人工反馈融合形成最终数据。通过专业术语知识库辅助,大模型能够准确理解民族品类的文化内涵,实现精准的类目挂载,为后续商品识别提供高质量的候选商品池。
4. 民族品类挂载国际站商品
4.1 大模型输入数据准备
民族化品类详情表
民族化品类匹配叶子类目表(合并评测结果)
将 AI 生产的结果表与反馈表进行关联,排除掉删除类型的数据,随后去重合并进最终结果表,将最终的结果表作为本轮大模型的输入。
民族化品类挂载商品候选表
在民族化品类匹配叶子类目表基础上加工全部叶子类目涉及的所有商品成一张表(含商品信息、属性)。
遍历所有商品,根据商品 id,所属的叶子类目,查询所属的民族化品类 id,获取多个民族化品类详情,作为大模型的输入。
4.2 大模型任务
4.2.1 Prompt设计
...
结合 prod_data 中的商品信息与ethnic_cate_data_list的信息,按照下列步骤判断当前prod_data中给定的商品与ethnic_cate_data_list中每一个民族化品类的匹配程度
跨境电商B2B外贸行业专家
只输出json数组数据,其他信息一定不要输出,方便数据解析
String
匹配原因
satisfactionReason
String
Y|N
商品匹配度
satisfaction
String
民族化品类id,来自ethnic_cate_data的ethnic_cate_id,一定不要修改
ethnicCateId
String
商品id,来自prod_data,不要修改
prodId
只返回纯净的JSON数组格式,不要使用 markdown 格式,方便数据解析,如[{"prodId":"","ethnicCateId":"","satisfaction":"","satisfactionReason":""}]
输出结果前再检查一遍返回结果数据,不要遗漏字段,不要有重复数据,请严格按 JSON 格式输出结果,不要添加任何额外引号或文本,确保键和值均使用双引号包裹。
只返回纯净的JSON数组数据,不要使用 markdown 格式,方便数据解析
给出的原因和解释保证严谨性和准确性
逐项分析每个品类词, 按照task中的步骤顺序,判断当前商品与每个民族化品类的匹配程度,不要遗漏
严格按照task描述中的步骤执行任务,不要有遗漏
{ethnicCateData}
{attr_json}
{prod_name}
{prod_id}
4.2.2 提交大模型任务
结合输入表与 prompt 模板,构建 prompt,在百炼平台批量提交离线推理任务。

4.2.3 任务管理
预览提交的任务状态,当任务完成后自动解析导入至输出表。

4.3 结果预览与评测
4.3.1 结果预览
1.展示民族化品类详细信息,类目簇,候选商品数,匹配商品规模,不匹配商品规模。
2.展示民族化品类其下商品主图和大模型挂载原因。

4.3.2 结果评测
建立该环节的反馈表,将用户干预的行为记录在反馈表中。
-- 民族化品类商品反馈表建表语句
-- 描述: 存储民族化品类商品关联的反馈操作,支持添加和删除操作
CREATE TABLE IF NOT EXISTS searchwork.table_name_product_feedback_df
(
prod_id STRING COMMENT '商品ID'
,ethnic_cate_id STRING COMMENT '民族化品类ID'
,operate_type STRING COMMENT '操作类型: add:添加,del:删除'
,operate_reason STRING COMMENT '操作原因'
,operate_timestamp STRING COMMENT '操作时间戳'
)
COMMENT '民族化品类商品关联结果表-干预表'
LIFECYCLE 365;提供结果集评测和干预能力,对民族化品类挂载的国际站商品进行评测,支持商品的删除和添加操作。

4.5 大模型评测与迭代优化
评测过程:经历五轮迭代评测,涵盖类目匹配和商品挂载两个核心环节。
核心问题:
1. 模型判定问题:早期 Prompt 逻辑不够严格,仅基于关键词匹配导致误判;第三轮 Prompt 要求过于严格,导致明显民族品类漏匹配;
2. 商家数据质量:标题关键词作弊、属性乱填/错填、标题与属性冲突、类目错放、图片与商品主体不符等问题普遍存在;
3. 认证判定偏差:第五轮发现模型对清真认证等强制性要求判定过于宽松;
解决方案:
1.Prompt 优化:增加商品主体判定环节,要求模型分别从商品信息和民族品类中提取主体并判定一致性,替代简单的关键词匹配逻辑;
2.品规完善:明确民族化商品主体定义,补充宗教要求(如 Halal 认证必须)和工艺特征描述,对强制性认证使用"必须"等严肃性用词;
3.严格性平衡:通过主体一致性判定替代全量属性强匹配,避免过度严格导致漏匹配;
提升效果:商品挂载错误率从第四轮的 8.4%(4067 样本中 342 个错误)降至第五轮的 1.8%(4421 样本中 80 个错误),数据质量提升 78%,实现了精准度与召回率的平衡。
4.6 总结
本环节基于上一步确定的类目候选池,通过大模型批量识别符合民族品类特征的商品,实现商品与民族品类的精准挂载。结合评测工具支持运营人员对挂载结果进行干预。
通过平台提供的评测能力,加快了从评测到优化的迭代过程,从之前 5-10 天缩短至 1 天以内,极大提高了产研运间协同效率。经迭代优化,商品挂载错误率从 10.12 版本的 8.4%(4067 样本中 342 个错误)降至 10.20 版本的 1.8%(4421 样本中 80 个错误),数据质量显著提升。为后续民族品类知识应用在国际站各场景提供数据支撑。
本方案由全球化业务发展中心供需产品与策略团队、国际站技术部场景导购团队、国际站技术部搜索推荐团队共同建设。
来源 | 阿里云开发者公众号
作者 | 徐盛(宗衡)