每一次刷卡、转账和支付都在现代金融网络上编码着人类行为模式。交易数据是企业拥有的最丰富信号之一,然而大多数生产级用例仍依赖手工特征工程和规则集——这些方案脆弱、维护成本高,且无法捕捉客户历史中的序列结构。
NVIDIA 发布的"构建您自己的交易基础模型"开发者示例,展示了如何利用加速计算端到端构建交易基础模型。该工作流涵盖五个关键步骤:使用 NVIDIA cuDF 进行 GPU 加速数据处理、基于 cuDF 和 cuML 的自定义分词、使用 NVIDIA NeMo AutoModel 从零开始预训练 Transformer 解码器模型、提取学习到的嵌入向量,以及利用嵌入增强下游欺诈分类器。
最终可在 IBM TabFormer 欺诈数据集上实现相对于强 XGBoost 基线近 50% 的平均精度提升。这一成果表明,基础模型通过在大规模无标注交易序列上预训练,能够生成通用的金融行为表征,适用于欺诈检测、信用评分、生命周期价值预测、客户分群等多种下游任务。
行业信号已经非常强烈:Stripe 的支付基础模型、Nubank 的 NuFormer、Visa 的 TransactionGPT、Mastercard 的大表格模型、Revolut 的 PRAGMA 以及 Plaid 的交易基础模型等,均报告在生产规模任务上实现了两位数百分比的提升。NVIDIA 的这套方案为更多金融机构提供了构建自有交易基础模型的完整技术路径。
WeChat
Profile