如何快速使用MMSA多模态情感分析框架运行自己的模型

0@

785人浏览 · 2025-09-11 19:52:42

0@ · 2025-09-11 19:52:42 发布

使用MMSA框架进行新模型训练及验证流程：

准备工作：先在/data/chl/MMSA/src/MMSA/config/config_regression.json修改下载的数据集工作路径以及数据集的路径
/data/chl/data（替换为MOSI和MOSEI数据所在的父目录）

featurePath替换为mosi路径

首先在/data/chl/MMSA/src/MMSA/trains/singleTask和
/data/chl/MMSA/src/MMSA/models/singleTask下创建模型代码和训练代码
现在假设模型和训练的文件都为EMOE.py

然后将模型和训练文件填为自己想要的模型方法和训练方法

2.填写amio.py和atio.py

加上上图的这一行

ATIO.py也类似
记住这里的EMOE要和你模型和训练的类同名否则会报错。

3.修改config_regression
找到config里的config_regression添加你模型所需的参数

在config_regression里添加你模型所需的参数

我的参数如下：
"emoe": {

"commonParams": {

"need_data_aligned": true,

"need_model_aligned": true,

"early_stop": 10,

"use_bert": true,

"use_finetune": true,

"attn_mask": true,

"update_epochs": 10,

"fusion_method": "sum",

"temperature": 0.1

"datasetParams": {

"mosi": {

"attn_dropout_a": 0.2,

"attn_dropout_v": 0.0,

"relu_dropout": 0.0,

"embed_dropout": 0.2,

"res_dropout": 0.0,

"dst_feature_dim_nheads": [256, 8],

"batch_size": 16,

"learning_rate": 0.0001,

"nlevels": 4,

"conv1d_kernel_size_l": 5,

"conv1d_kernel_size_a": 5,

"conv1d_kernel_size_v": 5,

"text_dropout": 0.5,

"attn_dropout": 0.3,

"output_dropout": 0.5,

"grad_clip": 0.6,

"patience": 5,

"weight_decay": 0.005,

"transformers": "bert",

"pretrained": "bert-base-uncased"

"mosei": {

"attn_dropout_a": 0.0,

"attn_dropout_v": 0.0,

"relu_dropout": 0.0,

"embed_dropout": 0.0,

"res_dropout": 0.0,

"dst_feature_dim_nheads": [256, 8],

"batch_size": 16,

"learning_rate": 0.0001,

"nlevels": 4,

"conv1d_kernel_size_l": 5,

"conv1d_kernel_size_a": 1,

"conv1d_kernel_size_v": 3,

"text_dropout": 0.3,

"attn_dropout": 0.4,

"output_dropout": 0.5,

"grad_clip": 0.6,

"patience": 5,

"weight_decay": 0.001,

"transformers": "bert",

"pretrained": "bert-base-uncased"

}

4.写运行代码
MMSA框架运行代码非常简单

在MMSA初始目录下创建一个run.py文件，使用指令 python run.py即可运行
下面是一段最简单的运行代码

from MMSA import MMSA_run

MMSA_run('EMOE', 'mosi', seeds=[1111,1112,1113], gpu_ids=[0])

'EMOE'（模型名称）
'mosi'(数据集名称）

Seeds为随机种子
gpu_id为gpu编号
开始运行

后续可能还要一些小bug通过ai可以轻松修复

NVIDIA AI 技术专区

分享最新的 NVIDIA AI Software 资源以及活动/会议信息，精选收录AI相关技术内容，欢迎大家加入社区并参与讨论。

更多推荐

使用端到端 FP8 精度运行高吞吐量强化学习训练

NVIDIA AI 技术专区

NVIDIA AI 培训班 | 5 月 14 日开课：利用提示工程构建大语言模型应用

NVIDIA AI 技术专区

NVIDIA AI 培训班 | 6 月 4 日开课：构建基于大语言模型的应用

NVIDIA 深度学习培训中心（DLI）提供的《构建基于大语言模型的应用》 AI 培训班即将开课，由 NVIDIA 认证讲师全天实时中文授课和答疑，配合云端实验环境的动手实操帮助每位学员深入理解 LLM 应用开发并积累实践经验，从而快速投入实际开发工作。无论是个人技能跃升还是团队能力建设，NVIDIA 深度学习培训中心（DLI）的生成式 AI 认证学习路径都能为您提供系统支撑 —— 从认证科目选择