文档中段落级别的文本标注任务

Published on Aug. 22, 2023, 12:08 p.m.

文档对段落级别的文本标注任务如果直接上crf显然是不可想像的。
想法:
句子分类借助bert的cls对句子分类。
cls输出向量拼接经过crf。

可以保持序列的连贯,而且训练的压力相对小很多。

如果没有可用的数据集,完全可以用摘要算法生成些样本作为测试。
在经过人工筛选,没准可以提取不错的摘要。

Tags: