"尝试使用albert评估标题质量"

Published on Aug. 22, 2023, 12:05 p.m.

bert很强大但是训练成本有点过大,所以尝试使用albert_tiny训练,虽然效果会降低不少但是预测速度足够快.而且机器要求也小了很多.

思路

选择视频标题和播放量作为训练资料,毕竟视频标题党的情况比较多.想要直接预测流量估计不是很容易但是预测个区间总共可以吧.

爬取了20万条数据作为语料,跑了一千多次后仅有55%的正确率.

希望加大数据量和迭代能够有更好的效果.