"尝试使用albert评估标题质量"
Published on Aug. 22, 2023, 12:05 p.m.
bert很强大但是训练成本有点过大,所以尝试使用albert_tiny训练,虽然效果会降低不少但是预测速度足够快.而且机器要求也小了很多.
思路
选择视频标题和播放量作为训练资料,毕竟视频标题党的情况比较多.想要直接预测流量估计不是很容易但是预测个区间总共可以吧.
爬取了20万条数据作为语料,跑了一千多次后仅有55%的正确率.
希望加大数据量和迭代能够有更好的效果.
Published on Aug. 22, 2023, 12:05 p.m.
bert很强大但是训练成本有点过大,所以尝试使用albert_tiny训练,虽然效果会降低不少但是预测速度足够快.而且机器要求也小了很多.
思路
选择视频标题和播放量作为训练资料,毕竟视频标题党的情况比较多.想要直接预测流量估计不是很容易但是预测个区间总共可以吧.
爬取了20万条数据作为语料,跑了一千多次后仅有55%的正确率.
希望加大数据量和迭代能够有更好的效果.