reformer-pytorch中文版本 高效的生成模型 类似GPT2的效果
Published on Aug. 22, 2023, 12:10 p.m.
reformer-chinese-pytorch
reformer-pytorch中文版本,简单高效的生成模型。类似GPT2的效果。
之前做过一个类似项目,这次重新写了,各方面都做了很多的优化,训练也更加便捷了。
reformer最大的优点就是节省资源,而且对于长文本更加有效。
之后有时间会做一个基于Performer的版本,应该会比reformer效果好。
数据
需要训练的数据文件放置在 data/data.txt
纯文本文件,一条一行即可
预处理数据
python bulidData.py
训练
Dump default configuration to have as reference
导出配置文件
python trainer.py –print_config > config/default_config.yaml
Modify the config to your liking - you can remove all default arguments
nano config.yaml
Fit your model using the configuration
运行训练
python trainer.py –config config/default_config.yaml
训练过程可以使用wandb(https://wandb.ai/ )做监控。
只需要在开始时候填入自己的key即可。
新地址
https://github.com/napoler/reformer-chinese-pytorch
其他
查看cuda占用
watch -n 1 nvidia-smi