深度学习优选资源
Published on Aug. 22, 2023, 12:11 p.m.
深度学习优选资源
多头注意力模型
performer
reformer
分词词典
CLUE
中文词典 总大小只有8021,远远小于google的21128https://github.com/CLUEbenchmark/CLUECorpus2020#%E8%AF%8D%E8%A1%A8%E4%BB%8B%E7%BB%8D
AutoML/AutoDL
wandb 训练监控走势
Optuna: 一个超参数优化框架
Optuna 是一个特别为机器学习设计的自动超参数优化软件框架.它具有命令式的, define-by-run 风格的 API.由于这种 API 的存在, 用 Optuna 编写的代码模块化程度很高, Optuna 的用户因此也可以动态地构造超参数的搜索空间.https://optuna.readthedocs.io/zh_CN/latest/index.html
NNi
NNI (Neural Network Intelligence) 是一个轻量但强大的工具包,帮助用户自动的进行 特征工程,神经网络架构搜索, 超参调优以及模型压缩。https://nni.readthedocs.io/zh/stable/
AutoGluon
Ray Tune
Ray tune:一个可扩展的超参数优化Python库 Tune是一个超参数优化库,可以用于PyTorch、TensorFlow, MXnet,keras等深度学习框架https://docs.ray.io/en/master/tune/index.html
Pytorch Lightning Distributed Accelerators using Ray
Nlp强大的包
Keras:基于Python的深度学习库 - Keras中文文档
fast.ai · Making neural nets uncool again
PyTorch
LightGBM https://lightgbm.readthedocs.io/en/latest/Installation-Guide.html
AllenNLP
pytorch-lightning
写模型首选用它https://pytorch-lightning.readthedocs.io/
贝叶斯优化
基本所有的调参都是靠他https://github.com/fmfn/BayesianOptimization
torch-optimizer
各种优化器合集https://github.com/jettify/pytorch-optimizer
spaCy https://spacy.io/
OmegaConf
fastNLP https://github.com/fastnlp/fastNLP
pytorch crf https://github.com/kmkurn/pytorch-crf
onnx / onnx:机器学习互操作性的开放标准
全部知识蒸馏函数 https://github.com/AberHu/Knowledge-Distillation-Zoo
transformers https://huggingface.co/transformers/model_doc/bert.html
文本处理
blmoistawinde/HarvestText: 文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等),无监督或弱监督方法
goto456/stopwords: 中文常用停用词表(哈工大停用词表、百度停用词表等)
竞赛平台
Kaggle: Your Home for Data Science
colab
阿里天池
示例
nlp示例合集
labml.ai Neural Networks 很好的深度学习框架
nlp示例合集graykode/nlp-tutorial: Natural Language Processing Tutorial for Deep Learning Researchers https://github.com/graykode/nlp-tutorial
工具
模型可视化https://github.com/lutzroeder/Netron
torchsummaryX 参数计算 https://github.com/nmhkahn/torchsummaryX
ai补全插件Kite
Read the Docs 文档托管
RIME | 中州韻輸入法引擎
Docker Hub
排行基线
https://www.cluebenchmarks.com/nlpcc2020.html
榜单SuperGLUE Benchmark https://super.gluebenchmark.com/leaderboard
GLUE Benchmark https://gluebenchmark.com/
web/api开发
FastAPI https://fastapi.tiangolo.com/
streamlit 快速可视化 https://streamlit.io/
Semantic UI 语义化的前端框架 https://semantic-ui.com/
Electron | 使用 JavaScript,HTML 和 CSS 构建跨平台的桌面应用程序。
Beautiful Soup 解析html
ngrok - secure introspectable tunnels to localhost
jsDelivr
自动生成流程图 https://flowchart.fun/
Caddy 2 不错的服务器软件
ZeroTier内网穿透 – Global Area Networking
自动化
Selenium 控制浏览器
数据集
AMiner 数据集 https://www.aminer.cn/data_cn
candlewill/Dialog_Corpus: 用于训练中英文对话系统的语料库 Datasets for Training Chatbot System
codemayq/chinese_chatbot_corpus: 中文公开聊天语料库