非官方 GPT-2 训练实现,支持 GPU 和 TPU。
GPT-2 是一种基于 transformer 的大型语言模型,具有 15 亿个参数,在 800 万网页数据集上进行训练。
依赖:
GPU
pip3 install tensorflow-gpu regex
TPU
pip3 install tensorflow regex google-api-python-client oauth2client
下载模型
pip3 install requests tqdm
生成数据集
pip3 install ftfy tqdm newspaper3k