0%

使用语言模型GPT2来解决文本生成任务

The first part of this resource pool summarizes the resources used to solve text generation tasks using the language model GPT2, including papers, code, demo demos, and hands-on tutorials. The second part shows the application of GPT2 in the text generation tasks of machine translation, automatic summary generation, migration learning and music generation. Finally, the 15 major language models based on Transformer between 2018 and 2019 are compared.

本资源汇第一部分汇总了使用语言模型GPT2来解决文本生成任务的资源,包括论文、代码、展示demo和动手教程。第二部展示了GPT2在机器翻译、自动摘要生成、迁移学习和音乐生成这些文本生成任务上的应用。最后对比了2018-2019年间重要的基于Transformer的15个语言模型

GPT-2

GPT-2 is a large transformer-based language model released by OpenAI in February 2019. It contains 1.5 billion parameters and is trained on a 8 million web dataset. According to reports, the model is a direct extension of the GPT model, training on more than 10 times the amount of data, the parameter amount is also 10 times more. In terms of performance, the model is capable of producing coherent text paragraphs and achieves SOTA performance on many language modeling benchmarks. Moreover, the model can perform preliminary reading comprehension, machine translation, question and answer and automatic summarization without task-specific training.

GPT-2是OpenAI于2019年2月发布的基于 transformer 的大型语言模型,包含 15 亿参数、在一个 800 万网页数据集上训练而成。据介绍,该模型是对 GPT 模型的直接扩展,在超出 10 倍的数据量上进行训练,参数量也多出了 10 倍。在性能方面,该模型能够生产连贯的文本段落,在许多语言建模基准上取得了 SOTA 表现。而且该模型在没有任务特定训练的情况下,能够做到初步的阅读理解、机器翻译、问答和自动摘要。

GPT-2 Demo

GPT-2_Explorer Demo It can give the next ten words of the possibility ranking and their corresponding probabilities according to the currently input text. You can select one of the words, then see the list of the next possible word, and so on, and finally complete one. Article.

GPT-2_Explorer Demo 它可以根据当前输入的文本给出可能性排名前十的下一个单词及其对应概率,你可以选择其中一个单词,然后看到下一个可能单词的列表,如此往复,最终完成一篇文章。

点击体验 Click to GPT-2 Explorer Demo

Write With Transformer Demo

Write With Transformer

GPT-2 elevant articles

hands-on GPT-2


GPT-2-simple

GPT-2-simple Python package to easily retrain OpenAI’s GPT-2 text-generating model on new texts.

GPT-2-simple Python包可以轻松地在新文本上重新训练OpenAI的GPT-2文本生成模型。

GPT-2-simple Demo

GPT-2-simple Demo Writes a follow-up story based on the current input text.
GPT-2-simple Demo 根据当前输入文本编写后续的故事。

点击体验 Click to gpt-2-simple Demo


grover: OpenGPT-2

Grover is a model for Neural Fake News — both generation and detection.
Grover是神经虚假新闻的模型 - 生成和检测。

grover demo

Generate articles based on information such as title, author, and more. Grover can also detect if text is generated by the machine.

根据标题、作者等信息生成文章。grover 还可以检测文本是否由机器生成。

点击体验 Click to GROVER

grover elevant articles


语言建模之外 Beyond Language Modeling

Click to read the English version

只包含解码器的 transformer (比如GPT2)不断地表现出在语言建模之外的应用前景。在许多应用程序中,这类模型已经取得了成功:机器翻译、自动摘要生成、迁移学习和音乐生成。让我们一起来回顾一下其中的一些应用。

机器翻译

进行翻译时,模型不需要编码器。同样的任务可以通过一个只有解码器的 transformer 来解决:

自动摘要生成

这是第一个训练只包含解码器的 transformer 的任务。也就是说,该模型被训练来阅读维基百科的文章(没有目录前的开头部分),然后生成摘要。文章实际的开头部分被用作训练数据集的标签:

论文使用维基百科的文章对模型进行了训练,训练好的模型能够生成文章的摘要:

迁移学习

在论文 Sample Efficient Text Summarization Using a Single Pre-Trained Transformer中,首先使用只包含解码器的 transformer 在语言建模任务中进行预训练,然后通过调优来完成摘要生成任务。结果表明,在数据有限的情况下,该方案比预训练好的编码器-解码器 transformer 得到了更好的效果。
GPT2 的论文也展示了对语言建模模型进行预训练后取得的摘要生成效果。

音乐生成

音乐 transformer 采用了只包含解码器的 transformer 来生成具有丰富节奏和动感的音乐。和语言建模相似,「音乐建模」就是让模型以一种无监督的方式学习音乐,然后让它输出样本(我们此前称之为「随机工作」)。


了解更多基于 Transformer 的模型

GPT2只是基于 Transformer 的模型的沧海一粟,2018-2019年的15个重要的基于Transformer 的模型的对比可以参见 后BERT时代:15个预训练模型对比分析与关键点探索

本站所有文章和源码均免费开放,如您喜欢,可以请我喝杯咖啡