keras/examples/lstm_text_generation.py

from __future__ import print_function
from keras.models import Sequential
from keras.layers.core import Dense, Activation, Dropout
from keras.layers.recurrent import LSTM
from keras.datasets.data_utils import get_file
import numpy as np
import random, sys

'''
    Example script to generate text from Nietzsche's writings.

    At least 20 epochs are required before the generated text
    starts sounding coherent.

    It is recommended to run this script on GPU, as recurrent
    networks are quite computationally intensive.

    If you try this script on new data, make sure your corpus 
    has at least ~100k characters. ~1M is better.
'''

path = get_file('nietzsche.txt', origin="https://s3.amazonaws.com/text-datasets/nietzsche.txt")
text = open(path).read().lower()
print('corpus length:', len(text))

chars = set(text)
print('total chars:', len(chars))
char_indices = dict((c, i) for i, c in enumerate(chars))
indices_char = dict((i, c) for i, c in enumerate(chars))

# cut the text in semi-redundant sequences of maxlen characters
maxlen = 20
step = 3
sentences = []
next_chars = []
for i in range(0, len(text) - maxlen, step):
    sentences.append(text[i : i + maxlen])
    next_chars.append(text[i + maxlen])
print('nb sequences:', len(sentences))

print('Vectorization...')
X = np.zeros((len(sentences), maxlen, len(chars)), dtype=np.bool)
y = np.zeros((len(sentences), len(chars)), dtype=np.bool)
for i, sentence in enumerate(sentences):
    for t, char in enumerate(sentence):
        X[i, t, char_indices[char]] = 1
    y[i, char_indices[next_chars[i]]] = 1


# build the model: 2 stacked LSTM
print('Build model...')
model = Sequential()
model.add(LSTM(len(chars), 512, return_sequences=True))
model.add(Dropout(0.2))
model.add(LSTM(512, 512, return_sequences=False))
model.add(Dropout(0.2))
model.add(Dense(512, len(chars)))
model.add(Activation('softmax'))

model.compile(loss='categorical_crossentropy', optimizer='rmsprop')

# helper function to sample an index from a probability array
def sample(a, diversity=0.75):
    if random.random() > diversity:
        return np.argmax(a)
    while 1:
        i = random.randint(0, len(a)-1)
        if a[i] > random.random():
            return i

# train the model, output generated text after each iteration
for iteration in range(1, 60):
    print()
    print('-' * 50)
    print('Iteration', iteration)
    model.fit(X, y, batch_size=128, nb_epoch=1)

    start_index = random.randint(0, len(text) - maxlen - 1)

    for diversity in [0.2, 0.4, 0.6, 0.8]:
        print()
        print('----- diversity:', diversity)

        generated = ''
        sentence = text[start_index : start_index + maxlen]
        generated += sentence
        print('----- Generating with seed: "' + sentence + '"')
        sys.stdout.write(generated)

        for iteration in range(400):
            x = np.zeros((1, maxlen, len(chars)))
            for t, char in enumerate(sentence):
                x[0, t, char_indices[char]] = 1.

            preds = model.predict(x, verbose=0)[0]
            next_index = sample(preds, diversity)
            next_char = indices_char[next_index]

            generated += next_char
            sentence = sentence[1:] + next_char

            sys.stdout.write(next_char)
            sys.stdout.flush()
        print()
Fix printing for Python2 in LSTM example 2015-06-16 00:54:59 +00:00			`from __future__ import print_function`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00			`from keras.models import Sequential`
Improve LSTM text generation example 2015-06-17 05:52:06 +00:00			`from keras.layers.core import Dense, Activation, Dropout`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00			`from keras.layers.recurrent import LSTM`
			`from keras.datasets.data_utils import get_file`
			`import numpy as np`
			`import random, sys`

			`'''`
			`Example script to generate text from Nietzsche's writings.`

			`At least 20 epochs are required before the generated text`
			`starts sounding coherent.`

			`It is recommended to run this script on GPU, as recurrent`
			`networks are quite computationally intensive.`

			`If you try this script on new data, make sure your corpus`
			`has at least ~100k characters. ~1M is better.`
			`'''`

			`path = get_file('nietzsche.txt', origin="https://s3.amazonaws.com/text-datasets/nietzsche.txt")`
			`text = open(path).read().lower()`
			`print('corpus length:', len(text))`

			`chars = set(text)`
			`print('total chars:', len(chars))`
			`char_indices = dict((c, i) for i, c in enumerate(chars))`
			`indices_char = dict((i, c) for i, c in enumerate(chars))`

Improve LSTM text generation example 2015-06-17 05:52:06 +00:00			`# cut the text in semi-redundant sequences of maxlen characters`
			`maxlen = 20`
			`step = 3`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00			`sentences = []`
			`next_chars = []`
			`for i in range(0, len(text) - maxlen, step):`
			`sentences.append(text[i : i + maxlen])`
			`next_chars.append(text[i + maxlen])`
			`print('nb sequences:', len(sentences))`

			`print('Vectorization...')`
Decrease memory usage of LSTM text gen example Both the training features and labels can be represented as numpy booleans instead of float32 / float64. This enables standard low RAM machines to scale up to large datasets. Especially important if you either have many characters (ASCII), long sequences, or a large dataset. 2015-06-22 21:24:46 +00:00			`X = np.zeros((len(sentences), maxlen, len(chars)), dtype=np.bool)`
			`y = np.zeros((len(sentences), len(chars)), dtype=np.bool)`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00			`for i, sentence in enumerate(sentences):`
			`for t, char in enumerate(sentence):`
Decrease memory usage of LSTM text gen example Both the training features and labels can be represented as numpy booleans instead of float32 / float64. This enables standard low RAM machines to scale up to large datasets. Especially important if you either have many characters (ASCII), long sequences, or a large dataset. 2015-06-22 21:24:46 +00:00			`X[i, t, char_indices[char]] = 1`
			`y[i, char_indices[next_chars[i]]] = 1`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00

			`# build the model: 2 stacked LSTM`
			`print('Build model...')`
			`model = Sequential()`
			`model.add(LSTM(len(chars), 512, return_sequences=True))`
Improve LSTM text generation example 2015-06-17 05:52:06 +00:00			`model.add(Dropout(0.2))`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00			`model.add(LSTM(512, 512, return_sequences=False))`
Improve LSTM text generation example 2015-06-17 05:52:06 +00:00			`model.add(Dropout(0.2))`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00			`model.add(Dense(512, len(chars)))`
			`model.add(Activation('softmax'))`

			`model.compile(loss='categorical_crossentropy', optimizer='rmsprop')`

			`# helper function to sample an index from a probability array`
			`def sample(a, diversity=0.75):`
			`if random.random() > diversity:`
			`return np.argmax(a)`
			`while 1:`
			`i = random.randint(0, len(a)-1)`
			`if a[i] > random.random():`
			`return i`

Improve LSTM text generation example 2015-06-17 05:52:06 +00:00			`# train the model, output generated text after each iteration`
			`for iteration in range(1, 60):`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00			`print()`
			`print('-' * 50)`
			`print('Iteration', iteration)`
			`model.fit(X, y, batch_size=128, nb_epoch=1)`

			`start_index = random.randint(0, len(text) - maxlen - 1)`

Improve LSTM text generation example 2015-06-17 05:52:06 +00:00			`for diversity in [0.2, 0.4, 0.6, 0.8]:`
Add LSTM text generation example 2015-06-16 00:43:25 +00:00			`print()`
			`print('----- diversity:', diversity)`

			`generated = ''`
			`sentence = text[start_index : start_index + maxlen]`
			`generated += sentence`
			`print('----- Generating with seed: "' + sentence + '"')`
			`sys.stdout.write(generated)`

			`for iteration in range(400):`
			`x = np.zeros((1, maxlen, len(chars)))`
			`for t, char in enumerate(sentence):`
			`x[0, t, char_indices[char]] = 1.`

			`preds = model.predict(x, verbose=0)[0]`
			`next_index = sample(preds, diversity)`
			`next_char = indices_char[next_index]`

			`generated += next_char`
			`sentence = sentence[1:] + next_char`

			`sys.stdout.write(next_char)`
			`sys.stdout.flush()`
Improve LSTM text generation example 2015-06-17 05:52:06 +00:00			`print()`