Add Dropout layer.

2023-04-18 19:22:13 -07:00 · 2023-04-18 19:22:13 -07:00 · 3aa1d977b1
commit 3aa1d977b1
parent f6df67f2d2
5 changed files with 114 additions and 5 deletions
--- a/keras_core/backend/common/random.py
+++ b/keras_core/backend/common/random.py
@ -5,11 +5,12 @@ class SeedGenerator:
    def __init__(self, seed):
        from keras_core.backend import Variable

+        if seed is None:
+            seed = make_default_seed()
        if not isinstance(seed, int):
            raise ValueError(
                "Argument `seed` must be an integer. " f"Received: seed={seed}"
            )
-        seed = seed or make_default_seed()
        self.state = Variable([seed, 0], dtype="uint32", trainable=False)


--- a/keras_core/layers/init.py
+++ b/keras_core/layers/init.py
@ -2,5 +2,4 @@ from keras_core.layers.core.dense import Dense
 from keras_core.layers.core.input_layer import Input
 from keras_core.layers.core.input_layer import InputLayer
 from keras_core.layers.layer import Layer
-
-# from keras_core.layers.regularization.dropout import Dropout
+from keras_core.layers.regularization.dropout import Dropout
--- a/keras_core/layers/regularization/dropout.py
+++ b/keras_core/layers/regularization/dropout.py
@ -0,0 +1,77 @@
+from keras_core import backend
+from keras_core import layers
+from keras_core.api_export import keras_core_export
+
+
+@keras_core_export("keras_core.layers.Dropout")
+class Dropout(layers.Layer):
+    """Applies dropout to the input.
+
+    The `Dropout` layer randomly sets input units to 0 with a frequency of `rate`
+    at each step during training time, which helps prevent overfitting.
+    Inputs not set to 0 are scaled up by `1 / (1 - rate)` such that the sum over
+    all inputs is unchanged.
+
+    Note that the `Dropout` layer only applies when `training` is set to `True`
+    in `call()`, such that no values are dropped during inference.
+    When using `model.fit`, `training` will be appropriately set to `True`
+    automatically. In other contexts, you can set the argument explicitly
+    to `True` when calling the layer.
+
+    (This is in contrast to setting `trainable=False` for a `Dropout` layer.
+    `trainable` does not affect the layer's behavior, as `Dropout` does
+    not have any variables/weights that can be frozen during training.)
+
+    Args:
+        rate: Float between 0 and 1. Fraction of the input units to drop.
+        noise_shape: 1D integer tensor representing the shape of the
+            binary dropout mask that will be multiplied with the input.
+            For instance, if your inputs have shape
+            `(batch_size, timesteps, features)` and
+            you want the dropout mask to be the same for all timesteps,
+            you can use `noise_shape=(batch_size, 1, features)`.
+        seed: A Python integer to use as random seed.
+
+    Call arguments:
+        inputs: Input tensor (of any rank).
+        training: Python boolean indicating whether the layer should behave in
+            training mode (adding dropout) or in inference mode (doing nothing).
+    """
+
+    def __init__(
+        self, rate, noise_shape=None, seed=None, name=None, dtype=None
+    ):
+        super().__init__(name=name, dtype=dtype)
+        if isinstance(rate, (int, float)) and not 0 <= rate <= 1:
+            raise ValueError(
+                f"Invalid value received for argument "
+                "`rate`. Expected a float value between 0 and 1. "
+                f"Received: rate={rate}"
+            )
+        self.rate = rate
+        self.seed = seed
+        self.noise_shape = noise_shape
+        self.seed_generator = backend.random.SeedGenerator(seed)
+        self.supports_masking = True
+
+    def call(self, inputs, training=False):
+        if training and self.rate > 0:
+            return backend.random.dropout(
+                inputs,
+                self.rate,
+                noise_shape=self.noise_shape,
+                seed=self.seed_generator,
+            )
+        return inputs
+
+    def compute_output_shape(self, input_shape):
+        return input_shape
+
+    def get_config(self):
+        base_config = super().get_config()
+        config = {
+            "rate": self.rate,
+            "seed": self.seed,
+            "noise_shape": self.noise_shape,
+        }
+        return {**base_config, **config}
--- a/keras_core/layers/regularization/dropout_test.py
+++ b/keras_core/layers/regularization/dropout_test.py
@ -0,0 +1,34 @@
+import numpy as np
+import pytest
+
+from keras_core import backend
+from keras_core import layers
+from keras_core import testing
+
+
+class DropoutTest(testing.TestCase):
+    def test_dropout_supports_masking(self):
+        dropout = layers.Dropout(0.5)
+        self.assertEqual(True, dropout.supports_masking)
+
+    def test_dropout_rescaling(self):
+        inputs = np.ones((20, 500))
+        layer = layers.Dropout(0.5, seed=1337)
+        outputs = layer(inputs, training=True)
+        self.assertAllClose(np.mean(outputs), 1.0, atol=0.02)
+        self.assertAllClose(np.max(outputs), 2.0)
+
+    @pytest.mark.skipif(
+        backend.backend() != "tensorflow", reason="Requires dynamic shapes"
+    )
+    def test_dropout_partial_noise_shape_dynamic(self):
+        inputs = np.ones((20, 5, 10))
+        layer = layers.Dropout(0.5, noise_shape=(None, 1, None))
+        outputs = layer(inputs, training=True)
+        self.assertAllClose(outputs[:, 0, :], outputs[:, 1, :])
+
+    def test_dropout_partial_noise_shape_static(self):
+        inputs = np.ones((20, 5, 10))
+        layer = layers.Dropout(0.5, noise_shape=(20, 1, 10))
+        outputs = layer(inputs, training=True)
+        self.assertAllClose(outputs[:, 0, :], outputs[:, 1, :])
--- a/keras_core/regularizers/regularizers_test.py
+++ b/keras_core/regularizers/regularizers_test.py
@ -1,8 +1,6 @@
 import numpy as np

 from keras_core import backend
-from keras_core import initializers
-from keras_core import operations as ops
 from keras_core import regularizers
 from keras_core import testing