From 694a2306f501203403fc82fceae6adf035bceacd Mon Sep 17 00:00:00 2001
From: Vitaly Lavrukhin <vlavrukhin@nvidia.com>
Date: Wed, 29 Aug 2018 16:18:33 -0700
Subject: [PATCH] Updated docs

---
 docs/html/_modules/data/data_layer.html       |  18 +
 .../data/speech2text/speech2text.html         |  80 +++-
 .../data/text2speech/speech_utils.html        | 112 +++--
 .../data/text2speech/text2speech.html         | 329 +++++++++----
 .../_modules/data/text2text/text2text.html    | 142 ++++--
 .../_modules/decoders/convs2s_decoder.html    |  55 ++-
 docs/html/_modules/decoders/fc_decoders.html  |  27 +-
 docs/html/_modules/decoders/rnn_decoders.html |  89 +++-
 .../_modules/decoders/tacotron2_decoder.html  |  67 ++-
 .../_modules/encoders/convs2s_encoder.html    |  42 +-
 .../_modules/encoders/tacotron2_encoder.html  |  37 +-
 docs/html/_modules/encoders/w2l_encoder.html  |  14 +-
 docs/html/_modules/losses/sequence_loss.html  | 130 ++++++
 docs/html/_modules/losses/tacotron_loss.html  |  31 +-
 docs/html/_modules/models/model.html          | 115 ++++-
 docs/html/_modules/models/text2speech.html    | 103 +++--
 docs/html/_modules/models/text2text.html      |  20 +-
 .../html/_modules/parts/cnns/conv_blocks.html |  87 +++-
 .../parts/convs2s/attention_wn_layer.html     |  26 +-
 .../_modules/parts/convs2s/conv_wn_layer.html |  73 ++-
 .../_modules/parts/convs2s/ffn_wn_layer.html  |  67 ++-
 .../parts/rnns/attention_wrapper.html         |  12 +-
 .../parts/rnns/rnn_beam_search_decoder.html   |   3 +-
 docs/html/_modules/parts/rnns/utils.html      |  45 +-
 .../parts/tacotron/tacotron_decoder.html      |   6 +-
 .../parts/tacotron/tacotron_helper.html       |  46 +-
 .../parts/transformer/embedding_layer.html    |   6 +-
 docs/html/_modules/utils/funcs.html           |  17 +-
 docs/html/_modules/utils/hooks.html           |  26 +-
 docs/html/_modules/utils/utils.html           | 317 ++++++++++++-
 .../html/_sources/machine-translation.rst.txt |   6 +-
 .../_sources/machine-translation/gnmt.rst.txt |   4 +-
 docs/html/_sources/models-and-recipes.rst.txt | 173 -------
 docs/html/_sources/speech-recognition.rst.txt |   8 +-
 .../speech-recognition/deepspeech2.rst.txt    |   2 +-
 .../speech-recognition/wave2letter.rst.txt    |   4 +-
 docs/html/_sources/speech-synthesis.rst.txt   |   4 +-
 docs/html/api-docs/data.html                  |  19 +
 docs/html/api-docs/data.speech2text.html      |  45 ++
 docs/html/api-docs/data.text2speech.html      | 108 ++++-
 docs/html/api-docs/data.text2text.html        |  26 ++
 docs/html/api-docs/decoders.html              |  44 +-
 docs/html/api-docs/encoders.html              |  18 +-
 docs/html/api-docs/losses.html                | 124 ++++-
 docs/html/api-docs/models.html                |  23 +-
 docs/html/api-docs/parts.cnns.html            |  23 +-
 docs/html/api-docs/parts.convs2s.html         |  16 +-
 docs/html/api-docs/parts.rnns.html            |   2 +-
 docs/html/api-docs/parts.tacotron.html        |   9 +-
 docs/html/api-docs/parts.transformer.html     |   2 +-
 docs/html/api-docs/utils.html                 | 126 ++++-
 docs/html/genindex.html                       |  70 ++-
 docs/html/machine-translation.html            |   6 +-
 docs/html/machine-translation/gnmt.html       |   4 +-
 docs/html/models-and-recipes.html             | 431 ------------------
 docs/html/objects.inv                         | Bin 6262 -> 6383 bytes
 docs/html/searchindex.js                      |   2 +-
 docs/html/speech-recognition.html             |   8 +-
 docs/html/speech-recognition/deepspeech2.html |   2 +-
 docs/html/speech-recognition/wave2letter.html |   2 +-
 docs/html/speech-synthesis.html               |   2 +-
 docs/sources/source/machine-translation.rst   |   6 +-
 .../source/machine-translation/gnmt.rst       |   4 +-
 docs/sources/source/models-and-recipes.rst    | 173 -------
 docs/sources/source/speech-recognition.rst    |   8 +-
 .../source/speech-recognition/deepspeech2.rst |   2 +-
 .../source/speech-recognition/wave2letter.rst |   4 +-
 docs/sources/source/speech-synthesis.rst      |   4 +-
 68 files changed, 2260 insertions(+), 1396 deletions(-)
 delete mode 100644 docs/html/_sources/models-and-recipes.rst.txt
 delete mode 100644 docs/html/models-and-recipes.html
 delete mode 100644 docs/sources/source/models-and-recipes.rst

diff --git a/docs/html/_modules/data/data_layer.html b/docs/html/_modules/data/data_layer.html
index 4ec9fb2b3..5530a1b39 100644
--- a/docs/html/_modules/data/data_layer.html
+++ b/docs/html/_modules/data/data_layer.html
@@ -200,6 +200,7 @@ <h1>Source code for data.data_layer</h1><div class="highlight"><pre>
         <span class="s1">&#39;batch_size&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
         <span class="s1">&#39;shuffle&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
         <span class="s1">&#39;dtype&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">tf</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span> <span class="n">tf</span><span class="o">.</span><span class="n">float16</span><span class="p">],</span>
+        <span class="s1">&#39;interactive&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
     <span class="p">}</span></div>
 
 <div class="viewcode-block" id="DataLayer.__init__"><a class="viewcode-back" href="../../api-docs/data.html#data.data_layer.DataLayer.__init__">[docs]</a>  <span class="nd">@abc</span><span class="o">.</span><span class="n">abstractmethod</span>
@@ -278,6 +279,23 @@ <h1>Source code for data.data_layer</h1><div class="highlight"><pre>
 <span class="sd">    &quot;&quot;&quot;</span>
     <span class="k">pass</span>
 
+<div class="viewcode-block" id="DataLayer.create_interactive_placeholders"><a class="viewcode-back" href="../../api-docs/data.html#data.data_layer.DataLayer.create_interactive_placeholders">[docs]</a>  <span class="k">def</span> <span class="nf">create_interactive_placeholders</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot;A function that must be defined for data layers that support interactive</span>
+<span class="sd">    infer. This function is intended to create placeholders that will be passed</span>
+<span class="sd">    to self._input_tensors that will be passed to the model.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="k">pass</span></div>
+
+<div class="viewcode-block" id="DataLayer.create_feed_dict"><a class="viewcode-back" href="../../api-docs/data.html#data.data_layer.DataLayer.create_feed_dict">[docs]</a>  <span class="k">def</span> <span class="nf">create_feed_dict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">model_in</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot;A function that must be defined for data layers that support interactive</span>
+<span class="sd">    infer. Given input which is an abstract data element to be defined by the</span>
+<span class="sd">    data layer. The intended use is for the user to build and pass model_in from</span>
+<span class="sd">    the jupyter notebook. Given model_in, the data layer must preprocess the raw</span>
+<span class="sd">    data, and create the feed dict that defines the placeholders defined in</span>
+<span class="sd">    create_interactive_placeholders().</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="k">pass</span></div>
+
 <div class="viewcode-block" id="DataLayer.get_size_in_samples"><a class="viewcode-back" href="../../api-docs/data.html#data.data_layer.DataLayer.get_size_in_samples">[docs]</a>  <span class="k">def</span> <span class="nf">get_size_in_samples</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Should return the dataset size in samples.</span>
 <span class="sd">    That is, the number of objects in the dataset. This method is used to</span>
diff --git a/docs/html/_modules/data/speech2text/speech2text.html b/docs/html/_modules/data/speech2text/speech2text.html
index 31edcc52e..9c5b3de41 100644
--- a/docs/html/_modules/data/speech2text/speech2text.html
+++ b/docs/html/_modules/data/speech2text/speech2text.html
@@ -165,11 +165,12 @@ <h1>Source code for data.speech2text.speech2text</h1><div class="highlight"><pre
 <span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
 <span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 <span class="kn">import</span> <span class="nn">six</span>
+<span class="kn">from</span> <span class="nn">six</span> <span class="k">import</span> <span class="n">string_types</span>
 <span class="kn">from</span> <span class="nn">six.moves</span> <span class="k">import</span> <span class="nb">range</span>
 
 <span class="kn">from</span> <span class="nn">open_seq2seq.data.data_layer</span> <span class="k">import</span> <span class="n">DataLayer</span>
 <span class="kn">from</span> <span class="nn">open_seq2seq.data.utils</span> <span class="k">import</span> <span class="n">load_pre_existing_vocabulary</span>
-<span class="kn">from</span> <span class="nn">.speech_utils</span> <span class="k">import</span> <span class="n">get_speech_features_from_file</span>
+<span class="kn">from</span> <span class="nn">.speech_utils</span> <span class="k">import</span> <span class="n">get_speech_features_from_file</span><span class="p">,</span> <span class="n">get_speech_features</span>
 
 
 <div class="viewcode-block" id="Speech2TextDataLayer"><a class="viewcode-back" href="../../../api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer">[docs]</a><span class="k">class</span> <span class="nc">Speech2TextDataLayer</span><span class="p">(</span><span class="n">DataLayer</span><span class="p">):</span>
@@ -349,6 +350,64 @@ <h1>Source code for data.speech2text.speech2text</h1><div class="highlight"><pre
     <span class="k">else</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span><span class="p">[</span><span class="s1">&#39;source_ids&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="n">x_id</span><span class="p">]</span></div>
 
+<div class="viewcode-block" id="Speech2TextDataLayer.create_interactive_placeholders"><a class="viewcode-back" href="../../../api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer.create_interactive_placeholders">[docs]</a>  <span class="k">def</span> <span class="nf">create_interactive_placeholders</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_x</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span>
+        <span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dtype&#39;</span><span class="p">],</span>
+        <span class="n">shape</span> <span class="o">=</span> <span class="p">[</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">],</span>
+            <span class="kc">None</span><span class="p">,</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span>
+        <span class="p">]</span>
+    <span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_x_length</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span>
+        <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">,</span>
+        <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]]</span>
+    <span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_x_id</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span>
+        <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">,</span>
+        <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]]</span>
+    <span class="p">)</span>
+
+    <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span> <span class="o">=</span> <span class="p">{}</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span><span class="p">[</span><span class="s2">&quot;source_tensors&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_x_length</span><span class="p">]</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span><span class="p">[</span><span class="s1">&#39;source_ids&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_x_id</span><span class="p">]</span></div>
+
+<div class="viewcode-block" id="Speech2TextDataLayer.create_feed_dict"><a class="viewcode-back" href="../../../api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer.create_feed_dict">[docs]</a>  <span class="k">def</span> <span class="nf">create_feed_dict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">model_in</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot; Creates the feed dict for interactive infer</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">      model_in (str or np.array): Either a str that contains the file path of the</span>
+<span class="sd">        wav file, or a numpy array containing 1-d wav file.</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">      feed_dict (dict): Dictionary with values for the placeholders.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">model_in</span><span class="p">,</span> <span class="n">string_types</span><span class="p">):</span>
+      <span class="n">audio</span><span class="p">,</span> <span class="n">audio_length</span><span class="p">,</span> <span class="n">x_id</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parse_audio_element</span><span class="p">([</span><span class="mi">0</span><span class="p">,</span> <span class="n">model_in</span><span class="p">])</span>
+    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">model_in</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+      <span class="n">audio</span><span class="p">,</span> <span class="n">audio_length</span><span class="p">,</span> <span class="n">x_id</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_audio</span><span class="p">(</span><span class="n">model_in</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+          <span class="s2">&quot;Speech2Text&#39;s interactive inference mode only supports string or&quot;</span><span class="p">,</span>
+          <span class="s2">&quot;numpy array as input. Got </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span> <span class="nb">format</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">model_in</span><span class="p">))</span>
+      <span class="p">)</span>
+
+    <span class="n">audio</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span>
+        <span class="n">audio</span><span class="p">,</span>
+        <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">],</span>
+        <span class="o">-</span><span class="mi">1</span><span class="p">,</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]]</span>
+    <span class="p">)</span>
+    <span class="n">audio_length</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">audio_length</span><span class="p">,</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]])</span>
+    <span class="n">x_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">x_id</span><span class="p">,</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]])</span>
+
+    <span class="n">feed_dict</span> <span class="o">=</span> <span class="p">{</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_x</span><span class="p">:</span> <span class="n">audio</span><span class="p">,</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_x_length</span><span class="p">:</span> <span class="n">audio_length</span><span class="p">,</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_x_id</span><span class="p">:</span><span class="n">x_id</span><span class="p">,</span>
+    <span class="p">}</span>
+    <span class="k">return</span> <span class="n">feed_dict</span></div>
+
 <div class="viewcode-block" id="Speech2TextDataLayer._parse_audio_transcript_element"><a class="viewcode-back" href="../../../api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer._parse_audio_transcript_element">[docs]</a>  <span class="k">def</span> <span class="nf">_parse_audio_transcript_element</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">element</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Parses tf.data element from TextLineDataset into audio and text.</span>
 <span class="sd">    Args:</span>
@@ -373,6 +432,25 @@ <h1>Source code for data.speech2text.speech2text</h1><div class="highlight"><pre
         <span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">target</span><span class="p">)]),</span> \
         <span class="n">np</span><span class="o">.</span><span class="n">float32</span><span class="p">([</span><span class="n">audio_duration</span><span class="p">])</span></div>
 
+<div class="viewcode-block" id="Speech2TextDataLayer._get_audio"><a class="viewcode-back" href="../../../api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer._get_audio">[docs]</a>  <span class="k">def</span> <span class="nf">_get_audio</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">wav</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot;Parses audio from wav and returns array of audio features.</span>
+<span class="sd">    Args:</span>
+<span class="sd">      wav: numpy array containing wav</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">      tuple: source audio features as ``np.array``, length of source sequence,</span>
+<span class="sd">      sample id.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">pad_to</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;pad_to&#39;</span><span class="p">,</span> <span class="mi">8</span><span class="p">)</span>
+    <span class="n">source</span><span class="p">,</span> <span class="n">audio_duration</span> <span class="o">=</span> <span class="n">get_speech_features</span><span class="p">(</span>
+        <span class="n">wav</span><span class="p">,</span> <span class="mf">16000.</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">],</span> <span class="n">pad_to</span><span class="p">,</span>
+        <span class="n">features_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;input_type&#39;</span><span class="p">],</span>
+        <span class="n">augmentation</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;augmentation&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">),</span>
+    <span class="p">)</span>
+    <span class="k">return</span> <span class="n">source</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dtype&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">as_numpy_dtype</span><span class="p">()),</span> \
+        <span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">source</span><span class="p">)]),</span> <span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">([</span><span class="mi">0</span><span class="p">]),</span> \
+        <span class="n">np</span><span class="o">.</span><span class="n">float32</span><span class="p">([</span><span class="n">audio_duration</span><span class="p">])</span></div>
+
 <div class="viewcode-block" id="Speech2TextDataLayer._parse_audio_element"><a class="viewcode-back" href="../../../api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer._parse_audio_element">[docs]</a>  <span class="k">def</span> <span class="nf">_parse_audio_element</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">id_and_audio_filename</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Parses audio from file and returns array of audio features.</span>
 <span class="sd">    Args:</span>
diff --git a/docs/html/_modules/data/text2speech/speech_utils.html b/docs/html/_modules/data/text2speech/speech_utils.html
index b6d26c89c..4f82ee8af 100644
--- a/docs/html/_modules/data/text2speech/speech_utils.html
+++ b/docs/html/_modules/data/text2speech/speech_utils.html
@@ -158,7 +158,6 @@ <h1>Source code for data.text2speech.speech_utils</h1><div class="highlight"><pr
 <span></span><span class="c1"># Copyright (c) 2018 NVIDIA Corporation</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
-<span class="kn">from</span> <span class="nn">six.moves</span> <span class="k">import</span> <span class="nb">range</span>
 
 <span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
 <span class="kn">import</span> <span class="nn">librosa</span>
@@ -168,39 +167,50 @@ <h1>Source code for data.text2speech.speech_utils</h1><div class="highlight"><pr
     <span class="n">filename</span><span class="p">,</span>
     <span class="n">num_features</span><span class="p">,</span>
     <span class="n">features_type</span><span class="o">=</span><span class="s1">&#39;magnitude&#39;</span><span class="p">,</span>
-    <span class="n">window_size</span><span class="o">=</span><span class="mi">1024</span><span class="p">,</span>
-    <span class="n">window_stride</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
+    <span class="n">n_fft</span><span class="o">=</span><span class="mi">1024</span><span class="p">,</span>
+    <span class="n">hop_length</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
     <span class="n">mag_power</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
     <span class="n">feature_normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
     <span class="n">mean</span><span class="o">=</span><span class="mf">0.</span><span class="p">,</span>
-    <span class="n">std</span><span class="o">=</span><span class="mf">1.</span>
+    <span class="n">std</span><span class="o">=</span><span class="mf">1.</span><span class="p">,</span>
+    <span class="n">trim</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+    <span class="n">data_min</span><span class="o">=</span><span class="mf">1e-5</span>
 <span class="p">):</span>
   <span class="sd">&quot;&quot;&quot; Helper function to retrieve spectrograms from wav files</span>
 
-
 <span class="sd">  Args:</span>
 <span class="sd">    filename (string): WAVE filename.</span>
 <span class="sd">    num_features (int): number of speech features in frequency domain.</span>
 <span class="sd">    features_type (string): &#39;magnitude&#39; or &#39;mel&#39;.</span>
-<span class="sd">    window_size (int): size of analysis window in samples.</span>
-<span class="sd">    window_stride (int): stride of analysis window in samples.</span>
+<span class="sd">    n_fft (int): size of analysis window in samples.</span>
+<span class="sd">    hop_length (int): stride of analysis window in samples.</span>
 <span class="sd">    mag_power (int): power to raise magnitude spectrograms (prior to dot product</span>
 <span class="sd">      with mel basis)</span>
 <span class="sd">      1 for energy spectrograms</span>
 <span class="sd">      2 fot power spectrograms</span>
-<span class="sd">    feature_normalize(bool): whether to normalize the data with mean and std</span>
-<span class="sd">    mean(float): if normalize is enabled, the mean to normalize to</span>
-<span class="sd">    std(float): if normalize is enabled, the deviation to normalize to</span>
+<span class="sd">    feature_normalize (bool): whether to normalize the data with mean and std</span>
+<span class="sd">    mean (float): if normalize is enabled, the mean to normalize to</span>
+<span class="sd">    std (float): if normalize is enabled, the deviation to normalize to</span>
+<span class="sd">    trim (bool): Whether to trim silence via librosa or not</span>
+<span class="sd">    data_min (float): min clip value prior to taking the log.</span>
 
 <span class="sd">  Returns:</span>
 <span class="sd">    np.array: np.array of audio features with shape=[num_time_steps,</span>
-<span class="sd">      num_features].</span>
+<span class="sd">    num_features].</span>
 <span class="sd">  &quot;&quot;&quot;</span>
   <span class="c1"># load audio signal</span>
   <span class="n">signal</span><span class="p">,</span> <span class="n">fs</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="n">sr</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+  <span class="k">if</span> <span class="n">hop_length</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+    <span class="n">hop_length</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n_fft</span> <span class="o">/</span> <span class="mi">4</span><span class="p">)</span>
+  <span class="k">if</span> <span class="n">trim</span><span class="p">:</span>
+    <span class="n">signal</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">effects</span><span class="o">.</span><span class="n">trim</span><span class="p">(</span>
+        <span class="n">signal</span><span class="p">,</span>
+        <span class="n">frame_length</span><span class="o">=</span><span class="nb">int</span><span class="p">(</span><span class="n">n_fft</span><span class="o">/</span><span class="mi">2</span><span class="p">),</span>
+        <span class="n">hop_length</span><span class="o">=</span><span class="nb">int</span><span class="p">(</span><span class="n">hop_length</span><span class="o">/</span><span class="mi">2</span><span class="p">)</span>
+    <span class="p">)</span>
   <span class="k">return</span> <span class="n">get_speech_features</span><span class="p">(</span>
-      <span class="n">signal</span><span class="p">,</span> <span class="n">fs</span><span class="p">,</span> <span class="n">num_features</span><span class="p">,</span> <span class="n">features_type</span><span class="p">,</span> <span class="n">window_size</span><span class="p">,</span>
-      <span class="n">window_stride</span><span class="p">,</span> <span class="n">mag_power</span><span class="p">,</span> <span class="n">feature_normalize</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">std</span>
+      <span class="n">signal</span><span class="p">,</span> <span class="n">fs</span><span class="p">,</span> <span class="n">num_features</span><span class="p">,</span> <span class="n">features_type</span><span class="p">,</span> <span class="n">n_fft</span><span class="p">,</span>
+      <span class="n">hop_length</span><span class="p">,</span> <span class="n">mag_power</span><span class="p">,</span> <span class="n">feature_normalize</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">std</span><span class="p">,</span> <span class="n">data_min</span>
   <span class="p">)</span></div>
 
 
@@ -209,23 +219,23 @@ <h1>Source code for data.text2speech.speech_utils</h1><div class="highlight"><pr
     <span class="n">fs</span><span class="p">,</span>
     <span class="n">num_features</span><span class="p">,</span>
     <span class="n">features_type</span><span class="o">=</span><span class="s1">&#39;magnitude&#39;</span><span class="p">,</span>
-    <span class="n">n_window_size</span><span class="o">=</span><span class="mi">1024</span><span class="p">,</span>
-    <span class="n">n_window_stride</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
+    <span class="n">n_fft</span><span class="o">=</span><span class="mi">1024</span><span class="p">,</span>
+    <span class="n">hop_length</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
     <span class="n">mag_power</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
     <span class="n">feature_normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
     <span class="n">mean</span><span class="o">=</span><span class="mf">0.</span><span class="p">,</span>
-    <span class="n">std</span><span class="o">=</span><span class="mf">1.</span>
+    <span class="n">std</span><span class="o">=</span><span class="mf">1.</span><span class="p">,</span>
+    <span class="n">data_min</span><span class="o">=</span><span class="mf">1e-5</span>
 <span class="p">):</span>
   <span class="sd">&quot;&quot;&quot; Helper function to retrieve spectrograms from loaded wav</span>
 
-
 <span class="sd">  Args:</span>
 <span class="sd">    signal: signal loaded with librosa.</span>
 <span class="sd">    fs (int): sampling frequency in Hz.</span>
 <span class="sd">    num_features (int): number of speech features in frequency domain.</span>
 <span class="sd">    features_type (string): &#39;magnitude&#39; or &#39;mel&#39;.</span>
-<span class="sd">    window_size (int): size of analysis window in samples.</span>
-<span class="sd">    window_stride (int): stride of analysis window in samples.</span>
+<span class="sd">    n_fft (int): size of analysis window in samples.</span>
+<span class="sd">    hop_length (int): stride of analysis window in samples.</span>
 <span class="sd">    mag_power (int): power to raise magnitude spectrograms (prior to dot product</span>
 <span class="sd">      with mel basis)</span>
 <span class="sd">      1 for energy spectrograms</span>
@@ -233,32 +243,38 @@ <h1>Source code for data.text2speech.speech_utils</h1><div class="highlight"><pr
 <span class="sd">    feature_normalize(bool): whether to normalize the data with mean and std</span>
 <span class="sd">    mean(float): if normalize is enabled, the mean to normalize to</span>
 <span class="sd">    std(float): if normalize is enabled, the deviation to normalize to</span>
+<span class="sd">    data_min (float): min clip value prior to taking the log.</span>
 
 <span class="sd">  Returns:</span>
 <span class="sd">    np.array: np.array of audio features with shape=[num_time_steps,</span>
-<span class="sd">      num_features].</span>
+<span class="sd">    num_features].</span>
 <span class="sd">  &quot;&quot;&quot;</span>
   <span class="k">if</span> <span class="n">features_type</span> <span class="o">==</span> <span class="s1">&#39;magnitude&#39;</span><span class="p">:</span>
-    <span class="n">complex_spec</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">stft</span><span class="p">(</span><span class="n">y</span><span class="o">=</span><span class="n">signal</span><span class="p">,</span> <span class="n">n_fft</span><span class="o">=</span><span class="n">n_window_size</span><span class="p">)</span>
+    <span class="n">complex_spec</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">stft</span><span class="p">(</span><span class="n">y</span><span class="o">=</span><span class="n">signal</span><span class="p">,</span> <span class="n">n_fft</span><span class="o">=</span><span class="n">n_fft</span><span class="p">)</span>
     <span class="n">mag</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">magphase</span><span class="p">(</span><span class="n">complex_spec</span><span class="p">,</span> <span class="n">power</span><span class="o">=</span><span class="n">mag_power</span><span class="p">)</span>
-    <span class="n">features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">mag</span><span class="p">,</span> <span class="n">a_min</span><span class="o">=</span><span class="mf">1e-5</span><span class="p">,</span> <span class="n">a_max</span><span class="o">=</span><span class="kc">None</span><span class="p">))</span><span class="o">.</span><span class="n">T</span>
-    <span class="k">assert</span> <span class="n">num_features</span> <span class="o">&lt;=</span> <span class="n">n_window_size</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> \
+    <span class="n">features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">mag</span><span class="p">,</span> <span class="n">a_min</span><span class="o">=</span><span class="n">data_min</span><span class="p">,</span> <span class="n">a_max</span><span class="o">=</span><span class="kc">None</span><span class="p">))</span><span class="o">.</span><span class="n">T</span>
+    <span class="k">assert</span> <span class="n">num_features</span> <span class="o">&lt;=</span> <span class="n">n_fft</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> \
         <span class="s2">&quot;num_features for spectrogram should be &lt;= (fs * window_size // 2 + 1)&quot;</span>
 
     <span class="c1"># cut high frequency part</span>
     <span class="n">features</span> <span class="o">=</span> <span class="n">features</span><span class="p">[:,</span> <span class="p">:</span><span class="n">num_features</span><span class="p">]</span>
-  <span class="k">elif</span> <span class="n">features_type</span> <span class="o">==</span> <span class="s1">&#39;mel&#39;</span><span class="p">:</span>
+  <span class="k">if</span> <span class="s1">&#39;mel&#39;</span> <span class="ow">in</span> <span class="n">features_type</span><span class="p">:</span>
+    <span class="n">htk</span> <span class="o">=</span> <span class="kc">True</span>
+    <span class="n">norm</span> <span class="o">=</span> <span class="kc">None</span>
+    <span class="k">if</span> <span class="s1">&#39;slaney&#39;</span> <span class="ow">in</span> <span class="n">features_type</span><span class="p">:</span>
+      <span class="n">htk</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="n">norm</span> <span class="o">=</span> <span class="mi">1</span>
     <span class="n">features</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">feature</span><span class="o">.</span><span class="n">melspectrogram</span><span class="p">(</span>
         <span class="n">y</span><span class="o">=</span><span class="n">signal</span><span class="p">,</span>
         <span class="n">sr</span><span class="o">=</span><span class="n">fs</span><span class="p">,</span>
-        <span class="n">n_fft</span><span class="o">=</span><span class="n">n_window_size</span><span class="p">,</span>
-        <span class="n">hop_length</span><span class="o">=</span><span class="n">n_window_stride</span><span class="p">,</span>
+        <span class="n">n_fft</span><span class="o">=</span><span class="n">n_fft</span><span class="p">,</span>
+        <span class="n">hop_length</span><span class="o">=</span><span class="n">hop_length</span><span class="p">,</span>
         <span class="n">n_mels</span><span class="o">=</span><span class="n">num_features</span><span class="p">,</span>
-        <span class="n">power</span><span class="o">=</span><span class="n">mag_power</span>
+        <span class="n">power</span><span class="o">=</span><span class="n">mag_power</span><span class="p">,</span>
+        <span class="n">htk</span><span class="o">=</span><span class="n">htk</span><span class="p">,</span>
+        <span class="n">norm</span><span class="o">=</span><span class="n">norm</span>
     <span class="p">)</span>
-    <span class="n">features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">a_min</span><span class="o">=</span><span class="mf">1e-5</span><span class="p">,</span> <span class="n">a_max</span><span class="o">=</span><span class="kc">None</span><span class="p">))</span><span class="o">.</span><span class="n">T</span>
-  <span class="k">else</span><span class="p">:</span>
-    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;Unknown features type: </span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">features_type</span><span class="p">))</span>
+    <span class="n">features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">a_min</span><span class="o">=</span><span class="n">data_min</span><span class="p">,</span> <span class="n">a_max</span><span class="o">=</span><span class="kc">None</span><span class="p">))</span><span class="o">.</span><span class="n">T</span>
 
   <span class="k">if</span> <span class="n">feature_normalize</span><span class="p">:</span>
     <span class="n">features</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">std</span><span class="p">)</span>
@@ -275,7 +291,10 @@ <h1>Source code for data.text2speech.speech_utils</h1><div class="highlight"><pr
     <span class="n">feature_normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
     <span class="n">mean</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
     <span class="n">std</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-    <span class="n">mel_basis</span><span class="o">=</span><span class="kc">None</span>
+    <span class="n">mel_basis</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+    <span class="n">data_min</span><span class="o">=</span><span class="mf">1e-5</span><span class="p">,</span>
+    <span class="n">htk</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="n">norm</span><span class="o">=</span><span class="kc">None</span>
 <span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">  Method to get mel spectrograms from magnitude spectrograms</span>
@@ -291,16 +310,25 @@ <h1>Source code for data.text2speech.speech_utils</h1><div class="highlight"><pr
 <span class="sd">    std (float): normalization param of mag spec</span>
 <span class="sd">    mel_basis (np.array): optional pre-computed mel basis to save computational</span>
 <span class="sd">      time if passed. If not passed, it will call librosa to construct one</span>
+<span class="sd">    data_min (float): min clip value prior to taking the log.</span>
+<span class="sd">    htk (bool): whther to compute the mel spec with the htk or slaney algorithm</span>
+<span class="sd">    norm: Should be None for htk, and 1 for slaney</span>
 
 <span class="sd">  Returns:</span>
 <span class="sd">    np.array: mel_spec with shape [time, n_mels]</span>
 <span class="sd">  &quot;&quot;&quot;</span>
   <span class="k">if</span> <span class="n">mel_basis</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-    <span class="n">mel_basis</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">filters</span><span class="o">.</span><span class="n">mel</span><span class="p">(</span><span class="n">fs</span><span class="p">,</span> <span class="n">n_fft</span><span class="p">,</span> <span class="n">n_mels</span><span class="o">=</span><span class="n">n_mels</span><span class="p">)</span>
+    <span class="n">mel_basis</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">filters</span><span class="o">.</span><span class="n">mel</span><span class="p">(</span>
+        <span class="n">fs</span><span class="p">,</span>
+        <span class="n">n_fft</span><span class="p">,</span>
+        <span class="n">n_mels</span><span class="o">=</span><span class="n">n_mels</span><span class="p">,</span>
+        <span class="n">htk</span><span class="o">=</span><span class="n">htk</span><span class="p">,</span>
+        <span class="n">norm</span><span class="o">=</span><span class="n">norm</span>
+    <span class="p">)</span>
   <span class="n">log_mag_spec</span> <span class="o">=</span> <span class="n">log_mag_spec</span> <span class="o">*</span> <span class="n">power</span>
   <span class="n">mag_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">exp</span><span class="p">(</span><span class="n">log_mag_spec</span><span class="p">)</span>
   <span class="n">mel_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">mag_spec</span><span class="p">,</span> <span class="n">mel_basis</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
-  <span class="n">mel_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">mel_spec</span><span class="p">,</span> <span class="n">a_min</span><span class="o">=</span><span class="mf">1e-5</span><span class="p">,</span> <span class="n">a_max</span><span class="o">=</span><span class="kc">None</span><span class="p">))</span>
+  <span class="n">mel_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">mel_spec</span><span class="p">,</span> <span class="n">a_min</span><span class="o">=</span><span class="n">data_min</span><span class="p">,</span> <span class="n">a_max</span><span class="o">=</span><span class="kc">None</span><span class="p">))</span>
   <span class="k">if</span> <span class="n">feature_normalize</span><span class="p">:</span>
     <span class="n">mel_spec</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">mel_spec</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">std</span><span class="p">)</span>
   <span class="k">return</span> <span class="n">mel_spec</span></div>
@@ -315,10 +343,13 @@ <h1>Source code for data.text2speech.speech_utils</h1><div class="highlight"><pr
     <span class="n">feature_normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
     <span class="n">mean</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
     <span class="n">std</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-    <span class="n">mel_basis</span><span class="o">=</span><span class="kc">None</span>
+    <span class="n">mel_basis</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+    <span class="n">htk</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="n">norm</span><span class="o">=</span><span class="kc">None</span>
 <span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">  Very hacky method to reconstruct mag spec from mel</span>
+<span class="sd">  Reconstructs magnitude spectrogram from a mel spectrogram by multiplying it</span>
+<span class="sd">  with the transposed mel basis.</span>
 
 <span class="sd">  Args:</span>
 <span class="sd">    log_mel_spec (np.array): log of the mel spec</span>
@@ -332,17 +363,24 @@ <h1>Source code for data.text2speech.speech_utils</h1><div class="highlight"><pr
 <span class="sd">    std (float): normalization param of mel spec</span>
 <span class="sd">    mel_basis (np.array): optional pre-computed mel basis to save computational</span>
 <span class="sd">      time if passed. If not passed, it will call librosa to construct one</span>
+<span class="sd">    htk (bool): whther to compute the mel spec with the htk or slaney algorithm</span>
+<span class="sd">    norm: Should be None for htk, and 1 for slaney</span>
 
 <span class="sd">  Returns:</span>
 <span class="sd">    np.array: mag_spec with shape [time, n_fft/2 + 1]</span>
 <span class="sd">  &quot;&quot;&quot;</span>
   <span class="k">if</span> <span class="n">mel_basis</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-    <span class="n">mel_basis</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">filters</span><span class="o">.</span><span class="n">mel</span><span class="p">(</span><span class="n">fs</span><span class="p">,</span> <span class="n">n_fft</span><span class="p">,</span> <span class="n">n_mels</span><span class="o">=</span><span class="n">n_mels</span><span class="p">)</span>
+    <span class="n">mel_basis</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">filters</span><span class="o">.</span><span class="n">mel</span><span class="p">(</span>
+        <span class="n">fs</span><span class="p">,</span>
+        <span class="n">n_fft</span><span class="p">,</span>
+        <span class="n">n_mels</span><span class="o">=</span><span class="n">n_mels</span><span class="p">,</span>
+        <span class="n">htk</span><span class="o">=</span><span class="n">htk</span><span class="p">,</span>
+        <span class="n">norm</span><span class="o">=</span><span class="n">norm</span>
+    <span class="p">)</span>
   <span class="k">if</span> <span class="n">feature_normalize</span><span class="p">:</span>
     <span class="n">log_mel_spec</span> <span class="o">=</span> <span class="n">denormalize</span><span class="p">(</span><span class="n">log_mel_spec</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">std</span><span class="p">)</span>
   <span class="n">mel_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">exp</span><span class="p">(</span><span class="n">log_mel_spec</span><span class="p">)</span>
   <span class="n">mag_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">mel_spec</span><span class="p">,</span> <span class="n">mel_basis</span><span class="p">)</span>
-  <span class="n">mag_spec</span> <span class="o">=</span> <span class="n">mag_spec</span> <span class="o">*</span> <span class="mi">876</span>
   <span class="n">mag_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">power</span><span class="p">(</span><span class="n">mag_spec</span><span class="p">,</span> <span class="mf">1.</span> <span class="o">/</span> <span class="n">power</span><span class="p">)</span>
   <span class="k">return</span> <span class="n">mag_spec</span></div>
 
diff --git a/docs/html/_modules/data/text2speech/text2speech.html b/docs/html/_modules/data/text2speech/text2speech.html
index 795e169d5..38cc3ce50 100644
--- a/docs/html/_modules/data/text2speech/text2speech.html
+++ b/docs/html/_modules/data/text2speech/text2speech.html
@@ -158,7 +158,6 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
 <span></span><span class="c1"># Copyright (c) 2018 NVIDIA Corporation</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
-<span class="kn">from</span> <span class="nn">six.moves</span> <span class="k">import</span> <span class="nb">range</span>
 
 <span class="kn">import</span> <span class="nn">os</span>
 <span class="kn">import</span> <span class="nn">six</span>
@@ -167,12 +166,13 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
 <span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 <span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
 
+<span class="kn">from</span> <span class="nn">six</span> <span class="k">import</span> <span class="n">string_types</span>
+
 <span class="kn">from</span> <span class="nn">open_seq2seq.data.data_layer</span> <span class="k">import</span> <span class="n">DataLayer</span>
 <span class="kn">from</span> <span class="nn">open_seq2seq.data.utils</span> <span class="k">import</span> <span class="n">load_pre_existing_vocabulary</span>
-<span class="kn">from</span> <span class="nn">.speech_utils</span> <span class="k">import</span> <span class="n">get_speech_features_from_file</span><span class="p">,</span> <span class="n">get_mel</span><span class="p">,</span>\
+<span class="kn">from</span> <span class="nn">.speech_utils</span> <span class="k">import</span> <span class="n">get_speech_features_from_file</span><span class="p">,</span>\
                           <span class="n">inverse_mel</span><span class="p">,</span> <span class="n">normalize</span><span class="p">,</span> <span class="n">denormalize</span>
 
-
 <div class="viewcode-block" id="Text2SpeechDataLayer"><a class="viewcode-back" href="../../../api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer">[docs]</a><span class="k">class</span> <span class="nc">Text2SpeechDataLayer</span><span class="p">(</span><span class="n">DataLayer</span><span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;Text-to-speech data layer class</span>
 <span class="sd">  &quot;&quot;&quot;</span>
@@ -181,11 +181,11 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
   <span class="k">def</span> <span class="nf">get_required_params</span><span class="p">():</span>
     <span class="k">return</span> <span class="nb">dict</span><span class="p">(</span>
         <span class="n">DataLayer</span><span class="o">.</span><span class="n">get_required_params</span><span class="p">(),</span> <span class="o">**</span><span class="p">{</span>
-            <span class="s1">&#39;num_audio_features&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-            <span class="s1">&#39;output_type&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;magnitude&#39;</span><span class="p">,</span> <span class="s1">&#39;mel&#39;</span><span class="p">,</span> <span class="s1">&#39;magnitude_disk&#39;</span><span class="p">,</span> <span class="s1">&#39;mel_disk&#39;</span><span class="p">],</span>
+            <span class="s1">&#39;dataset&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;LJ&#39;</span><span class="p">],</span>
+            <span class="s1">&#39;num_audio_features&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>
+            <span class="s1">&#39;output_type&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;magnitude&#39;</span><span class="p">,</span> <span class="s1">&#39;mel&#39;</span><span class="p">],</span>
             <span class="s1">&#39;vocab_file&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
             <span class="s1">&#39;dataset_files&#39;</span><span class="p">:</span> <span class="nb">list</span><span class="p">,</span>
-            <span class="s1">&#39;dataset_location&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
             <span class="s1">&#39;feature_normalize&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
         <span class="p">}</span>
     <span class="p">)</span></div>
@@ -194,11 +194,18 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
   <span class="k">def</span> <span class="nf">get_optional_params</span><span class="p">():</span>
     <span class="k">return</span> <span class="nb">dict</span><span class="p">(</span>
         <span class="n">DataLayer</span><span class="o">.</span><span class="n">get_optional_params</span><span class="p">(),</span> <span class="o">**</span><span class="p">{</span>
+            <span class="s1">&#39;dataset_location&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
             <span class="s1">&#39;pad_to&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s1">&#39;mag_power&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s1">&#39;pad_EOS&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+            <span class="s1">&#39;pad_value&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
             <span class="s1">&#39;feature_normalize_mean&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
-            <span class="s1">&#39;feature_normalize_std&#39;</span><span class="p">:</span> <span class="nb">float</span>
+            <span class="s1">&#39;feature_normalize_std&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
+            <span class="s1">&#39;trim&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+            <span class="s1">&#39;data_min&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
+            <span class="s1">&#39;duration_min&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+            <span class="s1">&#39;duration_max&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+            <span class="s1">&#39;mel_type&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;slaney&#39;</span><span class="p">,</span> <span class="s1">&#39;htk&#39;</span><span class="p">]</span>
         <span class="p">}</span>
     <span class="p">)</span></div>
 
@@ -209,6 +216,8 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
 
 <span class="sd">    Config parameters:</span>
 
+<span class="sd">    * **dataset** (str) --- The dataset to use. Currently &#39;LJ&#39; for the LJSpeech</span>
+<span class="sd">      1.1 dataset is supported.</span>
 <span class="sd">    * **num_audio_features** (int) --- number of audio features to extract.</span>
 <span class="sd">    * **output_type** (str) --- could be either &quot;magnitude&quot;, or &quot;mel&quot;.</span>
 <span class="sd">    * **vocab_file** (str) --- path to vocabulary file.</span>
@@ -223,16 +232,31 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
 <span class="sd">    * **feature_normalize_std** (bool) --- used for feature normalize.</span>
 <span class="sd">      Defaults to 1.</span>
 <span class="sd">    * **mag_power** (int) --- the power to which the magnitude spectrogram is</span>
-<span class="sd">      scaled to:</span>
+<span class="sd">      scaled to. Defaults to 1.</span>
 <span class="sd">      1 for energy spectrogram</span>
 <span class="sd">      2 for power spectrogram</span>
 <span class="sd">      Defaults to 2.</span>
 <span class="sd">    * **pad_EOS** (bool) --- whether to apply EOS tokens to both the text and</span>
 <span class="sd">      the speech signal. Will pad at least 1 token regardless of pad_to value.</span>
 <span class="sd">      Defaults to True.</span>
+<span class="sd">    * **pad_value** (float) --- The value we pad the spectrogram with. Defaults</span>
+<span class="sd">      to np.log(data_min).</span>
 <span class="sd">    * **pad_to** (int) --- we pad such that the resulting datapoint is a</span>
 <span class="sd">      multiple of pad_to.</span>
 <span class="sd">      Defaults to 8.</span>
+<span class="sd">    * **trim** (bool) --- Whether to trim silence via librosa or not. Defaults</span>
+<span class="sd">      to False.</span>
+<span class="sd">    * **data_min** (float) --- min clip value prior to taking the log. Defaults</span>
+<span class="sd">      to 1e-5. Please change to 1e-2 if using htk mels.</span>
+<span class="sd">    * **duration_min** (int) --- Minimum duration in steps for speech signal.</span>
+<span class="sd">      All signals less than this will be cut from the training set. Defaults to</span>
+<span class="sd">      0.</span>
+<span class="sd">    * **duration_max** (int) --- Maximum duration in steps for speech signal.</span>
+<span class="sd">      All signals greater than this will be cut from the training set. Defaults </span>
+<span class="sd">      to 4000.</span>
+<span class="sd">    * **mel_type** (str): One of [&#39;slaney&#39;, &#39;htk&#39;]. Decides which algorithm to</span>
+<span class="sd">      use to compute mel specs.</span>
+<span class="sd">      Defaults to htk.</span>
 
 <span class="sd">    &quot;&quot;&quot;</span>
     <span class="nb">super</span><span class="p">(</span><span class="n">Text2SpeechDataLayer</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
@@ -241,30 +265,54 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
         <span class="n">num_workers</span><span class="p">,</span>
         <span class="n">worker_id</span>
     <span class="p">)</span>
+
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;dataset_location&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+          <span class="s2">&quot;dataset_location must be specified when using the LJSpeech&quot;</span><span class="p">,</span>
+          <span class="s2">&quot;dataset&quot;</span>
+      <span class="p">)</span>
+    <span class="n">names</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;wav_filename&#39;</span><span class="p">,</span> <span class="s1">&#39;raw_transcript&#39;</span><span class="p">,</span> <span class="s1">&#39;transcript&#39;</span><span class="p">]</span>
+    <span class="n">sep</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\x7c</span><span class="s1">&#39;</span>
+    <span class="n">header</span> <span class="o">=</span> <span class="kc">None</span>
+
+    <span class="bp">self</span><span class="o">.</span><span class="n">_sampling_rate</span> <span class="o">=</span> <span class="mi">22050</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_n_fft</span> <span class="o">=</span> <span class="mi">1024</span>
+
     <span class="c1"># Character level vocab</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">load_pre_existing_vocabulary</span><span class="p">(</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;vocab_file&#39;</span><span class="p">],</span>
+        <span class="n">min_idx</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
         <span class="n">read_chars</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
     <span class="p">)</span>
+    <span class="c1"># Add the pad, start, and end chars</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s1">&#39;&lt;p&gt;&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s1">&#39;&lt;s&gt;&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">1</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s1">&#39;&lt;/s&gt;&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">2</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;idx2char&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span><span class="n">i</span><span class="p">:</span> <span class="n">w</span> <span class="k">for</span> <span class="n">w</span><span class="p">,</span> <span class="n">i</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
-    <span class="c1"># add one for implied blank token</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;src_vocab_size&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">])</span> <span class="o">+</span> <span class="mi">1</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;src_vocab_size&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">])</span>
 
-    <span class="n">names</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;wav_filename&#39;</span><span class="p">,</span> <span class="s1">&#39;transcript&#39;</span><span class="p">,</span> <span class="s1">&#39;transcript_normalized&#39;</span><span class="p">]</span>
-
-    <span class="k">if</span> <span class="s2">&quot;disk&quot;</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;output_type&quot;</span><span class="p">]:</span>
-      <span class="bp">self</span><span class="o">.</span><span class="n">_load_from_disk</span> <span class="o">=</span> <span class="kc">True</span>
-    <span class="k">else</span><span class="p">:</span>
-      <span class="bp">self</span><span class="o">.</span><span class="n">_load_from_disk</span> <span class="o">=</span> <span class="kc">False</span>
+    <span class="n">n_mels</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span>
 
-    <span class="c1"># This assumes that the LJSpeech dataset is used</span>
     <span class="k">if</span> <span class="s2">&quot;mel&quot;</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;output_type&quot;</span><span class="p">]:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_mel</span> <span class="o">=</span> <span class="kc">True</span>
+      <span class="n">htk</span> <span class="o">=</span> <span class="kc">True</span>
+      <span class="n">norm</span> <span class="o">=</span> <span class="kc">None</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;mel_type&#39;</span><span class="p">,</span> <span class="s1">&#39;htk&#39;</span><span class="p">)</span> <span class="o">==</span> <span class="s1">&#39;slaney&#39;</span><span class="p">:</span>
+        <span class="n">htk</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="n">norm</span> <span class="o">=</span> <span class="mi">1</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_mel_basis</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">filters</span><span class="o">.</span><span class="n">mel</span><span class="p">(</span>
-          <span class="n">sr</span><span class="o">=</span><span class="mi">22050</span><span class="p">,</span> <span class="n">n_fft</span><span class="o">=</span><span class="mi">1024</span><span class="p">,</span> <span class="n">n_mels</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span>
+          <span class="n">sr</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_sampling_rate</span><span class="p">,</span>
+          <span class="n">n_fft</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_n_fft</span><span class="p">,</span>
+          <span class="n">n_mels</span><span class="o">=</span><span class="n">n_mels</span><span class="p">,</span>
+          <span class="n">htk</span><span class="o">=</span><span class="n">htk</span><span class="p">,</span>
+          <span class="n">norm</span><span class="o">=</span><span class="n">norm</span>
       <span class="p">)</span>
     <span class="k">else</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_mel</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">_mel_basis</span> <span class="o">=</span> <span class="kc">None</span>
+
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;interactive&quot;</span><span class="p">]:</span>
+      <span class="k">return</span>
 
     <span class="c1"># Load csv files</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_files</span> <span class="o">=</span> <span class="kc">None</span>
@@ -272,8 +320,8 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
       <span class="n">files</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span>
           <span class="n">csvs</span><span class="p">,</span>
           <span class="n">encoding</span><span class="o">=</span><span class="s1">&#39;utf-8&#39;</span><span class="p">,</span>
-          <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\x7c</span><span class="s1">&#39;</span><span class="p">,</span>
-          <span class="n">header</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+          <span class="n">sep</span><span class="o">=</span><span class="n">sep</span><span class="p">,</span>
+          <span class="n">header</span><span class="o">=</span><span class="n">header</span><span class="p">,</span>
           <span class="n">names</span><span class="o">=</span><span class="n">names</span><span class="p">,</span>
           <span class="n">quoting</span><span class="o">=</span><span class="mi">3</span>
       <span class="p">)</span>
@@ -283,9 +331,9 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
         <span class="bp">self</span><span class="o">.</span><span class="n">_files</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_files</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">files</span><span class="p">)</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;mode&#39;</span><span class="p">]</span> <span class="o">!=</span> <span class="s1">&#39;infer&#39;</span><span class="p">:</span>
-      <span class="n">cols</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;wav_filename&#39;</span><span class="p">,</span> <span class="s1">&#39;transcript_normalized&#39;</span><span class="p">]</span>
+      <span class="n">cols</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;wav_filename&#39;</span><span class="p">,</span> <span class="s1">&#39;transcript&#39;</span><span class="p">]</span>
     <span class="k">else</span><span class="p">:</span>
-      <span class="n">cols</span> <span class="o">=</span> <span class="s1">&#39;transcript_normalized&#39;</span>
+      <span class="n">cols</span> <span class="o">=</span> <span class="s1">&#39;transcript&#39;</span>
 
     <span class="n">all_files</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_files</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">cols</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_files</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">split_data</span><span class="p">(</span><span class="n">all_files</span><span class="p">)</span>
@@ -297,6 +345,11 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
 
 <div class="viewcode-block" id="Text2SpeechDataLayer.split_data"><a class="viewcode-back" href="../../../api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.split_data">[docs]</a>  <span class="k">def</span> <span class="nf">split_data</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">):</span>
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;mode&#39;</span><span class="p">]</span> <span class="o">!=</span> <span class="s1">&#39;train&#39;</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_workers</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+      <span class="c1">#Decrease num_eval for dev, since most data is thrown out anyways</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;mode&#39;</span><span class="p">]</span> <span class="o">==</span> <span class="s1">&#39;eval&#39;</span><span class="p">:</span>
+        <span class="n">start</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_worker_id</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]</span>
+        <span class="n">end</span> <span class="o">=</span> <span class="n">start</span><span class="o">+</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]</span>
+        <span class="k">return</span> <span class="n">data</span><span class="p">[</span><span class="n">start</span><span class="p">:</span><span class="n">end</span><span class="p">]</span>
       <span class="n">size</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">data</span><span class="p">)</span>
       <span class="n">start</span> <span class="o">=</span> <span class="n">size</span> <span class="o">//</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_workers</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">_worker_id</span>
       <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_worker_id</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_workers</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
@@ -304,8 +357,7 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
       <span class="k">else</span><span class="p">:</span>
         <span class="n">end</span> <span class="o">=</span> <span class="n">size</span> <span class="o">//</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_workers</span> <span class="o">*</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_worker_id</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
       <span class="k">return</span> <span class="n">data</span><span class="p">[</span><span class="n">start</span><span class="p">:</span><span class="n">end</span><span class="p">]</span>
-    <span class="k">else</span><span class="p">:</span>
-      <span class="k">return</span> <span class="n">data</span></div>
+    <span class="k">return</span> <span class="n">data</span></div>
 
   <span class="nd">@property</span>
   <span class="k">def</span> <span class="nf">iterator</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
@@ -318,6 +370,8 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
       <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_size</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span><span class="o">.</span><span class="n">repeat</span><span class="p">()</span>
 
+    <span class="n">num_audio_features</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span>
+
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;mode&#39;</span><span class="p">]</span> <span class="o">!=</span> <span class="s1">&#39;infer&#39;</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
           <span class="k">lambda</span> <span class="n">line</span><span class="p">:</span> <span class="n">tf</span><span class="o">.</span><span class="n">py_func</span><span class="p">(</span>
@@ -329,13 +383,32 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
           <span class="p">),</span>
           <span class="n">num_parallel_calls</span><span class="o">=</span><span class="mi">8</span><span class="p">,</span>
       <span class="p">)</span>
+      <span class="k">if</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;duration_max&quot;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span> <span class="ow">or</span>
+          <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;duration_max&quot;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span><span class="o">.</span><span class="n">filter</span><span class="p">(</span>
+            <span class="k">lambda</span> <span class="n">txt</span><span class="p">,</span> <span class="n">txt_len</span><span class="p">,</span> <span class="n">spec</span><span class="p">,</span> <span class="n">stop</span><span class="p">,</span> <span class="n">spec_len</span><span class="p">:</span>
+                <span class="n">tf</span><span class="o">.</span><span class="n">logical_and</span><span class="p">(</span>
+                    <span class="n">tf</span><span class="o">.</span><span class="n">less_equal</span><span class="p">(</span>
+                        <span class="n">spec_len</span><span class="p">,</span>
+                        <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;duration_max&quot;</span><span class="p">,</span> <span class="mi">4000</span><span class="p">)</span>
+                    <span class="p">),</span>
+                    <span class="n">tf</span><span class="o">.</span><span class="n">greater_equal</span><span class="p">(</span>
+                        <span class="n">spec_len</span><span class="p">,</span>
+                        <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;duration_min&quot;</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+                    <span class="p">)</span>
+                <span class="p">)</span>
+        <span class="p">)</span>
+      <span class="n">default_pad_value</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;data_min&quot;</span><span class="p">,</span> <span class="mf">1e-5</span><span class="p">))</span>
+      <span class="n">pad_value</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;pad_value&quot;</span><span class="p">,</span> <span class="n">default_pad_value</span><span class="p">)</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;feature_normalize&quot;</span><span class="p">]:</span>
+        <span class="n">pad_value</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_normalize</span><span class="p">(</span><span class="n">pad_value</span><span class="p">)</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dataset</span><span class="o">.</span><span class="n">padded_batch</span><span class="p">(</span>
           <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">],</span>
           <span class="n">padded_shapes</span><span class="o">=</span><span class="p">(</span>
-              <span class="p">[</span><span class="kc">None</span><span class="p">],</span> <span class="mi">1</span><span class="p">,</span> <span class="p">[</span><span class="kc">None</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]],</span> <span class="p">[</span><span class="kc">None</span><span class="p">],</span> <span class="mi">1</span>
+              <span class="p">[</span><span class="kc">None</span><span class="p">],</span> <span class="mi">1</span><span class="p">,</span> <span class="p">[</span><span class="kc">None</span><span class="p">,</span> <span class="n">num_audio_features</span><span class="p">],</span> <span class="p">[</span><span class="kc">None</span><span class="p">],</span> <span class="mi">1</span>
           <span class="p">),</span>
           <span class="n">padding_values</span><span class="o">=</span><span class="p">(</span>
-              <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="n">tf</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span><span class="mf">0.</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dtype&#39;</span><span class="p">]),</span>
+              <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="n">tf</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span><span class="n">pad_value</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dtype&#39;</span><span class="p">]),</span>
               <span class="n">tf</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span><span class="mf">1.</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dtype&#39;</span><span class="p">]),</span> <span class="mi">0</span>
           <span class="p">)</span>
       <span class="p">)</span>
@@ -362,7 +435,7 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
       <span class="c1"># need to explicitly set batch size dimension</span>
       <span class="c1"># (it is employed in the model)</span>
       <span class="n">spec</span><span class="o">.</span><span class="n">set_shape</span><span class="p">(</span>
-          <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">],</span> <span class="kc">None</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]]</span>
+          <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">],</span> <span class="kc">None</span><span class="p">,</span> <span class="n">num_audio_features</span><span class="p">]</span>
       <span class="p">)</span>
       <span class="n">stop_token_target</span><span class="o">.</span><span class="n">set_shape</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">],</span> <span class="kc">None</span><span class="p">])</span>
       <span class="n">spec_length</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">spec_length</span><span class="p">,</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]])</span>
@@ -387,73 +460,76 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
 <span class="sd">    Returns:</span>
 <span class="sd">      tuple: text_input text as `np.array` of ids, text_input length,</span>
 <span class="sd">      target audio features as `np.array`, stop token targets as `np.array`,</span>
-<span class="sd">      length of target sequence,</span>
-<span class="sd">      .</span>
+<span class="sd">      length of target sequence.</span>
+
 <span class="sd">    &quot;&quot;&quot;</span>
     <span class="n">audio_filename</span><span class="p">,</span> <span class="n">transcript</span> <span class="o">=</span> <span class="n">element</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="n">six</span><span class="o">.</span><span class="n">PY2</span><span class="p">:</span>
-      <span class="n">transcript</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">transcript</span><span class="p">,</span> <span class="s1">&#39;utf-8&#39;</span><span class="p">)</span>
     <span class="n">transcript</span> <span class="o">=</span> <span class="n">transcript</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span>
+    <span class="k">if</span> <span class="n">six</span><span class="o">.</span><span class="n">PY2</span><span class="p">:</span>
+      <span class="n">audio_filename</span> <span class="o">=</span> <span class="n">unicode</span><span class="p">(</span><span class="n">audio_filename</span><span class="p">,</span> <span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
+      <span class="n">transcript</span> <span class="o">=</span> <span class="n">unicode</span><span class="p">(</span><span class="n">transcript</span><span class="p">,</span> <span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">audio_filename</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">audio_filename</span><span class="p">,</span> <span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
+      <span class="n">transcript</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">transcript</span><span class="p">,</span> <span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
     <span class="n">text_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span>
-        <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="n">c</span><span class="p">]</span> <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="n">unicode</span><span class="p">(</span><span class="n">transcript</span><span class="p">,</span> <span class="s2">&quot;utf-8&quot;</span><span class="p">)]</span>
+        <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="n">c</span><span class="p">]</span> <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="n">transcript</span><span class="p">]</span>
     <span class="p">)</span>
     <span class="n">pad_to</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;pad_to&#39;</span><span class="p">,</span> <span class="mi">8</span><span class="p">)</span>
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;pad_EOS&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">):</span>
-      <span class="c1"># num_pad = pad_to - (len(text_input) % pad_to)</span>
-      <span class="n">num_pad</span> <span class="o">=</span> <span class="n">pad_to</span> <span class="o">-</span> <span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">text_input</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span> <span class="o">%</span> <span class="n">pad_to</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span>
+      <span class="n">num_pad</span> <span class="o">=</span> <span class="n">pad_to</span> <span class="o">-</span> <span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">text_input</span><span class="p">)</span> <span class="o">+</span> <span class="mi">2</span><span class="p">)</span> <span class="o">%</span> <span class="n">pad_to</span><span class="p">)</span>
       <span class="n">text_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
-          <span class="n">text_input</span><span class="p">,</span> <span class="p">((</span><span class="mi">0</span><span class="p">,</span> <span class="n">num_pad</span><span class="p">)),</span>
+          <span class="n">text_input</span><span class="p">,</span> <span class="p">((</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span>
           <span class="s2">&quot;constant&quot;</span><span class="p">,</span>
-          <span class="n">constant_values</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s2">&quot;~&quot;</span><span class="p">]</span>
-      <span class="p">)</span>
-    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_load_from_disk</span><span class="p">:</span>
-      <span class="n">file_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-          <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dataset_location&#39;</span><span class="p">],</span> <span class="n">audio_filename</span> <span class="o">+</span> <span class="s2">&quot;.npy&quot;</span>
-      <span class="p">)</span>
-      <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">file_path</span><span class="p">)</span>
-      <span class="n">mag_power</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;mag_power&#39;</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
-      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mel</span><span class="p">:</span>
-        <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">get_mel</span><span class="p">(</span>
-            <span class="n">spectrogram</span><span class="p">,</span>
-            <span class="n">power</span><span class="o">=</span><span class="n">mag_power</span><span class="p">,</span>
-            <span class="n">feature_normalize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;feature_normalize&quot;</span><span class="p">],</span>
-            <span class="n">mean</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_mean&quot;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">),</span>
-            <span class="n">std</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_std&quot;</span><span class="p">,</span> <span class="mf">1.</span><span class="p">),</span>
-            <span class="n">mel_basis</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_mel_basis</span><span class="p">,</span>
-            <span class="n">n_mels</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span>
-        <span class="p">)</span>
-      <span class="k">else</span><span class="p">:</span>
-        <span class="k">if</span> <span class="n">mag_power</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
-          <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">spectrogram</span> <span class="o">*</span> <span class="n">mag_power</span>
-          <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">spectrogram</span><span class="p">,</span> <span class="n">a_min</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mf">1e-5</span><span class="p">),</span> <span class="n">a_max</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-        <span class="c1"># Else it is a magnitude spec, and we need to normalize</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;feature_normalize&quot;</span><span class="p">]:</span>
-          <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span>
-              <span class="n">spectrogram</span><span class="p">,</span>
-              <span class="n">mean</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_mean&quot;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">),</span>
-              <span class="n">std</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_std&quot;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">)</span>
+          <span class="n">constant_values</span><span class="o">=</span><span class="p">(</span>
+              <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s2">&quot;&lt;s&gt;&quot;</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s2">&quot;&lt;/s&gt;&quot;</span><span class="p">])</span>
           <span class="p">)</span>
-    <span class="k">else</span><span class="p">:</span>
-      <span class="n">file_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-          <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dataset_location&#39;</span><span class="p">],</span> <span class="n">audio_filename</span> <span class="o">+</span> <span class="s2">&quot;.wav&quot;</span>
       <span class="p">)</span>
-      <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">get_speech_features_from_file</span><span class="p">(</span>
-          <span class="n">file_path</span><span class="p">,</span>
-          <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">],</span>
-          <span class="n">features_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;output_type&#39;</span><span class="p">],</span>
-          <span class="n">mag_power</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;mag_power&#39;</span><span class="p">,</span> <span class="mi">2</span><span class="p">),</span>
-          <span class="n">feature_normalize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;feature_normalize&quot;</span><span class="p">],</span>
-          <span class="n">mean</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_mean&quot;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">),</span>
-          <span class="n">std</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_std&quot;</span><span class="p">,</span> <span class="mf">1.</span><span class="p">)</span>
+      <span class="n">text_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+          <span class="n">text_input</span><span class="p">,</span> <span class="p">((</span><span class="mi">0</span><span class="p">,</span> <span class="n">num_pad</span><span class="p">)),</span>
+          <span class="s2">&quot;constant&quot;</span><span class="p">,</span>
+          <span class="n">constant_values</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s2">&quot;&lt;p&gt;&quot;</span><span class="p">]</span>
       <span class="p">)</span>
+
+
+    <span class="n">file_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dataset_location&#39;</span><span class="p">],</span> <span class="n">audio_filename</span> <span class="o">+</span> <span class="s2">&quot;.wav&quot;</span>
+    <span class="p">)</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mel</span><span class="p">:</span>
+      <span class="n">features_type</span> <span class="o">=</span> <span class="s2">&quot;mel_htk&quot;</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;mel_type&#39;</span><span class="p">,</span> <span class="s1">&#39;htk&#39;</span><span class="p">)</span> <span class="o">==</span> <span class="s1">&#39;slaney&#39;</span><span class="p">:</span>
+        <span class="n">features_type</span> <span class="o">=</span> <span class="s2">&quot;mel_slaney&quot;</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">features_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;output_type&#39;</span><span class="p">]</span>
+
+    <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">get_speech_features_from_file</span><span class="p">(</span>
+        <span class="n">file_path</span><span class="p">,</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">],</span>
+        <span class="n">features_type</span><span class="o">=</span><span class="n">features_type</span><span class="p">,</span>
+        <span class="n">n_fft</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_n_fft</span><span class="p">,</span>
+        <span class="n">mag_power</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;mag_power&#39;</span><span class="p">,</span> <span class="mi">2</span><span class="p">),</span>
+        <span class="n">feature_normalize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;feature_normalize&quot;</span><span class="p">],</span>
+        <span class="n">mean</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_mean&quot;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">),</span>
+        <span class="n">std</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_std&quot;</span><span class="p">,</span> <span class="mf">1.</span><span class="p">),</span>
+        <span class="n">trim</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;trim&quot;</span><span class="p">,</span> <span class="kc">False</span><span class="p">),</span>
+        <span class="n">data_min</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;data_min&quot;</span><span class="p">,</span> <span class="mf">1e-5</span><span class="p">)</span>
+    <span class="p">)</span>
     <span class="n">stop_token_target</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span>
         <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">spectrogram</span><span class="p">)],</span> <span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dtype&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">as_numpy_dtype</span><span class="p">()</span>
     <span class="p">)</span>
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;pad_EOS&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">):</span>
-      <span class="c1"># num_pad = pad_to - (len(spectrogram) % pad_to)</span>
       <span class="n">num_pad</span> <span class="o">=</span> <span class="n">pad_to</span> <span class="o">-</span> <span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">spectrogram</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span> <span class="o">%</span> <span class="n">pad_to</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span>
+
+      <span class="n">data_min</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;data_min&quot;</span><span class="p">,</span> <span class="mf">1e-5</span><span class="p">)</span>
+
+      <span class="n">pad_value</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;pad_value&quot;</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="n">data_min</span><span class="p">))</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;feature_normalize&quot;</span><span class="p">]:</span>
+        <span class="n">pad_value</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_normalize</span><span class="p">(</span><span class="n">pad_value</span><span class="p">)</span>
+
       <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
-          <span class="n">spectrogram</span><span class="p">,</span> <span class="p">((</span><span class="mi">0</span><span class="p">,</span> <span class="n">num_pad</span><span class="p">),</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)),</span> <span class="s2">&quot;constant&quot;</span><span class="p">,</span> <span class="n">constant_values</span><span class="o">=</span><span class="mi">0</span>
+          <span class="n">spectrogram</span><span class="p">,</span>
+          <span class="p">((</span><span class="mi">0</span><span class="p">,</span> <span class="n">num_pad</span><span class="p">),</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)),</span>
+          <span class="s2">&quot;constant&quot;</span><span class="p">,</span>
+          <span class="n">constant_values</span><span class="o">=</span><span class="n">pad_value</span>
       <span class="p">)</span>
       <span class="n">stop_token_target</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
           <span class="n">stop_token_target</span><span class="p">,</span> <span class="p">((</span><span class="mi">0</span><span class="p">,</span> <span class="n">num_pad</span><span class="p">)),</span> <span class="s2">&quot;constant&quot;</span><span class="p">,</span> <span class="n">constant_values</span><span class="o">=</span><span class="mi">1</span>
@@ -478,36 +554,95 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
 <span class="sd">    Returns:</span>
 <span class="sd">      tuple: target text as `np.array` of ids, target text length.</span>
 <span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="n">six</span><span class="o">.</span><span class="n">PY2</span><span class="p">:</span>
-      <span class="n">transcript</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">transcript</span><span class="p">,</span> <span class="s1">&#39;utf-8&#39;</span><span class="p">)</span>
+
     <span class="n">transcript</span> <span class="o">=</span> <span class="n">transcript</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span>
+    <span class="k">if</span> <span class="n">six</span><span class="o">.</span><span class="n">PY2</span><span class="p">:</span>
+      <span class="n">transcript</span> <span class="o">=</span> <span class="n">unicode</span><span class="p">(</span><span class="n">transcript</span><span class="p">,</span> <span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">transcript</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">transcript</span><span class="p">,</span> <span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
     <span class="n">text_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span>
-        <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="n">c</span><span class="p">]</span> <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="n">unicode</span><span class="p">(</span><span class="n">transcript</span><span class="p">,</span> <span class="s2">&quot;utf-8&quot;</span><span class="p">)]</span>
+        <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="n">c</span><span class="p">]</span> <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="n">transcript</span><span class="p">]</span>
     <span class="p">)</span>
     <span class="n">pad_to</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;pad_to&#39;</span><span class="p">,</span> <span class="mi">8</span><span class="p">)</span>
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;pad_EOS&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">):</span>
-      <span class="c1"># num_pad = pad_to - (len(text_input) % pad_to)</span>
-      <span class="n">num_pad</span> <span class="o">=</span> <span class="n">pad_to</span> <span class="o">-</span> <span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">text_input</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span> <span class="o">%</span> <span class="n">pad_to</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span>
+      <span class="n">num_pad</span> <span class="o">=</span> <span class="n">pad_to</span> <span class="o">-</span> <span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">text_input</span><span class="p">)</span> <span class="o">+</span> <span class="mi">2</span><span class="p">)</span> <span class="o">%</span> <span class="n">pad_to</span><span class="p">)</span>
+      <span class="n">text_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+          <span class="n">text_input</span><span class="p">,</span> <span class="p">((</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span>
+          <span class="s2">&quot;constant&quot;</span><span class="p">,</span>
+          <span class="n">constant_values</span><span class="o">=</span><span class="p">(</span>
+              <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s2">&quot;&lt;s&gt;&quot;</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s2">&quot;&lt;/s&gt;&quot;</span><span class="p">])</span>
+          <span class="p">)</span>
+      <span class="p">)</span>
       <span class="n">text_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
           <span class="n">text_input</span><span class="p">,</span> <span class="p">((</span><span class="mi">0</span><span class="p">,</span> <span class="n">num_pad</span><span class="p">)),</span>
           <span class="s2">&quot;constant&quot;</span><span class="p">,</span>
-          <span class="n">constant_values</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s2">&quot;~&quot;</span><span class="p">]</span>
+          <span class="n">constant_values</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;char2idx&#39;</span><span class="p">][</span><span class="s2">&quot;&lt;p&gt;&quot;</span><span class="p">]</span>
       <span class="p">)</span>
 
     <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">(</span><span class="n">text_input</span><span class="p">),</span> \
            <span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">text_input</span><span class="p">)])</span></div>
 
+<div class="viewcode-block" id="Text2SpeechDataLayer.parse_text_output"><a class="viewcode-back" href="../../../api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.parse_text_output">[docs]</a>  <span class="k">def</span> <span class="nf">parse_text_output</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">text</span><span class="p">):</span>
+    <span class="n">text</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;idx2char&#39;</span><span class="p">][</span><span class="n">k</span><span class="p">]</span> <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">text</span><span class="p">])</span>
+    <span class="k">return</span> <span class="n">text</span></div>
+
+<div class="viewcode-block" id="Text2SpeechDataLayer.create_interactive_placeholders"><a class="viewcode-back" href="../../../api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.create_interactive_placeholders">[docs]</a>  <span class="k">def</span> <span class="nf">create_interactive_placeholders</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_text</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span>
+        <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">,</span>
+        <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;batch_size&quot;</span><span class="p">],</span> <span class="kc">None</span><span class="p">]</span>
+    <span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_text_length</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span>
+        <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">,</span>
+        <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;batch_size&quot;</span><span class="p">]]</span>
+    <span class="p">)</span>
+
+    <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span> <span class="o">=</span> <span class="p">{}</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span><span class="p">[</span><span class="s2">&quot;source_tensors&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_text</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_text_length</span><span class="p">]</span></div>
+
+<div class="viewcode-block" id="Text2SpeechDataLayer.create_feed_dict"><a class="viewcode-back" href="../../../api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.create_feed_dict">[docs]</a>  <span class="k">def</span> <span class="nf">create_feed_dict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">model_in</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot; Creates the feed dict for interactive infer</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">      model_in (str): The string to be spoken.</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">      feed_dict (dict): Dictionary with values for the placeholders.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">model_in</span><span class="p">,</span> <span class="n">string_types</span><span class="p">):</span>
+      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+          <span class="s2">&quot;Text2Speech&#39;s interactive inference mode only supports string.&quot;</span><span class="p">,</span>
+          <span class="s2">&quot;Got </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span> <span class="nb">format</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">model_in</span><span class="p">))</span>
+      <span class="p">)</span>
+    <span class="n">text</span><span class="p">,</span> <span class="n">text_length</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parse_transcript_element</span><span class="p">(</span><span class="n">model_in</span><span class="p">)</span>
+
+    <span class="n">text</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">text</span><span class="p">,</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;batch_size&quot;</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">])</span>
+    <span class="n">text_length</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">text_length</span><span class="p">,</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;batch_size&quot;</span><span class="p">]])</span>
+
+    <span class="n">feed_dict</span> <span class="o">=</span> <span class="p">{</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_text</span><span class="p">:</span> <span class="n">text</span><span class="p">,</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_text_length</span><span class="p">:</span> <span class="n">text_length</span><span class="p">,</span>
+    <span class="p">}</span>
+    <span class="k">return</span> <span class="n">feed_dict</span></div>
+
   <span class="nd">@property</span>
   <span class="k">def</span> <span class="nf">input_tensors</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
     <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span>
 
+  <span class="nd">@property</span>
+  <span class="k">def</span> <span class="nf">sampling_rate</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sampling_rate</span>
+
+  <span class="nd">@property</span>
+  <span class="k">def</span> <span class="nf">n_fft</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n_fft</span>
+
 <div class="viewcode-block" id="Text2SpeechDataLayer.get_size_in_samples"><a class="viewcode-back" href="../../../api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.get_size_in_samples">[docs]</a>  <span class="k">def</span> <span class="nf">get_size_in_samples</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Returns the number of audio files.&quot;&quot;&quot;</span>
     <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_files</span><span class="p">)</span></div>
 
 <div class="viewcode-block" id="Text2SpeechDataLayer.get_magnitude_spec"><a class="viewcode-back" href="../../../api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.get_magnitude_spec">[docs]</a>  <span class="k">def</span> <span class="nf">get_magnitude_spec</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">spectrogram</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Returns an energy magnitude spectrogram. The processing depends on the</span>
-<span class="sd">    data leyer params.</span>
+<span class="sd">    data layer params.</span>
 
 <span class="sd">    Args:</span>
 <span class="sd">      spectrogram: output spec from model</span>
@@ -517,22 +652,48 @@ <h1>Source code for data.text2speech.text2speech</h1><div class="highlight"><pre
 <span class="sd">    &quot;&quot;&quot;</span>
     <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">spectrogram</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span>
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mel</span><span class="p">:</span>
+      <span class="n">htk</span> <span class="o">=</span> <span class="kc">True</span>
+      <span class="n">norm</span> <span class="o">=</span> <span class="kc">None</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;mel_type&#39;</span><span class="p">,</span> <span class="s1">&#39;htk&#39;</span><span class="p">)</span> <span class="o">==</span> <span class="s1">&#39;slaney&#39;</span><span class="p">:</span>
+        <span class="n">htk</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="n">norm</span> <span class="o">=</span> <span class="mi">1</span>
       <span class="k">return</span> <span class="n">inverse_mel</span><span class="p">(</span>
           <span class="n">spectrogram</span><span class="p">,</span>
+          <span class="n">fs</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_sampling_rate</span><span class="p">,</span>
+          <span class="n">n_fft</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_n_fft</span><span class="p">,</span>
           <span class="n">n_mels</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">],</span>
           <span class="n">power</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;mag_power&#39;</span><span class="p">,</span> <span class="mi">2</span><span class="p">),</span>
           <span class="n">feature_normalize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;feature_normalize&quot;</span><span class="p">],</span>
           <span class="n">mean</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_mean&quot;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">),</span>
           <span class="n">std</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_std&quot;</span><span class="p">,</span> <span class="mf">1.</span><span class="p">),</span>
-          <span class="n">mel_basis</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_mel_basis</span>
+          <span class="n">mel_basis</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_mel_basis</span><span class="p">,</span>
+          <span class="n">htk</span><span class="o">=</span><span class="n">htk</span><span class="p">,</span>
+          <span class="n">norm</span><span class="o">=</span><span class="n">norm</span>
       <span class="p">)</span>
+    <span class="c1"># Else it is a mag spec</span>
     <span class="k">else</span><span class="p">:</span>
       <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;feature_normalize&quot;</span><span class="p">]:</span>
         <span class="n">spectrogram</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_denormalize</span><span class="p">(</span><span class="n">spectrogram</span><span class="p">)</span>
+      <span class="c1"># Ensure that num_features is consistent with n_fft</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n_fft</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">+</span> <span class="mi">1</span><span class="p">:</span>
+        <span class="n">num_pad</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_n_fft</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span> <span class="o">-</span> <span class="n">spectrogram</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+        <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+            <span class="n">spectrogram</span><span class="p">,</span>
+            <span class="p">((</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">num_pad</span><span class="p">)),</span>
+            <span class="s2">&quot;constant&quot;</span><span class="p">,</span>
+            <span class="n">constant_values</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;data_min&quot;</span><span class="p">,</span> <span class="mf">1e-5</span><span class="p">))</span>
+        <span class="p">)</span>
       <span class="n">spectrogram</span> <span class="o">=</span> <span class="n">spectrogram</span> <span class="o">*</span> <span class="mf">1.0</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;mag_power&#39;</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
       <span class="n">mag_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">exp</span><span class="p">(</span><span class="n">spectrogram</span><span class="p">)</span>
       <span class="k">return</span> <span class="n">mag_spec</span></div>
 
+  <span class="k">def</span> <span class="nf">_normalize</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">spectrogram</span><span class="p">):</span>
+    <span class="k">return</span> <span class="n">normalize</span><span class="p">(</span>
+        <span class="n">spectrogram</span><span class="p">,</span>
+        <span class="n">mean</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_mean&quot;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">),</span>
+        <span class="n">std</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;feature_normalize_std&quot;</span><span class="p">,</span> <span class="mf">1.</span><span class="p">)</span>
+    <span class="p">)</span>
+
   <span class="k">def</span> <span class="nf">_denormalize</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">spectrogram</span><span class="p">):</span>
     <span class="k">return</span> <span class="n">denormalize</span><span class="p">(</span>
         <span class="n">spectrogram</span><span class="p">,</span>
diff --git a/docs/html/_modules/data/text2text/text2text.html b/docs/html/_modules/data/text2text/text2text.html
index 864c5cf06..c951079e4 100644
--- a/docs/html/_modules/data/text2text/text2text.html
+++ b/docs/html/_modules/data/text2text/text2text.html
@@ -214,6 +214,8 @@ <h1>Source code for data.text2text.text2text</h1><div class="highlight"><pre>
       <span class="s1">&#39;pad_lengths_to_eight&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
       <span class="s1">&#39;pad_vocab_to_eight&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
       <span class="s1">&#39;shuffle_buffer_size&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+      <span class="s1">&#39;special_tokens_already_in_vocab&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+      <span class="s1">&#39;use_start_token&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
     <span class="p">})</span></div>
 
   <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">params</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">num_workers</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">worker_id</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
@@ -240,6 +242,7 @@ <h1>Source code for data.text2text.text2text</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">_shuffle_buffer_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;shuffle_buffer_size&#39;</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_num_workers</span> <span class="o">=</span> <span class="n">num_workers</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_worker_id</span> <span class="o">=</span> <span class="n">worker_id</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_use_start_token</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;use_start_token&#39;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pad_lengths_to_eight</span> <span class="ow">and</span> <span class="ow">not</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;max_length&#39;</span><span class="p">]</span> <span class="o">%</span> <span class="mi">8</span> <span class="o">==</span> <span class="mi">0</span><span class="p">):</span>
       <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;If padding to 8 in data layer, then &quot;</span>
                        <span class="s2">&quot;max_length should be multiple of 8&quot;</span><span class="p">)</span>
@@ -251,44 +254,46 @@ <h1>Source code for data.text2text.text2text</h1><div class="highlight"><pre>
       <span class="k">return</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span>
 
     <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">=</span> <span class="n">file_len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">source_file</span><span class="p">)</span>
+    <span class="n">special_tokens_already_in_vocab</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;special_tokens_already_in_vocab&#39;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
 
     <span class="c1"># load source and target vocabularies to RAM</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span> <span class="o">=</span> <span class="n">load_pre_existing_vocabulary</span><span class="p">(</span>
-      <span class="bp">self</span><span class="o">.</span><span class="n">src_vocab_file</span><span class="p">,</span>
-      <span class="n">min_idx</span><span class="o">=</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">src_vocab_file</span><span class="p">,</span> <span class="n">min_idx</span><span class="o">=</span><span class="mi">0</span> <span class="k">if</span> <span class="n">special_tokens_already_in_vocab</span>
+      <span class="k">else</span> <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span> <span class="o">=</span> <span class="n">load_pre_existing_vocabulary</span><span class="p">(</span>
-      <span class="bp">self</span><span class="o">.</span><span class="n">tgt_vocab_file</span><span class="p">,</span>
-      <span class="n">min_idx</span><span class="o">=</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
-
-    <span class="c1"># unknown symbol</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">[</span>
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="p">[</span>
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span>
-
-    <span class="c1"># sentence start</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">[</span>
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="p">[</span>
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span>
-    <span class="c1"># sentence end</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">[</span>
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="p">[</span>
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span>
-    <span class="c1"># padding</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">[</span>
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="p">[</span>
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
-      <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">tgt_vocab_file</span><span class="p">,</span> <span class="n">min_idx</span><span class="o">=</span><span class="mi">0</span> <span class="k">if</span> <span class="n">special_tokens_already_in_vocab</span>
+      <span class="k">else</span> <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+
+    <span class="k">if</span> <span class="ow">not</span> <span class="n">special_tokens_already_in_vocab</span><span class="p">:</span>
+      <span class="c1"># manually add special tokens</span>
+      <span class="c1"># unknown symbol</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">[</span>
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="p">[</span>
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span>
+      <span class="c1"># sentence start</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">[</span>
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="p">[</span>
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span>
+      <span class="c1"># sentence end</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">[</span>
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="p">[</span>
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span>
+      <span class="c1"># padding</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">[</span>
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="p">[</span>
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">to_string</span><span class="p">(</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)]</span> <span class="o">=</span> \
+        <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;pad_vocab_to_eight&#39;</span><span class="p">,</span> <span class="kc">False</span><span class="p">):</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span> <span class="o">=</span> <span class="n">pad_vocab_to_eight</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="p">)</span>
@@ -306,34 +311,44 @@ <h1>Source code for data.text2text.text2text</h1><div class="highlight"><pre>
 
     <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span> <span class="o">=</span> <span class="p">{}</span>
 
-<div class="viewcode-block" id="ParallelTextDataLayer.build_graph"><a class="viewcode-back" href="../../../api-docs/data.text2text.html#data.text2text.text2text.ParallelTextDataLayer.build_graph">[docs]</a>  <span class="k">def</span> <span class="nf">build_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-    <span class="k">def</span> <span class="nf">pad2eight</span><span class="p">(</span><span class="n">lst</span><span class="p">,</span> <span class="n">do_pad_eight</span><span class="p">):</span>
-      <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">lst</span><span class="p">)</span> <span class="o">%</span> <span class="mi">8</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span> <span class="ow">not</span> <span class="n">do_pad_eight</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">lst</span>
-      <span class="k">else</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">lst</span> <span class="o">+</span> <span class="p">[</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span><span class="p">]</span> <span class="o">*</span> <span class="p">(</span><span class="mi">8</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">lst</span><span class="p">)</span> <span class="o">%</span> <span class="mi">8</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">src_token_to_id</span><span class="p">(</span><span class="n">line</span><span class="p">):</span>
-      <span class="n">tokens</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_delimiter</span><span class="p">)</span>
-      <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">pad2eight</span><span class="p">([</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">]</span> <span class="o">+</span> \
+  <span class="k">def</span> <span class="nf">_pad2eight</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">lst</span><span class="p">,</span> <span class="n">do_pad_eight</span><span class="p">):</span>
+    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">lst</span><span class="p">)</span> <span class="o">%</span> <span class="mi">8</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span> <span class="ow">not</span> <span class="n">do_pad_eight</span><span class="p">:</span>
+      <span class="k">return</span> <span class="n">lst</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="k">return</span> <span class="n">lst</span> <span class="o">+</span> <span class="p">[</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="o">.</span><span class="n">value</span><span class="p">]</span> <span class="o">*</span> <span class="p">(</span><span class="mi">8</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">lst</span><span class="p">)</span> <span class="o">%</span> <span class="mi">8</span><span class="p">)</span>
+
+  <span class="k">def</span> <span class="nf">_src_token_to_id</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">line</span><span class="p">):</span>
+    <span class="n">tokens</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_delimiter</span><span class="p">)</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_use_start_token</span><span class="p">:</span>
+      <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_pad2eight</span><span class="p">([</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">]</span> <span class="o">+</span> \
              <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">token</span><span class="p">,</span> <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)</span> <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">tokens</span><span class="p">[:</span><span class="bp">self</span><span class="o">.</span><span class="n">max_len</span><span class="o">-</span><span class="mi">2</span><span class="p">]]</span> <span class="o">+</span> \
              <span class="p">[</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pad_lengths_to_eight</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="s2">&quot;int32&quot;</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">tgt_token_to_id</span><span class="p">(</span><span class="n">line</span><span class="p">):</span>
-      <span class="n">tokens</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_delimiter</span><span class="p">)</span>
-      <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">pad2eight</span><span class="p">([</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">]</span> <span class="o">+</span> \
+    <span class="k">else</span><span class="p">:</span>
+      <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_pad2eight</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">src_seq2idx</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">token</span><span class="p">,</span> <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)</span> <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span>
+                                       <span class="n">tokens</span><span class="p">[:</span><span class="bp">self</span><span class="o">.</span><span class="n">max_len</span> <span class="o">-</span> <span class="mi">2</span><span class="p">]]</span> <span class="o">+</span> \
+                                      <span class="p">[</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pad_lengths_to_eight</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="s2">&quot;int32&quot;</span><span class="p">)</span>
+
+  <span class="k">def</span> <span class="nf">_tgt_token_to_id</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">line</span><span class="p">):</span>
+    <span class="n">tokens</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_delimiter</span><span class="p">)</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_use_start_token</span><span class="p">:</span>
+      <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_pad2eight</span><span class="p">([</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">]</span> <span class="o">+</span> \
              <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">token</span><span class="p">,</span> <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)</span> <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">tokens</span><span class="p">[:</span><span class="bp">self</span><span class="o">.</span><span class="n">max_len</span><span class="o">-</span><span class="mi">2</span><span class="p">]]</span> <span class="o">+</span> \
              <span class="p">[</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pad_lengths_to_eight</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="s2">&quot;int32&quot;</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_pad2eight</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">tgt_seq2idx</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">token</span><span class="p">,</span> <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">UNK_ID</span><span class="o">.</span><span class="n">value</span><span class="p">)</span> <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span>
+                                       <span class="n">tokens</span><span class="p">[:</span><span class="bp">self</span><span class="o">.</span><span class="n">max_len</span> <span class="o">-</span> <span class="mi">2</span><span class="p">]]</span> <span class="o">+</span> \
+                                      <span class="p">[</span><span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pad_lengths_to_eight</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="s2">&quot;int32&quot;</span><span class="p">)</span>
 
+<div class="viewcode-block" id="ParallelTextDataLayer.build_graph"><a class="viewcode-back" href="../../../api-docs/data.text2text.html#data.text2text.text2text.ParallelTextDataLayer.build_graph">[docs]</a>  <span class="k">def</span> <span class="nf">build_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
     <span class="n">_sources</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">TextLineDataset</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">source_file</span><span class="p">)</span>\
-      <span class="o">.</span><span class="n">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">line</span><span class="p">:</span> <span class="n">tf</span><span class="o">.</span><span class="n">py_func</span><span class="p">(</span><span class="n">func</span><span class="o">=</span><span class="n">src_token_to_id</span><span class="p">,</span> <span class="n">inp</span><span class="o">=</span><span class="p">[</span><span class="n">line</span><span class="p">],</span>
+      <span class="o">.</span><span class="n">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">line</span><span class="p">:</span> <span class="n">tf</span><span class="o">.</span><span class="n">py_func</span><span class="p">(</span><span class="n">func</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_src_token_to_id</span><span class="p">,</span> <span class="n">inp</span><span class="o">=</span><span class="p">[</span><span class="n">line</span><span class="p">],</span>
                                    <span class="n">Tout</span><span class="o">=</span><span class="p">[</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">],</span> <span class="n">stateful</span><span class="o">=</span><span class="kc">False</span><span class="p">),</span>
            <span class="n">num_parallel_calls</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_map_parallel_calls</span><span class="p">)</span> \
       <span class="o">.</span><span class="n">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">tokens</span><span class="p">:</span> <span class="p">(</span><span class="n">tokens</span><span class="p">,</span> <span class="n">tf</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="n">tokens</span><span class="p">)),</span>
            <span class="n">num_parallel_calls</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_map_parallel_calls</span><span class="p">)</span>
 
     <span class="n">_targets</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">TextLineDataset</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">target_file</span><span class="p">)</span> \
-      <span class="o">.</span><span class="n">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">line</span><span class="p">:</span> <span class="n">tf</span><span class="o">.</span><span class="n">py_func</span><span class="p">(</span><span class="n">func</span><span class="o">=</span><span class="n">tgt_token_to_id</span><span class="p">,</span> <span class="n">inp</span><span class="o">=</span><span class="p">[</span><span class="n">line</span><span class="p">],</span>
+      <span class="o">.</span><span class="n">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">line</span><span class="p">:</span> <span class="n">tf</span><span class="o">.</span><span class="n">py_func</span><span class="p">(</span><span class="n">func</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_tgt_token_to_id</span><span class="p">,</span> <span class="n">inp</span><span class="o">=</span><span class="p">[</span><span class="n">line</span><span class="p">],</span>
                                    <span class="n">Tout</span><span class="o">=</span><span class="p">[</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">],</span> <span class="n">stateful</span><span class="o">=</span><span class="kc">False</span><span class="p">),</span>
            <span class="n">num_parallel_calls</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_map_parallel_calls</span><span class="p">)</span> \
       <span class="o">.</span><span class="n">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">tokens</span><span class="p">:</span> <span class="p">(</span><span class="n">tokens</span><span class="p">,</span> <span class="n">tf</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="n">tokens</span><span class="p">)),</span>
@@ -382,6 +397,33 @@ <h1>Source code for data.text2text.text2text</h1><div class="highlight"><pre>
       <span class="n">t1</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">iterator</span><span class="o">.</span><span class="n">get_next</span><span class="p">()</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span><span class="p">[</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="n">t1</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">t1</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span></div>
 
+<div class="viewcode-block" id="ParallelTextDataLayer.create_interactive_placeholders"><a class="viewcode-back" href="../../../api-docs/data.text2text.html#data.text2text.text2text.ParallelTextDataLayer.create_interactive_placeholders">[docs]</a>  <span class="k">def</span> <span class="nf">create_interactive_placeholders</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_text</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span><span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">,</span> <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_batch_size</span><span class="p">,</span> <span class="kc">None</span><span class="p">])</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_text_length</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span><span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">,</span> <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_batch_size</span><span class="p">])</span>
+
+    <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span> <span class="o">=</span> <span class="p">{}</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_input_tensors</span><span class="p">[</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_text</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_text_length</span><span class="p">]</span></div>
+
+<div class="viewcode-block" id="ParallelTextDataLayer.create_feed_dict"><a class="viewcode-back" href="../../../api-docs/data.text2text.html#data.text2text.text2text.ParallelTextDataLayer.create_feed_dict">[docs]</a>  <span class="k">def</span> <span class="nf">create_feed_dict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">model_in</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot; Creates the feed dict for interactive infer</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">      model_in (str): the string to be translated. Should be in bpe format.</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">      feed_dict (dict): Dictionary with values for the placeholders.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">text</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_src_token_to_id</span><span class="p">(</span><span class="n">model_in</span><span class="p">)</span>
+    <span class="n">text_length</span> <span class="o">=</span> <span class="n">text</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="n">text</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">text</span><span class="p">,</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">])</span>
+    <span class="n">text_length</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">text_length</span><span class="p">,</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_batch_size</span><span class="p">])</span>
+
+    <span class="n">feed_dict</span> <span class="o">=</span> <span class="p">{</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_text</span><span class="p">:</span> <span class="n">text</span><span class="p">,</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_text_length</span><span class="p">:</span> <span class="n">text_length</span>
+    <span class="p">}</span>
+    <span class="k">return</span> <span class="n">feed_dict</span></div>
 
 <div class="viewcode-block" id="ParallelTextDataLayer.get_size_in_samples"><a class="viewcode-back" href="../../../api-docs/data.text2text.html#data.text2text.text2text.ParallelTextDataLayer.get_size_in_samples">[docs]</a>  <span class="k">def</span> <span class="nf">get_size_in_samples</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
     <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span></div>
diff --git a/docs/html/_modules/decoders/convs2s_decoder.html b/docs/html/_modules/decoders/convs2s_decoder.html
index 0c6194d79..362d96f5c 100644
--- a/docs/html/_modules/decoders/convs2s_decoder.html
+++ b/docs/html/_modules/decoders/convs2s_decoder.html
@@ -189,7 +189,6 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
     <span class="k">return</span> <span class="nb">dict</span><span class="p">(</span>
         <span class="n">Decoder</span><span class="o">.</span><span class="n">get_required_params</span><span class="p">(),</span> <span class="o">**</span><span class="p">{</span>
             <span class="s1">&#39;batch_size&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-            <span class="s1">&#39;decoder_layers&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s1">&#39;tgt_emb_size&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s1">&#39;tgt_vocab_size&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s1">&#39;shared_embed&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
@@ -227,6 +226,8 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
             <span class="s1">&#39;END_SYMBOL&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s1">&#39;conv_activation&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>
             <span class="s1">&#39;normalization_type&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+            <span class="s1">&#39;scaling_factor&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
+            <span class="s1">&#39;init_var&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>
         <span class="p">})</span></div>
 
   <span class="k">def</span> <span class="nf">_cast_types</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dict</span><span class="p">):</span>
@@ -242,6 +243,12 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">=</span> <span class="n">mode</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_pad_sym</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;PAD_SYMBOL&#39;</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_pad2eight</span> <span class="o">=</span> <span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;pad_embeddings_2_eight&#39;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;scaling_factor&quot;</span><span class="p">,</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;normalization_type&quot;</span><span class="p">,</span> <span class="s2">&quot;weight_norm&quot;</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">conv_activation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;conv_activation&quot;</span><span class="p">,</span> <span class="n">gated_linear_units</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">max_input_length</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;max_input_length&quot;</span><span class="p">,</span> <span class="n">MAX_INPUT_LENGTH</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">init_var</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;init_var&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;regularizer&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
 
   <span class="k">def</span> <span class="nf">_decode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dict</span><span class="p">):</span>
     <span class="n">targets</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;target_tensors&#39;</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> \
@@ -260,10 +267,6 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
         <span class="n">knum_list</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;conv_nchannels_kwidth&quot;</span><span class="p">)))[</span><span class="mi">0</span><span class="p">]</span>
         <span class="n">kwidth_list</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;conv_nchannels_kwidth&quot;</span><span class="p">)))[</span><span class="mi">1</span><span class="p">]</span>
 
-        <span class="n">normalization_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;normalization_type&quot;</span><span class="p">,</span>
-                                             <span class="s2">&quot;weight_norm&quot;</span><span class="p">)</span>
-        <span class="n">conv_activation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;conv_activation&quot;</span><span class="p">,</span> <span class="n">gated_linear_units</span><span class="p">)</span>
-
         <span class="c1"># preparing embedding layers</span>
         <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;embedding&quot;</span><span class="p">):</span>
           <span class="k">if</span> <span class="s1">&#39;embedding_softmax_layer&#39;</span> <span class="ow">in</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;encoder_output&#39;</span><span class="p">]</span> \
@@ -288,7 +291,7 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
                 <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;encoder_output&#39;</span><span class="p">][</span><span class="s1">&#39;position_embedding_layer&#39;</span><span class="p">]</span>
             <span class="k">else</span><span class="p">:</span>
               <span class="bp">self</span><span class="o">.</span><span class="n">position_embedding_layer</span> <span class="o">=</span> <span class="n">embedding_layer</span><span class="o">.</span><span class="n">EmbeddingSharedWeights</span><span class="p">(</span>
-                  <span class="n">vocab_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;max_input_length&quot;</span><span class="p">,</span> <span class="n">MAX_INPUT_LENGTH</span><span class="p">),</span>
+                  <span class="n">vocab_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">max_input_length</span><span class="p">,</span>
                   <span class="n">hidden_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">,</span>
                   <span class="n">pad_vocab_to_eight</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_pad2eight</span><span class="p">,</span>
                   <span class="n">init_var</span><span class="o">=</span><span class="mf">0.1</span><span class="p">,</span>
@@ -306,9 +309,12 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
                 <span class="n">dropout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;embedding_dropout_keep_prob&quot;</span><span class="p">],</span>
                 <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;linear_mapping_before_cnn_layers&quot;</span><span class="p">,</span>
                 <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span>
-                <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">))</span>
+                <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+                <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+                <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">)</span>
+          <span class="p">)</span>
 
-        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_layers&#39;</span><span class="p">]):</span>
+        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">knum_list</span><span class="p">)):</span>
           <span class="n">in_dim</span> <span class="o">=</span> <span class="n">knum_list</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span> <span class="k">else</span> <span class="n">knum_list</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
           <span class="n">out_dim</span> <span class="o">=</span> <span class="n">knum_list</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
 
@@ -321,7 +327,10 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
                 <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;linear_mapping_cnn_&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span>
                 <span class="n">dropout</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
                 <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span>
-                <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">)</span>
+                <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+                <span class="n">regularizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+                <span class="n">init_var</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">,</span>
+            <span class="p">)</span>
           <span class="k">else</span><span class="p">:</span>
             <span class="n">linear_proj</span> <span class="o">=</span> <span class="kc">None</span>
 
@@ -334,27 +343,37 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
               <span class="n">hidden_dropout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;hidden_dropout_keep_prob&quot;</span><span class="p">],</span>
               <span class="n">conv_padding</span><span class="o">=</span><span class="s2">&quot;VALID&quot;</span><span class="p">,</span>
               <span class="n">decode_padding</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-              <span class="n">activation</span><span class="o">=</span><span class="n">conv_activation</span><span class="p">,</span>
-              <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">)</span>
+              <span class="n">activation</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">conv_activation</span><span class="p">,</span>
+              <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+              <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+              <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span>
+          <span class="p">)</span>
 
           <span class="n">att_layer</span> <span class="o">=</span> <span class="n">attention_wn_layer</span><span class="o">.</span><span class="n">AttentionLayerNormalized</span><span class="p">(</span>
               <span class="n">out_dim</span><span class="p">,</span>
               <span class="n">embed_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">,</span>
               <span class="n">layer_id</span><span class="o">=</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span>
               <span class="n">add_res</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-              <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">)</span>
+              <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span>
+              <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+              <span class="n">scaling_factor</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span><span class="p">,</span>
+              <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+              <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span>
+          <span class="p">)</span>
 
           <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">([</span><span class="n">linear_proj</span><span class="p">,</span> <span class="n">conv_layer</span><span class="p">,</span> <span class="n">att_layer</span><span class="p">])</span>
 
         <span class="c1"># linear projection after cnn layers</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
             <span class="n">ffn_wn_layer</span><span class="o">.</span><span class="n">FeedFowardNetworkNormalized</span><span class="p">(</span>
-                <span class="n">knum_list</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_layers&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">],</span>
+                <span class="n">knum_list</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span>
                 <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;out_emb_size&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">),</span>
                 <span class="n">dropout</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
                 <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;linear_mapping_after_cnn_layers&quot;</span><span class="p">,</span>
                 <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span>
-                <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">))</span>
+                <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+                <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+                <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">))</span>
 
         <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;shared_embed&#39;</span><span class="p">]:</span>
           <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
@@ -364,7 +383,9 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
                   <span class="n">dropout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;out_dropout_keep_prob&quot;</span><span class="p">],</span>
                   <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;linear_mapping_to_vocabspace&quot;</span><span class="p">,</span>
                   <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span>
-                  <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">))</span>
+                  <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+                  <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+                  <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">))</span>
         <span class="k">else</span><span class="p">:</span>
           <span class="c1"># if embedding is shared,</span>
           <span class="c1"># the shared embedding is used as the final linear projection to vocab space</span>
@@ -458,7 +479,8 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
         <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;attention_layer&quot;</span><span class="p">):</span>
           <span class="n">outputs</span> <span class="o">=</span> <span class="n">att_layer</span><span class="p">(</span><span class="n">outputs</span><span class="p">,</span> <span class="n">target_embed</span><span class="p">,</span> <span class="n">encoder_outputs_a</span><span class="p">,</span>
                               <span class="n">encoder_outputs_b</span><span class="p">,</span> <span class="n">input_attention_bias</span><span class="p">)</span>
-        <span class="n">outputs</span> <span class="o">=</span> <span class="p">(</span><span class="n">outputs</span> <span class="o">+</span> <span class="n">res_inputs</span><span class="p">)</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">0.5</span><span class="p">)</span>
+        <span class="n">outputs</span> <span class="o">=</span> <span class="p">(</span><span class="n">outputs</span> <span class="o">+</span> <span class="n">res_inputs</span><span class="p">)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span>
+
 
     <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;linear_layer_after_cnn_layers&quot;</span><span class="p">):</span>
       <span class="n">outputs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">](</span><span class="n">outputs</span><span class="p">)</span>
@@ -478,6 +500,7 @@ <h1>Source code for decoders.convs2s_decoder</h1><div class="highlight"><pre>
     <span class="sd">&quot;&quot;&quot;Return predicted sequence.&quot;&quot;&quot;</span>
     <span class="n">batch_size</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">encoder_outputs</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
     <span class="n">input_length</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">encoder_outputs</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span>
+
     <span class="n">max_decode_length</span> <span class="o">=</span> <span class="n">input_length</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;extra_decode_length&quot;</span><span class="p">]</span>
 
     <span class="n">symbols_to_logits_fn</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_symbols_to_logits_fn</span><span class="p">()</span>
diff --git a/docs/html/_modules/decoders/fc_decoders.html b/docs/html/_modules/decoders/fc_decoders.html
index 992bee22b..f4f916122 100644
--- a/docs/html/_modules/decoders/fc_decoders.html
+++ b/docs/html/_modules/decoders/fc_decoders.html
@@ -329,11 +329,10 @@ <h1>Source code for decoders.fc_decoders</h1><div class="highlight"><pre>
     <span class="k">return</span> <span class="nb">dict</span><span class="p">(</span><span class="n">FullyConnectedTimeDecoder</span><span class="o">.</span><span class="n">get_optional_params</span><span class="p">(),</span> <span class="o">**</span><span class="p">{</span>
         <span class="s1">&#39;decoder_library_path&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
         <span class="s1">&#39;beam_width&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-        <span class="s1">&#39;lm_weight&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
-        <span class="s1">&#39;word_count_weight&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
-        <span class="s1">&#39;valid_word_count_weight&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
-        <span class="s1">&#39;lm_binary_path&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-        <span class="s1">&#39;lm_trie_path&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+        <span class="s1">&#39;alpha&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
+        <span class="s1">&#39;beta&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
+        <span class="s1">&#39;lm_path&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+        <span class="s1">&#39;trie_path&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
         <span class="s1">&#39;alphabet_config_path&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
     <span class="p">})</span></div>
 
@@ -349,16 +348,14 @@ <h1>Source code for decoders.fc_decoders</h1><div class="highlight"><pre>
 <span class="sd">      output text generation. If False, other config parameters are not used.</span>
 <span class="sd">    * **decoder_library_path** (string) --- path to the ctc decoder with</span>
 <span class="sd">      language model library.</span>
-<span class="sd">    * **lm_binary_path** (string) --- path to the language model file.</span>
-<span class="sd">    * **lm_trie_path** (string) --- path to the language model trie file.</span>
+<span class="sd">    * **lm_path** (string) --- path to the language model file.</span>
+<span class="sd">    * **trie_path** (string) --- path to the prefix trie file.</span>
 <span class="sd">    * **alphabet_config_path** (string) --- path to the alphabet file.</span>
 <span class="sd">    * **beam_width** (int) --- beam width for beam search.</span>
-<span class="sd">    * **lm_weight** (float) --- weight that is assigned to language model</span>
+<span class="sd">    * **alpha** (float) --- weight that is assigned to language model</span>
 <span class="sd">      probabilities.</span>
-<span class="sd">    * **word_count_weight** (float) --- weight that is assigned to the</span>
+<span class="sd">    * **beta** (float) --- weight that is assigned to the</span>
 <span class="sd">      word count.</span>
-<span class="sd">    * **valid_word_count_weight** (float) --- weight that is assigned to the</span>
-<span class="sd">      valid word count, i.e. words that exist in language model dictionary.</span>
 <span class="sd">    &quot;&quot;&quot;</span>
     <span class="nb">super</span><span class="p">(</span><span class="n">FullyConnectedCTCDecoder</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">mode</span><span class="p">)</span>
 
@@ -382,12 +379,10 @@ <h1>Source code for decoders.fc_decoders</h1><div class="highlight"><pre>
         <span class="n">decoded_ixs</span><span class="p">,</span> <span class="n">decoded_vals</span><span class="p">,</span> <span class="n">decoded_shapes</span><span class="p">,</span> <span class="n">log_probabilities</span> <span class="o">=</span> <span class="p">(</span>
             <span class="n">custom_op_module</span><span class="o">.</span><span class="n">ctc_beam_search_decoder_with_lm</span><span class="p">(</span>
                 <span class="n">logits</span><span class="p">,</span> <span class="n">sequence_length</span><span class="p">,</span> <span class="n">beam_width</span><span class="o">=</span><span class="n">beam_width</span><span class="p">,</span>
-                <span class="n">model_path</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;lm_binary_path&#39;</span><span class="p">],</span>
-                <span class="n">trie_path</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;lm_trie_path&#39;</span><span class="p">],</span>
+                <span class="n">model_path</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;lm_path&#39;</span><span class="p">],</span> <span class="n">trie_path</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;trie_path&#39;</span><span class="p">],</span>
                 <span class="n">alphabet_path</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;alphabet_config_path&#39;</span><span class="p">],</span>
-                <span class="n">lm_weight</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;lm_weight&#39;</span><span class="p">],</span>
-                <span class="n">word_count_weight</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;word_count_weight&#39;</span><span class="p">],</span>
-                <span class="n">valid_word_count_weight</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;valid_word_count_weight&#39;</span><span class="p">],</span>
+                <span class="n">alpha</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;alpha&#39;</span><span class="p">],</span>
+                <span class="n">beta</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;beta&#39;</span><span class="p">],</span>
                 <span class="n">top_paths</span><span class="o">=</span><span class="n">top_paths</span><span class="p">,</span> <span class="n">merge_repeated</span><span class="o">=</span><span class="n">merge_repeated</span><span class="p">,</span>
             <span class="p">)</span>
         <span class="p">)</span>
diff --git a/docs/html/_modules/decoders/rnn_decoders.html b/docs/html/_modules/decoders/rnn_decoders.html
index 27c696834..f0d0a70f9 100644
--- a/docs/html/_modules/decoders/rnn_decoders.html
+++ b/docs/html/_modules/decoders/rnn_decoders.html
@@ -162,6 +162,8 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
 
+<span class="kn">import</span> <span class="nn">copy</span>
+
 <span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 
 <span class="kn">from</span> <span class="nn">open_seq2seq.parts.rnns.attention_wrapper</span> <span class="k">import</span> <span class="n">BahdanauAttention</span><span class="p">,</span> \
@@ -205,6 +207,7 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
         <span class="s1">&#39;proj_size&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
         <span class="s1">&#39;num_groups&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
         <span class="s1">&#39;PAD_SYMBOL&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>  <span class="c1"># symbol id</span>
+        <span class="s1">&#39;weight_tied&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
     <span class="p">})</span></div>
 
 <div class="viewcode-block" id="RNNDecoderWithAttention.__init__"><a class="viewcode-back" href="../../api-docs/decoders.html#decoders.rnn_decoders.RNNDecoderWithAttention.__init__">[docs]</a>  <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">params</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span>
@@ -237,7 +240,8 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">GO_SYMBOL</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;GO_SYMBOL&#39;</span><span class="p">]</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">END_SYMBOL</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;END_SYMBOL&#39;</span><span class="p">]</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;tgt_vocab_size&#39;</span><span class="p">]</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;tgt_emb_size&#39;</span><span class="p">]</span></div>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;tgt_emb_size&#39;</span><span class="p">]</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_weight_tied</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;weight_tied&#39;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span></div>
 
 <div class="viewcode-block" id="RNNDecoderWithAttention._build_attention"><a class="viewcode-back" href="../../api-docs/decoders.html#decoders.rnn_decoders.RNNDecoderWithAttention._build_attention">[docs]</a>  <span class="k">def</span> <span class="nf">_build_attention</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span>
                        <span class="n">encoder_outputs</span><span class="p">,</span>
@@ -329,16 +333,23 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
     <span class="n">tgt_lengths</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;target_tensors&#39;</span><span class="p">][</span><span class="mi">1</span><span class="p">]</span> <span class="k">if</span> <span class="s1">&#39;target_tensors&#39;</span> <span class="ow">in</span> \
                                                      <span class="n">input_dict</span> <span class="k">else</span> <span class="kc">None</span>
 
-    <span class="bp">self</span><span class="o">.</span><span class="n">_dec_emb_w</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
-        <span class="n">name</span><span class="o">=</span><span class="s1">&#39;DecoderEmbeddingMatrix&#39;</span><span class="p">,</span>
-        <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">],</span>
-        <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span>
-    <span class="p">)</span>
-
     <span class="bp">self</span><span class="o">.</span><span class="n">_output_projection_layer</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span><span class="p">,</span> <span class="n">use_bias</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
     <span class="p">)</span>
 
+    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_weight_tied</span><span class="p">:</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">_dec_emb_w</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
+          <span class="n">name</span><span class="o">=</span><span class="s1">&#39;DecoderEmbeddingMatrix&#39;</span><span class="p">,</span>
+          <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">],</span>
+          <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">float32</span>
+      <span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">fake_input</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">shape</span><span class="o">=</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">))</span>
+      <span class="n">fake_output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_output_projection_layer</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="n">fake_input</span><span class="p">)</span>
+      <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;dense&quot;</span><span class="p">,</span> <span class="n">reuse</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
+        <span class="n">dense_weights</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span><span class="s2">&quot;kernel&quot;</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_dec_emb_w</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">dense_weights</span><span class="p">)</span>
+
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">==</span> <span class="s2">&quot;train&quot;</span><span class="p">:</span>
       <span class="n">dp_input_keep_prob</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_dp_input_keep_prob&#39;</span><span class="p">]</span>
       <span class="n">dp_output_keep_prob</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_dp_output_keep_prob&#39;</span><span class="p">]</span>
@@ -349,6 +360,7 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
     <span class="n">residual_connections</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_use_skip_connections&#39;</span><span class="p">]</span>
 
     <span class="c1"># list of cells</span>
+    <span class="n">cell_params</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;core_cell_params&#39;</span><span class="p">,</span> <span class="p">{})</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_decoder_cells</span> <span class="o">=</span> <span class="p">[</span>
         <span class="n">single_cell</span><span class="p">(</span>
             <span class="n">cell_class</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;core_cell&#39;</span><span class="p">],</span>
@@ -358,9 +370,26 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
             <span class="c1"># residual connections are added a little differently for GNMT</span>
             <span class="n">residual_connections</span><span class="o">=</span><span class="kc">False</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;attention_type&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s1">&#39;gnmt&#39;</span><span class="p">)</span>
                                  <span class="k">else</span> <span class="n">residual_connections</span><span class="p">,</span>
-        <span class="p">)</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_layers&#39;</span><span class="p">])</span>
+        <span class="p">)</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_layers&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span>
     <span class="p">]</span>
 
+    <span class="n">last_cell_params</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">cell_params</span><span class="p">)</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_weight_tied</span><span class="p">:</span>
+      <span class="n">last_cell_params</span><span class="p">[</span><span class="s1">&#39;num_units&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span>
+
+    <span class="n">last_cell</span> <span class="o">=</span> <span class="n">single_cell</span><span class="p">(</span>
+            <span class="n">cell_class</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;core_cell&#39;</span><span class="p">],</span>
+            <span class="n">cell_params</span><span class="o">=</span><span class="n">last_cell_params</span><span class="p">,</span>
+            <span class="n">dp_input_keep_prob</span><span class="o">=</span><span class="n">dp_input_keep_prob</span><span class="p">,</span>
+            <span class="n">dp_output_keep_prob</span><span class="o">=</span><span class="n">dp_output_keep_prob</span><span class="p">,</span>
+            <span class="c1"># residual connections are added a little differently for GNMT</span>
+            <span class="n">residual_connections</span><span class="o">=</span><span class="kc">False</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;attention_type&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s1">&#39;gnmt&#39;</span><span class="p">)</span>
+                                 <span class="k">else</span> <span class="n">residual_connections</span><span class="p">,</span>
+        <span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_decoder_cells</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">last_cell</span><span class="p">)</span>
+
+
+
     <span class="n">attention_mechanism</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_build_attention</span><span class="p">(</span>
         <span class="n">encoder_outputs</span><span class="p">,</span>
         <span class="n">enc_src_lengths</span><span class="p">,</span>
@@ -505,6 +534,7 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
     <span class="k">else</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_beam_width</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;beam_width&quot;</span><span class="p">]</span></div>
 
+
 <div class="viewcode-block" id="BeamSearchRNNDecoderWithAttention._decode"><a class="viewcode-back" href="../../api-docs/decoders.html#decoders.rnn_decoders.BeamSearchRNNDecoderWithAttention._decode">[docs]</a>  <span class="k">def</span> <span class="nf">_decode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dict</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Decodes representation into data.</span>
 
@@ -528,16 +558,27 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
     <span class="n">encoder_outputs</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;encoder_output&#39;</span><span class="p">][</span><span class="s1">&#39;outputs&#39;</span><span class="p">]</span>
     <span class="n">enc_src_lengths</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;encoder_output&#39;</span><span class="p">][</span><span class="s1">&#39;src_lengths&#39;</span><span class="p">]</span>
 
-    <span class="bp">self</span><span class="o">.</span><span class="n">_dec_emb_w</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
-        <span class="n">name</span><span class="o">=</span><span class="s1">&#39;DecoderEmbeddingMatrix&#39;</span><span class="p">,</span>
-        <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">],</span>
-        <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">float32</span>
-    <span class="p">)</span>
+    
 
     <span class="bp">self</span><span class="o">.</span><span class="n">_output_projection_layer</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span><span class="p">,</span> <span class="n">use_bias</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
     <span class="p">)</span>
 
+    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_weight_tied</span><span class="p">:</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">_dec_emb_w</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
+          <span class="n">name</span><span class="o">=</span><span class="s1">&#39;DecoderEmbeddingMatrix&#39;</span><span class="p">,</span>
+          <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">],</span>
+          <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">float32</span>
+      <span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">fake_input</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">shape</span><span class="o">=</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span><span class="p">))</span>
+      <span class="n">fake_output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_output_projection_layer</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="n">fake_input</span><span class="p">)</span>
+      <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;dense&quot;</span><span class="p">,</span> <span class="n">reuse</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
+        <span class="n">dense_weights</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span><span class="s2">&quot;kernel&quot;</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_dec_emb_w</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">dense_weights</span><span class="p">)</span>
+
+
+
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">==</span> <span class="s2">&quot;train&quot;</span><span class="p">:</span>
       <span class="n">dp_input_keep_prob</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_dp_input_keep_prob&#39;</span><span class="p">]</span>
       <span class="n">dp_output_keep_prob</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_dp_output_keep_prob&#39;</span><span class="p">]</span>
@@ -547,18 +588,36 @@ <h1>Source code for decoders.rnn_decoders</h1><div class="highlight"><pre>
 
     <span class="n">residual_connections</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_use_skip_connections&#39;</span><span class="p">]</span>
     <span class="c1"># list of cells</span>
+    <span class="n">cell_params</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;core_cell_params&#39;</span><span class="p">,</span> <span class="p">{})</span>
+    
+
     <span class="bp">self</span><span class="o">.</span><span class="n">_decoder_cells</span> <span class="o">=</span> <span class="p">[</span>
         <span class="n">single_cell</span><span class="p">(</span>
             <span class="n">cell_class</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;core_cell&#39;</span><span class="p">],</span>
-            <span class="n">cell_params</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;core_cell_params&#39;</span><span class="p">,</span> <span class="p">{}),</span>
+            <span class="n">cell_params</span><span class="o">=</span><span class="n">cell_params</span><span class="p">,</span>
             <span class="n">dp_input_keep_prob</span><span class="o">=</span><span class="n">dp_input_keep_prob</span><span class="p">,</span>
             <span class="n">dp_output_keep_prob</span><span class="o">=</span><span class="n">dp_output_keep_prob</span><span class="p">,</span>
             <span class="c1"># residual connections are added a little differently for GNMT</span>
             <span class="n">residual_connections</span><span class="o">=</span><span class="kc">False</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;attention_type&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s1">&#39;gnmt&#39;</span><span class="p">)</span>
                                  <span class="k">else</span> <span class="n">residual_connections</span><span class="p">,</span>
-        <span class="p">)</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_layers&#39;</span><span class="p">])</span>
+        <span class="p">)</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_layers&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span>
     <span class="p">]</span>
 
+    <span class="n">last_cell_params</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">cell_params</span><span class="p">)</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_weight_tied</span><span class="p">:</span>
+      <span class="n">last_cell_params</span><span class="p">[</span><span class="s1">&#39;num_units&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_emb_size</span>
+
+    <span class="n">last_cell</span> <span class="o">=</span> <span class="n">single_cell</span><span class="p">(</span>
+            <span class="n">cell_class</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;core_cell&#39;</span><span class="p">],</span>
+            <span class="n">cell_params</span><span class="o">=</span><span class="n">last_cell_params</span><span class="p">,</span>
+            <span class="n">dp_input_keep_prob</span><span class="o">=</span><span class="n">dp_input_keep_prob</span><span class="p">,</span>
+            <span class="n">dp_output_keep_prob</span><span class="o">=</span><span class="n">dp_output_keep_prob</span><span class="p">,</span>
+            <span class="c1"># residual connections are added a little differently for GNMT</span>
+            <span class="n">residual_connections</span><span class="o">=</span><span class="kc">False</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;attention_type&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s1">&#39;gnmt&#39;</span><span class="p">)</span>
+                                 <span class="k">else</span> <span class="n">residual_connections</span><span class="p">,</span>
+        <span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_decoder_cells</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">last_cell</span><span class="p">)</span>
+
     <span class="c1"># pylint: disable=no-member</span>
     <span class="n">tiled_enc_outputs</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">contrib</span><span class="o">.</span><span class="n">seq2seq</span><span class="o">.</span><span class="n">tile_batch</span><span class="p">(</span>
         <span class="n">encoder_outputs</span><span class="p">,</span>
diff --git a/docs/html/_modules/decoders/tacotron2_decoder.html b/docs/html/_modules/decoders/tacotron2_decoder.html
index 505e35f14..d98329211 100644
--- a/docs/html/_modules/decoders/tacotron2_decoder.html
+++ b/docs/html/_modules/decoders/tacotron2_decoder.html
@@ -256,7 +256,6 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
             <span class="s1">&#39;decoder_cell_units&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s1">&#39;decoder_cell_type&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>
             <span class="s1">&#39;decoder_layers&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-            <span class="s1">&#39;num_audio_features&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
         <span class="p">}</span>
     <span class="p">)</span></div>
 
@@ -280,6 +279,7 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
             <span class="s1">&#39;mask_decoder_sequence&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
             <span class="s1">&#39;attention_bias&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
             <span class="s1">&#39;zoneout_prob&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
+            <span class="s1">&#39;dropout_prob&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
             <span class="s1">&#39;parallel_iterations&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
         <span class="p">}</span>
     <span class="p">)</span></div>
@@ -297,7 +297,8 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
 <span class="sd">    * **attention_type** (string) --- Determines whether attention mechanism to</span>
 <span class="sd">      use, should be one of &#39;bahdanau&#39;, &#39;location&#39;, or None.</span>
 <span class="sd">      Use of &#39;location&#39;-sensitive attention is strongly recommended.</span>
-<span class="sd">    * **bahdanau_normalize** (bool) ---  Defaults to False.</span>
+<span class="sd">    * **bahdanau_normalize** (bool) --- Whether to enable weight norm on the</span>
+<span class="sd">      attention parameters. Defaults to False.</span>
 <span class="sd">    * **decoder_cell_units** (int) --- dimension of decoder RNN cells.</span>
 <span class="sd">    * **decoder_layers** (int) --- number of decoder RNN layers to use.</span>
 <span class="sd">    * **decoder_cell_type** (callable) --- could be &quot;lstm&quot;, &quot;gru&quot;, &quot;glstm&quot;, or</span>
@@ -352,17 +353,20 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
 <span class="sd">      &quot;channels_last&quot;. Defaults to &quot;channels_last&quot;.</span>
 <span class="sd">    * **postnet_keep_dropout_prob** (float) --- keep probability for dropout in</span>
 <span class="sd">      the postnet conv layers. Default to 0.5.</span>
-<span class="sd">    * **mask_decoder_sequence** (bool) --- Defaults to True</span>
+<span class="sd">    * **mask_decoder_sequence** (bool) --- Defaults to True.</span>
 <span class="sd">    * **attention_bias** (bool) --- Wether to use a bias term when calculating</span>
 <span class="sd">      the attention. Only works for &quot;location&quot; attention. Defaults to False.</span>
-<span class="sd">    * **zoneout_prob** (float) --- zoneout probability. Defaults to 0.1</span>
+<span class="sd">    * **zoneout_prob** (float) --- zoneout probability for rnn layers.</span>
+<span class="sd">      Defaults to 0.</span>
+<span class="sd">    * **dropout_prob** (float) --- dropout probability for rnn layers.</span>
+<span class="sd">      Defaults to 0.1</span>
 <span class="sd">    * **parallel_iterations** (int) --- Number of parallel_iterations for</span>
 <span class="sd">      tf.while loop inside dynamic_decode. Defaults to 32.</span>
 <span class="sd">    &quot;&quot;&quot;</span>
 
     <span class="nb">super</span><span class="p">(</span><span class="n">Tacotron2Decoder</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">mode</span><span class="p">)</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">_num_audio_features</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">_model</span> <span class="o">=</span> <span class="n">model</span></div>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_model</span> <span class="o">=</span> <span class="n">model</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_n_feats</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span></div>
 
 <div class="viewcode-block" id="Tacotron2Decoder._build_attention"><a class="viewcode-back" href="../../api-docs/decoders.html#decoders.tacotron2_decoder.Tacotron2Decoder._build_attention">[docs]</a>  <span class="k">def</span> <span class="nf">_build_attention</span><span class="p">(</span>
       <span class="bp">self</span><span class="p">,</span>
@@ -405,7 +409,6 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
 
 <span class="sd">    Args:</span>
 <span class="sd">      input_dict (dict): Python dictionary with inputs to decoder. Must define:</span>
-
 <span class="sd">          * src_inputs - decoder input Tensor of shape [batch_size, time, dim]</span>
 <span class="sd">            or [time, batch_size, dim]</span>
 <span class="sd">          * src_lengths - decoder input lengths Tensor of shape [batch_size]</span>
@@ -420,7 +423,9 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
 <span class="sd">    Returns:</span>
 <span class="sd">      dict:</span>
 <span class="sd">        A python dictionary containing:</span>
+
 <span class="sd">          * outputs - array containing:</span>
+
 <span class="sd">              * decoder_output - tensor of shape [batch_size, time,</span>
 <span class="sd">                num_features] or [time, batch_size, num_features]. Spectrogram</span>
 <span class="sd">                representation learned by the decoder rnn</span>
@@ -456,9 +461,11 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
             <span class="s2">&quot;enabled&quot;</span>
         <span class="p">)</span>
 
+    <span class="n">num_audio_features</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n_feats</span>
+
     <span class="n">output_projection_layer</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span>
         <span class="n">name</span><span class="o">=</span><span class="s2">&quot;output_proj&quot;</span><span class="p">,</span>
-        <span class="n">units</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_audio_features</span><span class="p">,</span>
+        <span class="n">units</span><span class="o">=</span><span class="n">num_audio_features</span><span class="p">,</span>
         <span class="n">use_bias</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
     <span class="p">)</span>
     <span class="n">stop_token_projection_layer</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span>
@@ -478,41 +485,50 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
 
     <span class="n">cell_params</span> <span class="o">=</span> <span class="p">{}</span>
     <span class="n">cell_params</span><span class="p">[</span><span class="s2">&quot;num_units&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_cell_units&#39;</span><span class="p">]</span>
-    <span class="n">decoder_cell</span> <span class="o">=</span> <span class="p">[</span>
+    <span class="n">decoder_cells</span> <span class="o">=</span> <span class="p">[</span>
         <span class="n">single_cell</span><span class="p">(</span>
             <span class="n">cell_class</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_cell_type&#39;</span><span class="p">],</span>
             <span class="n">cell_params</span><span class="o">=</span><span class="n">cell_params</span><span class="p">,</span>
-            <span class="n">zoneout_prob</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;zoneout_prob&quot;</span><span class="p">,</span> <span class="mf">0.1</span><span class="p">),</span>
-            <span class="n">training</span><span class="o">=</span><span class="n">training</span>
+            <span class="n">zoneout_prob</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;zoneout_prob&quot;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">),</span>
+            <span class="n">dp_output_keep_prob</span><span class="o">=</span><span class="mf">1.</span><span class="o">-</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;dropout_prob&quot;</span><span class="p">,</span> <span class="mf">0.1</span><span class="p">),</span>
+            <span class="n">training</span><span class="o">=</span><span class="n">training</span><span class="p">,</span>
         <span class="p">)</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_layers&#39;</span><span class="p">])</span>
     <span class="p">]</span>
-    <span class="n">decoder_cell</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">contrib</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">MultiRNNCell</span><span class="p">(</span><span class="n">decoder_cell</span><span class="p">)</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;attention_type&#39;</span><span class="p">]</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
       <span class="n">attention_mechanism</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_build_attention</span><span class="p">(</span>
           <span class="n">encoder_outputs</span><span class="p">,</span> <span class="n">enc_src_lengths</span><span class="p">,</span>
-          <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;attention_bias&quot;</span><span class="p">,</span> <span class="kc">False</span><span class="p">),</span>
+          <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;attention_bias&quot;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
       <span class="p">)</span>
 
-      <span class="n">decoder_cell</span> <span class="o">=</span> <span class="n">AttentionWrapper</span><span class="p">(</span>
-          <span class="n">cell</span><span class="o">=</span><span class="n">decoder_cell</span><span class="p">,</span>
+      <span class="n">attention_cell</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">contrib</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">MultiRNNCell</span><span class="p">(</span><span class="n">decoder_cells</span><span class="p">)</span>
+
+      <span class="n">output_attention</span> <span class="o">=</span> <span class="s2">&quot;both&quot;</span>
+      <span class="n">attentive_cell</span> <span class="o">=</span> <span class="n">AttentionWrapper</span><span class="p">(</span>
+          <span class="n">cell</span><span class="o">=</span><span class="n">attention_cell</span><span class="p">,</span>
           <span class="n">attention_mechanism</span><span class="o">=</span><span class="n">attention_mechanism</span><span class="p">,</span>
           <span class="n">alignment_history</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-          <span class="n">output_attention</span><span class="o">=</span><span class="s2">&quot;both&quot;</span><span class="p">,</span>
+          <span class="n">output_attention</span><span class="o">=</span><span class="n">output_attention</span><span class="p">,</span>
       <span class="p">)</span>
 
+      <span class="n">decoder_cell</span> <span class="o">=</span> <span class="n">attentive_cell</span>
+
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;attention_type&#39;</span><span class="p">]</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+      <span class="n">decoder_cell</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">contrib</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">MultiRNNCell</span><span class="p">(</span><span class="n">decoder_cells</span><span class="p">)</span>
+
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">==</span> <span class="s2">&quot;train&quot;</span><span class="p">:</span>
+      <span class="n">train_and_not_sampling</span> <span class="o">=</span> <span class="kc">True</span>
       <span class="n">helper</span> <span class="o">=</span> <span class="n">TacotronTrainingHelper</span><span class="p">(</span>
           <span class="n">inputs</span><span class="o">=</span><span class="n">spec</span><span class="p">,</span>
           <span class="n">sequence_length</span><span class="o">=</span><span class="n">spec_length</span><span class="p">,</span>
           <span class="n">prenet</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-          <span class="n">sampling_prob</span><span class="o">=</span><span class="mf">0.</span><span class="p">,</span>
           <span class="n">model_dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;dtype&quot;</span><span class="p">],</span>
           <span class="n">mask_decoder_sequence</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mask_decoder_sequence&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
       <span class="p">)</span>
     <span class="k">elif</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">==</span> <span class="s2">&quot;eval&quot;</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">==</span> <span class="s2">&quot;infer&quot;</span><span class="p">:</span>
+      <span class="n">train_and_not_sampling</span> <span class="o">=</span> <span class="kc">False</span>
       <span class="n">inputs</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span>
-          <span class="p">(</span><span class="n">_batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_audio_features</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;dtype&quot;</span><span class="p">]</span>
+          <span class="p">(</span><span class="n">_batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">num_audio_features</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;dtype&quot;</span><span class="p">]</span>
       <span class="p">)</span>
       <span class="n">helper</span> <span class="o">=</span> <span class="n">TacotronHelper</span><span class="p">(</span>
           <span class="n">inputs</span><span class="o">=</span><span class="n">inputs</span><span class="p">,</span>
@@ -527,11 +543,12 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
         <span class="n">initial_decoder_state</span><span class="o">=</span><span class="n">decoder_cell</span><span class="o">.</span><span class="n">zero_state</span><span class="p">(</span>
             <span class="n">_batch_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;dtype&quot;</span><span class="p">]</span>
         <span class="p">),</span>
+        <span class="n">attention_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;attention_type&quot;</span><span class="p">],</span>
         <span class="n">spec_layer</span><span class="o">=</span><span class="n">output_projection_layer</span><span class="p">,</span>
         <span class="n">stop_token_layer</span><span class="o">=</span><span class="n">stop_token_projection_layer</span><span class="p">,</span>
         <span class="n">prenet</span><span class="o">=</span><span class="n">prenet</span><span class="p">,</span>
         <span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;dtype&quot;</span><span class="p">],</span>
-        <span class="n">train</span><span class="o">=</span><span class="n">training</span>
+        <span class="n">train</span><span class="o">=</span><span class="n">train_and_not_sampling</span>
     <span class="p">)</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">==</span> <span class="s1">&#39;train&#39;</span><span class="p">:</span>
@@ -553,8 +570,8 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
     <span class="n">stop_token_logits</span> <span class="o">=</span> <span class="n">outputs</span><span class="o">.</span><span class="n">stop_token_output</span>
 
     <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;decoder&quot;</span><span class="p">):</span>
-      <span class="c1"># If we are in train and not sampling, we need to do the projections</span>
-      <span class="k">if</span> <span class="n">training</span><span class="p">:</span>
+      <span class="c1"># If we are in train and doing sampling, we need to do the projections</span>
+      <span class="k">if</span> <span class="n">train_and_not_sampling</span><span class="p">:</span>
         <span class="n">decoder_spec_output</span> <span class="o">=</span> <span class="n">output_projection_layer</span><span class="p">(</span><span class="n">decoder_output</span><span class="p">)</span>
         <span class="n">stop_token_logits</span> <span class="o">=</span> <span class="n">stop_token_projection_layer</span><span class="p">(</span><span class="n">decoder_spec_output</span><span class="p">)</span>
         <span class="n">decoder_output</span> <span class="o">=</span> <span class="n">decoder_spec_output</span>
@@ -571,6 +588,9 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
         <span class="n">padding</span> <span class="o">=</span> <span class="n">conv_params</span><span class="p">[</span><span class="s1">&#39;padding&#39;</span><span class="p">]</span>
         <span class="n">activation_fn</span> <span class="o">=</span> <span class="n">conv_params</span><span class="p">[</span><span class="s1">&#39;activation_fn&#39;</span><span class="p">]</span>
 
+        <span class="k">if</span> <span class="n">ch_out</span> <span class="o">==</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
+          <span class="n">ch_out</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n_feats</span>
+
         <span class="n">top_layer</span> <span class="o">=</span> <span class="n">conv_bn_actv</span><span class="p">(</span>
             <span class="n">layer_type</span><span class="o">=</span><span class="s2">&quot;conv1d&quot;</span><span class="p">,</span>
             <span class="n">name</span><span class="o">=</span><span class="s2">&quot;conv</span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span>
@@ -601,7 +621,7 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
 
     <span class="k">if</span> <span class="n">regularizer</span> <span class="ow">and</span> <span class="n">training</span><span class="p">:</span>
       <span class="n">vars_to_regularize</span> <span class="o">=</span> <span class="p">[]</span>
-      <span class="n">vars_to_regularize</span> <span class="o">+=</span> <span class="n">decoder_cell</span><span class="o">.</span><span class="n">trainable_variables</span>
+      <span class="n">vars_to_regularize</span> <span class="o">+=</span> <span class="n">attentive_cell</span><span class="o">.</span><span class="n">trainable_variables</span>
       <span class="n">vars_to_regularize</span> <span class="o">+=</span> <span class="n">attention_mechanism</span><span class="o">.</span><span class="n">memory_layer</span><span class="o">.</span><span class="n">trainable_variables</span>
       <span class="n">vars_to_regularize</span> <span class="o">+=</span> <span class="n">output_projection_layer</span><span class="o">.</span><span class="n">trainable_variables</span>
       <span class="n">vars_to_regularize</span> <span class="o">+=</span> <span class="n">stop_token_projection_layer</span><span class="o">.</span><span class="n">trainable_variables</span>
@@ -629,7 +649,6 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
       <span class="n">alignments</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">([</span><span class="n">_batch_size</span><span class="p">,</span> <span class="n">_batch_size</span><span class="p">,</span> <span class="n">_batch_size</span><span class="p">])</span>
 
     <span class="n">spectrogram_prediction</span> <span class="o">=</span> <span class="n">decoder_output</span> <span class="o">+</span> <span class="n">top_layer</span>
-
     <span class="n">stop_token_prediction</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">sigmoid</span><span class="p">(</span><span class="n">stop_token_logits</span><span class="p">)</span>
 
     <span class="n">outputs</span> <span class="o">=</span> <span class="p">[</span>
@@ -639,7 +658,7 @@ <h1>Source code for decoders.tacotron2_decoder</h1><div class="highlight"><pre>
 
     <span class="k">return</span> <span class="p">{</span>
         <span class="s1">&#39;outputs&#39;</span><span class="p">:</span> <span class="n">outputs</span><span class="p">,</span>
-        <span class="s1">&#39;stop_token_prediction&#39;</span><span class="p">:</span> <span class="n">stop_token_logits</span><span class="p">,</span>
+        <span class="s1">&#39;stop_token_prediction&#39;</span><span class="p">:</span> <span class="n">stop_token_logits</span>
     <span class="p">}</span></div></div>
 </pre></div>
 
diff --git a/docs/html/_modules/encoders/convs2s_encoder.html b/docs/html/_modules/encoders/convs2s_encoder.html
index 06b21d40b..6333037e2 100644
--- a/docs/html/_modules/encoders/convs2s_encoder.html
+++ b/docs/html/_modules/encoders/convs2s_encoder.html
@@ -184,7 +184,6 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
   <span class="k">def</span> <span class="nf">get_required_params</span><span class="p">():</span>
     <span class="k">return</span> <span class="nb">dict</span><span class="p">(</span>
         <span class="n">Encoder</span><span class="o">.</span><span class="n">get_required_params</span><span class="p">(),</span> <span class="o">**</span><span class="p">{</span>
-            <span class="s2">&quot;encoder_layers&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s2">&quot;src_emb_size&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s2">&quot;src_vocab_size&quot;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s2">&quot;pad_embeddings_2_eight&quot;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
@@ -202,7 +201,9 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
             <span class="s1">&#39;PAD_SYMBOL&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
             <span class="s1">&#39;conv_activation&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>
             <span class="s1">&#39;normalization_type&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-        <span class="p">})</span></div>
+            <span class="s1">&#39;scaling_factor&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
+            <span class="s1">&#39;init_var&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>
+      <span class="p">})</span></div>
 
   <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span>
                <span class="n">params</span><span class="p">,</span>
@@ -217,6 +218,11 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">=</span> <span class="n">mode</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_pad_sym</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;PAD_SYMBOL&#39;</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_pad2eight</span> <span class="o">=</span> <span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;pad_embeddings_2_eight&#39;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;scaling_factor&quot;</span><span class="p">,</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;normalization_type&quot;</span><span class="p">,</span> <span class="s2">&quot;weight_norm&quot;</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">conv_activation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;conv_activation&quot;</span><span class="p">,</span> <span class="n">gated_linear_units</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;regularizer&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">init_var</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;init_var&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
 
   <span class="k">def</span> <span class="nf">_encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dict</span><span class="p">):</span>
     <span class="n">inputs</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span>
@@ -228,10 +234,6 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
         <span class="n">knum_list</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;conv_nchannels_kwidth&quot;</span><span class="p">)))[</span><span class="mi">0</span><span class="p">]</span>
         <span class="n">kwidth_list</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;conv_nchannels_kwidth&quot;</span><span class="p">)))[</span><span class="mi">1</span><span class="p">]</span>
 
-        <span class="n">normalization_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;normalization_type&quot;</span><span class="p">,</span>
-                                             <span class="s2">&quot;weight_norm&quot;</span><span class="p">)</span>
-        <span class="n">conv_activation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;conv_activation&quot;</span><span class="p">,</span> <span class="n">gated_linear_units</span><span class="p">)</span>
-
         <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;embedding&quot;</span><span class="p">):</span>
           <span class="bp">self</span><span class="o">.</span><span class="n">embedding_softmax_layer</span> <span class="o">=</span> <span class="n">embedding_layer</span><span class="o">.</span><span class="n">EmbeddingSharedWeights</span><span class="p">(</span>
               <span class="n">vocab_size</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_src_vocab_size</span><span class="p">,</span>
@@ -260,9 +262,11 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
                 <span class="n">dropout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;embedding_dropout_keep_prob&quot;</span><span class="p">],</span>
                 <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;linear_mapping_before_cnn_layers&quot;</span><span class="p">,</span>
                 <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span>
-                <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">))</span>
+                <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+                <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+                <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">))</span>
 
-        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;encoder_layers&#39;</span><span class="p">]):</span>
+        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">knum_list</span><span class="p">)):</span>
           <span class="n">in_dim</span> <span class="o">=</span> <span class="n">knum_list</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span> <span class="k">else</span> <span class="n">knum_list</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
           <span class="n">out_dim</span> <span class="o">=</span> <span class="n">knum_list</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
 
@@ -275,7 +279,9 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
                 <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;linear_mapping_cnn_&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span>
                 <span class="n">dropout</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
                 <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span>
-                <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">)</span>
+                <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+                <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+                <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">)</span>
           <span class="k">else</span><span class="p">:</span>
             <span class="n">linear_proj</span> <span class="o">=</span> <span class="kc">None</span>
 
@@ -288,20 +294,24 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
               <span class="n">hidden_dropout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;hidden_dropout_keep_prob&quot;</span><span class="p">],</span>
               <span class="n">conv_padding</span><span class="o">=</span><span class="s2">&quot;SAME&quot;</span><span class="p">,</span>
               <span class="n">decode_padding</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-              <span class="n">activation</span><span class="o">=</span><span class="n">conv_activation</span><span class="p">,</span>
-              <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">)</span>
+              <span class="n">activation</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">conv_activation</span><span class="p">,</span>
+              <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+              <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+              <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">)</span>
 
           <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">([</span><span class="n">linear_proj</span><span class="p">,</span> <span class="n">conv_layer</span><span class="p">])</span>
 
         <span class="c1"># linear projection after cnn layers</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
             <span class="n">ffn_wn_layer</span><span class="o">.</span><span class="n">FeedFowardNetworkNormalized</span><span class="p">(</span>
-                <span class="n">knum_list</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;encoder_layers&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">],</span>
+                <span class="n">knum_list</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span>
                 <span class="bp">self</span><span class="o">.</span><span class="n">_src_emb_size</span><span class="p">,</span>
                 <span class="n">dropout</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
                 <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;linear_mapping_after_cnn_layers&quot;</span><span class="p">,</span>
                 <span class="n">mode</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span>
-                <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">))</span>
+                <span class="n">normalization_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span><span class="p">,</span>
+                <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+                <span class="n">init_var</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">))</span>
 
       <span class="n">encoder_inputs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">embedding_softmax_layer</span><span class="p">(</span><span class="n">inputs</span><span class="p">)</span>
       <span class="n">inputs_attention_bias</span> <span class="o">=</span> <span class="n">get_padding_bias</span><span class="p">(</span>
@@ -358,7 +368,7 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
           <span class="n">outputs</span> <span class="o">*=</span> <span class="n">padding_mask</span>
 
         <span class="n">outputs</span> <span class="o">=</span> <span class="n">conv_layer</span><span class="p">(</span><span class="n">outputs</span><span class="p">)</span>
-        <span class="n">outputs</span> <span class="o">=</span> <span class="p">(</span><span class="n">outputs</span> <span class="o">+</span> <span class="n">res_inputs</span><span class="p">)</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">0.5</span><span class="p">)</span>
+        <span class="n">outputs</span> <span class="o">=</span> <span class="p">(</span><span class="n">outputs</span> <span class="o">+</span> <span class="n">res_inputs</span><span class="p">)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span>
 
     <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;linear_layer_after_cnn_layers&quot;</span><span class="p">):</span>
       <span class="n">outputs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">layers</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">](</span><span class="n">outputs</span><span class="p">)</span>
@@ -369,10 +379,10 @@ <h1>Source code for encoders.convs2s_encoder</h1><div class="highlight"><pre>
       <span class="c1"># Gradients are scaled as the gradients from</span>
       <span class="c1"># all decoder attention layers enters the encoder</span>
       <span class="n">scale</span> <span class="o">=</span> <span class="mf">1.0</span> <span class="o">/</span> <span class="p">(</span>
-          <span class="mf">2.0</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;att_layer_num&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;encoder_layers&quot;</span><span class="p">]))</span>
+          <span class="mf">2.0</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;att_layer_num&quot;</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
       <span class="n">outputs</span> <span class="o">=</span> <span class="p">(</span><span class="mf">1.0</span> <span class="o">-</span> <span class="n">scale</span><span class="p">)</span> <span class="o">*</span> <span class="n">tf</span><span class="o">.</span><span class="n">stop_gradient</span><span class="p">(</span><span class="n">outputs</span><span class="p">)</span> <span class="o">+</span> <span class="n">scale</span> <span class="o">*</span> <span class="n">outputs</span>
 
-      <span class="n">outputs_b</span> <span class="o">=</span> <span class="p">(</span><span class="n">outputs</span> <span class="o">+</span> <span class="n">encoder_inputs</span><span class="p">)</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">0.5</span><span class="p">)</span>
+      <span class="n">outputs_b</span> <span class="o">=</span> <span class="p">(</span><span class="n">outputs</span> <span class="o">+</span> <span class="n">encoder_inputs</span><span class="p">)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span>
 
       <span class="k">if</span> <span class="n">padding_mask</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
         <span class="n">outputs_b</span> <span class="o">*=</span> <span class="n">padding_mask</span>
diff --git a/docs/html/_modules/encoders/tacotron2_encoder.html b/docs/html/_modules/encoders/tacotron2_encoder.html
index 75ce88de8..27d5b10f7 100644
--- a/docs/html/_modules/encoders/tacotron2_encoder.html
+++ b/docs/html/_modules/encoders/tacotron2_encoder.html
@@ -213,7 +213,7 @@ <h1>Source code for encoders.tacotron2_encoder</h1><div class="highlight"><pre>
 
 <span class="sd">    Config parameters:</span>
 
-<span class="sd">    * **dropout_keep_prop** (float) --- keep probability for dropout.</span>
+<span class="sd">    * **dropout_keep_prob** (float) --- keep probability for dropout.</span>
 <span class="sd">    * **src_emb_size** (int) --- dimensionality of character embedding.</span>
 <span class="sd">    * **conv_layers** (list) --- list with the description of convolutional</span>
 <span class="sd">      layers. For example::</span>
@@ -254,21 +254,25 @@ <h1>Source code for encoders.tacotron2_encoder</h1><div class="highlight"><pre>
 
 <span class="sd">    Args:</span>
 <span class="sd">       input_dict (dict): dictionary with inputs.</span>
-<span class="sd">          Must define:</span>
-<span class="sd">              source_tensors - array containing [</span>
-<span class="sd">                * source_sequence: tensor of shape [batch_size, sequence length]</span>
-<span class="sd">                * src_length: tensor of shape [batch_size]</span>
-<span class="sd">              ]</span>
+<span class="sd">        Must define:</span>
+
+<span class="sd">            source_tensors - array containing [</span>
+
+<span class="sd">              * source_sequence: tensor of shape [batch_size, sequence length]</span>
+<span class="sd">              * src_length: tensor of shape [batch_size]</span>
+
+<span class="sd">            ]</span>
 
 <span class="sd">    Returns:</span>
-<span class="sd">      dict:</span>
-<span class="sd">        A python dictionary containing:</span>
+<span class="sd">      dict: A python dictionary containing:</span>
+
 <span class="sd">          * outputs - tensor containing the encoded text to be passed to the</span>
 <span class="sd">            attention layer</span>
 <span class="sd">          * src_length - the length of the encoded text</span>
 <span class="sd">    &quot;&quot;&quot;</span>
 
-    <span class="n">source_sequence</span><span class="p">,</span> <span class="n">src_length</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">]</span>
+    <span class="n">text</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">text_len</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">][</span><span class="mi">1</span><span class="p">]</span>
 
     <span class="n">training</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">==</span> <span class="s2">&quot;train&quot;</span><span class="p">)</span>
     <span class="n">dropout_keep_prob</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dropout_keep_prob&#39;</span><span class="p">]</span> <span class="k">if</span> <span class="n">training</span> <span class="k">else</span> <span class="mf">1.0</span>
@@ -277,6 +281,9 @@ <h1>Source code for encoders.tacotron2_encoder</h1><div class="highlight"><pre>
     <span class="n">src_vocab_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;src_vocab_size&#39;</span><span class="p">]</span>
     <span class="n">zoneout_prob</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;zoneout_prob&#39;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">)</span>
 
+    <span class="c1"># if src_vocab_size % 8 != 0:</span>
+    <span class="c1">#   src_vocab_size += 8 - (src_vocab_size % 8)</span>
+
     <span class="c1"># ----- Embedding layer -----------------------------------------------</span>
     <span class="n">enc_emb_w</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
         <span class="n">name</span><span class="o">=</span><span class="s2">&quot;EncoderEmbeddingMatrix&quot;</span><span class="p">,</span>
@@ -288,7 +295,7 @@ <h1>Source code for encoders.tacotron2_encoder</h1><div class="highlight"><pre>
     <span class="n">embedded_inputs</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span>
         <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">embedding_lookup</span><span class="p">(</span>
             <span class="n">enc_emb_w</span><span class="p">,</span>
-            <span class="n">source_sequence</span><span class="p">,</span>
+            <span class="n">text</span><span class="p">,</span>
         <span class="p">),</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;dtype&#39;</span><span class="p">]</span>
     <span class="p">)</span>
 
@@ -307,9 +314,9 @@ <h1>Source code for encoders.tacotron2_encoder</h1><div class="highlight"><pre>
       <span class="n">padding</span> <span class="o">=</span> <span class="n">conv_params</span><span class="p">[</span><span class="s1">&#39;padding&#39;</span><span class="p">]</span>
 
       <span class="k">if</span> <span class="n">padding</span> <span class="o">==</span> <span class="s2">&quot;VALID&quot;</span><span class="p">:</span>
-        <span class="n">src_length</span> <span class="o">=</span> <span class="p">(</span><span class="n">src_length</span> <span class="o">-</span> <span class="n">kernel_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">//</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+        <span class="n">text_len</span> <span class="o">=</span> <span class="p">(</span><span class="n">text_len</span> <span class="o">-</span> <span class="n">kernel_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">//</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
       <span class="k">else</span><span class="p">:</span>
-        <span class="n">src_length</span> <span class="o">=</span> <span class="p">(</span><span class="n">src_length</span> <span class="o">+</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span> <span class="o">//</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+        <span class="n">text_len</span> <span class="o">=</span> <span class="p">(</span><span class="n">text_len</span> <span class="o">+</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span> <span class="o">//</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
 
       <span class="n">top_layer</span> <span class="o">=</span> <span class="n">conv_bn_actv</span><span class="p">(</span>
           <span class="n">layer_type</span><span class="o">=</span><span class="s2">&quot;conv1d&quot;</span><span class="p">,</span>
@@ -388,7 +395,7 @@ <h1>Source code for encoders.tacotron2_encoder</h1><div class="highlight"><pre>
           <span class="n">top_layer</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">dynamic_rnn</span><span class="p">(</span>
               <span class="n">cell</span><span class="o">=</span><span class="n">multirnn_cell_fw</span><span class="p">,</span>
               <span class="n">inputs</span><span class="o">=</span><span class="n">rnn_input</span><span class="p">,</span>
-              <span class="n">sequence_length</span><span class="o">=</span><span class="n">src_length</span><span class="p">,</span>
+              <span class="n">sequence_length</span><span class="o">=</span><span class="n">text_len</span><span class="p">,</span>
               <span class="n">dtype</span><span class="o">=</span><span class="n">rnn_input</span><span class="o">.</span><span class="n">dtype</span><span class="p">,</span>
               <span class="n">time_major</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
           <span class="p">)</span>
@@ -408,7 +415,7 @@ <h1>Source code for encoders.tacotron2_encoder</h1><div class="highlight"><pre>
               <span class="n">cell_fw</span><span class="o">=</span><span class="n">multirnn_cell_fw</span><span class="p">,</span>
               <span class="n">cell_bw</span><span class="o">=</span><span class="n">multirnn_cell_bw</span><span class="p">,</span>
               <span class="n">inputs</span><span class="o">=</span><span class="n">rnn_input</span><span class="p">,</span>
-              <span class="n">sequence_length</span><span class="o">=</span><span class="n">src_length</span><span class="p">,</span>
+              <span class="n">sequence_length</span><span class="o">=</span><span class="n">text_len</span><span class="p">,</span>
               <span class="n">dtype</span><span class="o">=</span><span class="n">rnn_input</span><span class="o">.</span><span class="n">dtype</span><span class="p">,</span>
               <span class="n">time_major</span><span class="o">=</span><span class="kc">False</span>
           <span class="p">)</span>
@@ -438,7 +445,7 @@ <h1>Source code for encoders.tacotron2_encoder</h1><div class="highlight"><pre>
 
     <span class="k">return</span> <span class="p">{</span>
         <span class="s1">&#39;outputs&#39;</span><span class="p">:</span> <span class="n">outputs</span><span class="p">,</span>
-        <span class="s1">&#39;src_length&#39;</span><span class="p">:</span> <span class="n">src_length</span><span class="p">,</span>
+        <span class="s1">&#39;src_length&#39;</span><span class="p">:</span> <span class="n">text_len</span>
     <span class="p">}</span></div></div>
 </pre></div>
 
diff --git a/docs/html/_modules/encoders/w2l_encoder.html b/docs/html/_modules/encoders/w2l_encoder.html
index 787e06be1..1657faa65 100644
--- a/docs/html/_modules/encoders/w2l_encoder.html
+++ b/docs/html/_modules/encoders/w2l_encoder.html
@@ -162,7 +162,7 @@ <h1>Source code for encoders.w2l_encoder</h1><div class="highlight"><pre>
 <span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 
 <span class="kn">from</span> <span class="nn">.encoder</span> <span class="k">import</span> <span class="n">Encoder</span>
-<span class="kn">from</span> <span class="nn">open_seq2seq.parts.cnns.conv_blocks</span> <span class="k">import</span> <span class="n">conv_actv</span><span class="p">,</span> <span class="n">conv_bn_actv</span>
+<span class="kn">from</span> <span class="nn">open_seq2seq.parts.cnns.conv_blocks</span> <span class="k">import</span> <span class="n">conv_actv</span><span class="p">,</span> <span class="n">conv_bn_actv</span><span class="p">,</span> <span class="n">conv_ln_actv</span><span class="p">,</span> <span class="n">conv_in_actv</span>
 
 
 <div class="viewcode-block" id="Wave2LetterEncoder"><a class="viewcode-back" href="../../api-docs/encoders.html#encoders.w2l_encoder.Wave2LetterEncoder">[docs]</a><span class="k">class</span> <span class="nc">Wave2LetterEncoder</span><span class="p">(</span><span class="n">Encoder</span><span class="p">):</span>
@@ -180,7 +180,7 @@ <h1>Source code for encoders.w2l_encoder</h1><div class="highlight"><pre>
   <span class="k">def</span> <span class="nf">get_optional_params</span><span class="p">():</span>
     <span class="k">return</span> <span class="nb">dict</span><span class="p">(</span><span class="n">Encoder</span><span class="o">.</span><span class="n">get_optional_params</span><span class="p">(),</span> <span class="o">**</span><span class="p">{</span>
         <span class="s1">&#39;data_format&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;channels_first&#39;</span><span class="p">,</span> <span class="s1">&#39;channels_last&#39;</span><span class="p">],</span>
-        <span class="s1">&#39;normalization&#39;</span><span class="p">:</span> <span class="p">[</span><span class="kc">None</span><span class="p">,</span> <span class="s1">&#39;batch_norm&#39;</span><span class="p">],</span>
+        <span class="s1">&#39;normalization&#39;</span><span class="p">:</span> <span class="p">[</span><span class="kc">None</span><span class="p">,</span> <span class="s1">&#39;batch_norm&#39;</span><span class="p">,</span> <span class="s1">&#39;layer_norm&#39;</span><span class="p">,</span> <span class="s1">&#39;instance_norm&#39;</span><span class="p">],</span>
         <span class="s1">&#39;bn_momentum&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
         <span class="s1">&#39;bn_epsilon&#39;</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
     <span class="p">})</span></div>
@@ -265,6 +265,10 @@ <h1>Source code for encoders.w2l_encoder</h1><div class="highlight"><pre>
       <span class="n">normalization_params</span><span class="p">[</span><span class="s1">&#39;bn_momentum&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
           <span class="s1">&#39;bn_momentum&#39;</span><span class="p">,</span> <span class="mf">0.90</span><span class="p">)</span>
       <span class="n">normalization_params</span><span class="p">[</span><span class="s1">&#39;bn_epsilon&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;bn_epsilon&#39;</span><span class="p">,</span> <span class="mf">1e-3</span><span class="p">)</span>
+    <span class="k">elif</span> <span class="n">normalization</span> <span class="o">==</span> <span class="s2">&quot;layer_norm&quot;</span><span class="p">:</span>
+      <span class="n">conv_block</span> <span class="o">=</span> <span class="n">conv_ln_actv</span>
+    <span class="k">elif</span> <span class="n">normalization</span> <span class="o">==</span> <span class="s2">&quot;instance_norm&quot;</span><span class="p">:</span>
+      <span class="n">conv_block</span> <span class="o">=</span> <span class="n">conv_in_actv</span>
     <span class="k">else</span><span class="p">:</span>
       <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Incorrect normalization&quot;</span><span class="p">)</span>
 
@@ -284,10 +288,15 @@ <h1>Source code for encoders.w2l_encoder</h1><div class="highlight"><pre>
       <span class="n">kernel_size</span> <span class="o">=</span> <span class="n">convnet_layers</span><span class="p">[</span><span class="n">idx_convnet</span><span class="p">][</span><span class="s1">&#39;kernel_size&#39;</span><span class="p">]</span>
       <span class="n">strides</span> <span class="o">=</span> <span class="n">convnet_layers</span><span class="p">[</span><span class="n">idx_convnet</span><span class="p">][</span><span class="s1">&#39;stride&#39;</span><span class="p">]</span>
       <span class="n">padding</span> <span class="o">=</span> <span class="n">convnet_layers</span><span class="p">[</span><span class="n">idx_convnet</span><span class="p">][</span><span class="s1">&#39;padding&#39;</span><span class="p">]</span>
+      <span class="n">dilation</span> <span class="o">=</span> <span class="n">convnet_layers</span><span class="p">[</span><span class="n">idx_convnet</span><span class="p">][</span><span class="s1">&#39;dilation&#39;</span><span class="p">]</span>
       <span class="n">dropout_keep</span> <span class="o">=</span> <span class="n">convnet_layers</span><span class="p">[</span><span class="n">idx_convnet</span><span class="p">]</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
           <span class="s1">&#39;dropout_keep_prob&#39;</span><span class="p">,</span> <span class="n">dropout_keep_prob</span><span class="p">)</span> <span class="k">if</span> <span class="n">training</span> <span class="k">else</span> <span class="mf">1.0</span>
 
       <span class="k">for</span> <span class="n">idx_layer</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">layer_repeat</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">padding</span> <span class="o">==</span> <span class="s2">&quot;VALID&quot;</span><span class="p">:</span>
+          <span class="n">src_length</span> <span class="o">=</span> <span class="p">(</span><span class="n">src_length</span> <span class="o">-</span> <span class="n">kernel_size</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">//</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span>
+        <span class="k">else</span><span class="p">:</span>
+          <span class="n">src_length</span> <span class="o">=</span> <span class="p">(</span><span class="n">src_length</span> <span class="o">+</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span> <span class="o">//</span> <span class="n">strides</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
         <span class="n">conv_feats</span> <span class="o">=</span> <span class="n">conv_block</span><span class="p">(</span>
             <span class="n">layer_type</span><span class="o">=</span><span class="n">layer_type</span><span class="p">,</span>
             <span class="n">name</span><span class="o">=</span><span class="s2">&quot;conv</span><span class="si">{}{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
@@ -298,6 +307,7 @@ <h1>Source code for encoders.w2l_encoder</h1><div class="highlight"><pre>
             <span class="n">activation_fn</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;activation_fn&#39;</span><span class="p">],</span>
             <span class="n">strides</span><span class="o">=</span><span class="n">strides</span><span class="p">,</span>
             <span class="n">padding</span><span class="o">=</span><span class="n">padding</span><span class="p">,</span>
+            <span class="n">dilation</span><span class="o">=</span><span class="n">dilation</span><span class="p">,</span>
             <span class="n">regularizer</span><span class="o">=</span><span class="n">regularizer</span><span class="p">,</span>
             <span class="n">training</span><span class="o">=</span><span class="n">training</span><span class="p">,</span>
             <span class="n">data_format</span><span class="o">=</span><span class="n">data_format</span><span class="p">,</span>
diff --git a/docs/html/_modules/losses/sequence_loss.html b/docs/html/_modules/losses/sequence_loss.html
index be5a99641..22f46d581 100644
--- a/docs/html/_modules/losses/sequence_loss.html
+++ b/docs/html/_modules/losses/sequence_loss.html
@@ -463,6 +463,136 @@ <h1>Source code for losses.sequence_loss</h1><div class="highlight"><pre>
       <span class="n">loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reduce_sum</span><span class="p">(</span><span class="n">xentropy</span> <span class="o">*</span> <span class="n">weights</span><span class="p">)</span> <span class="o">/</span> <span class="n">tf</span><span class="o">.</span><span class="n">reduce_sum</span><span class="p">(</span><span class="n">weights</span><span class="p">)</span>
 
       <span class="k">return</span> <span class="n">loss</span></div>
+
+
+<div class="viewcode-block" id="BasicSampledSequenceLoss"><a class="viewcode-back" href="../../api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss">[docs]</a><span class="k">class</span> <span class="nc">BasicSampledSequenceLoss</span><span class="p">(</span><span class="n">Loss</span><span class="p">):</span>
+  <span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">  Basic sequence-to-sequence loss. This one does not use one-hot encodings</span>
+<span class="sd">  &quot;&quot;&quot;</span>
+<div class="viewcode-block" id="BasicSampledSequenceLoss.get_required_params"><a class="viewcode-back" href="../../api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss.get_required_params">[docs]</a>  <span class="nd">@staticmethod</span>
+  <span class="k">def</span> <span class="nf">get_required_params</span><span class="p">():</span>
+    <span class="k">return</span> <span class="nb">dict</span><span class="p">(</span><span class="n">Loss</span><span class="o">.</span><span class="n">get_required_params</span><span class="p">(),</span> <span class="o">**</span><span class="p">{</span>
+        <span class="s1">&#39;tgt_vocab_size&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+        <span class="s1">&#39;batch_size&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+    <span class="p">})</span></div>
+
+<div class="viewcode-block" id="BasicSampledSequenceLoss.get_optional_params"><a class="viewcode-back" href="../../api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss.get_optional_params">[docs]</a>  <span class="nd">@staticmethod</span>
+  <span class="k">def</span> <span class="nf">get_optional_params</span><span class="p">():</span>
+    <span class="k">return</span> <span class="nb">dict</span><span class="p">(</span><span class="n">Loss</span><span class="o">.</span><span class="n">get_optional_params</span><span class="p">(),</span> <span class="o">**</span><span class="p">{</span>
+        <span class="s1">&#39;offset_target_by_one&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+        <span class="s1">&#39;average_across_timestep&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+        <span class="s1">&#39;do_mask&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+        <span class="s1">&#39;hid_dim&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+    <span class="p">})</span></div>
+
+<div class="viewcode-block" id="BasicSampledSequenceLoss.__init__"><a class="viewcode-back" href="../../api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss.__init__">[docs]</a>  <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">params</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s2">&quot;basic_sampled_sequence_loss&quot;</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot;Constructor.</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">      params (dict): dictionary with loss parameters.</span>
+<span class="sd">        Should contain the following:</span>
+<span class="sd">        * tgt_vocab_size: Target vocabulary size</span>
+<span class="sd">        * batch_size_per_gpu: Size of the per-worker batch</span>
+<span class="sd">        * offset_target_by_one: (default: True). Keep it true for</span>
+<span class="sd">        auto-regressive models</span>
+<span class="sd">        * average_across_timestep: (default: False). If True, will average</span>
+<span class="sd">          loss across timesteps, else it will sum across timesteps</span>
+<span class="sd">        * do_mask: (default: True) whether to mask based on tgt_lengths</span>
+<span class="sd">          (which is passed as part of loss_input_dict to compute_loss</span>
+<span class="sd">          and has to be not None then)</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="nb">super</span><span class="p">(</span><span class="n">BasicSampledSequenceLoss</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">name</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;tgt_vocab_size&quot;</span><span class="p">]</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_batch_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;batch_size&quot;</span><span class="p">]</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_offset_target_by_one</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;offset_target_by_one&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_average_across_timestep</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;average_across_timestep&quot;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_do_mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;do_mask&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span></div>
+
+<div class="viewcode-block" id="BasicSampledSequenceLoss._compute_loss"><a class="viewcode-back" href="../../api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss._compute_loss">[docs]</a>  <span class="k">def</span> <span class="nf">_compute_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dict</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot;Computes cross entropy based sequence-to-sequence loss.</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">      input_dict (dict): inputs to compute loss::</span>
+<span class="sd">        {</span>
+<span class="sd">              &quot;logits&quot;: logits tensor of shape [batch_size, T, dim]</span>
+<span class="sd">              &quot;target_sequence&quot;: tensor of shape [batch_size, T]</span>
+<span class="sd">              &quot;tgt_lengths&quot;: tensor of shape [batch_size] or None</span>
+<span class="sd">        }</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">       Singleton loss tensor</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">target_sequence</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;target_tensors&#39;</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">tgt_lengths</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;target_tensors&#39;</span><span class="p">][</span><span class="mi">1</span><span class="p">]</span>
+
+    <span class="k">if</span> <span class="s1">&#39;weights&#39;</span> <span class="ow">in</span> <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;decoder_output&#39;</span><span class="p">]:</span>
+      <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;DOING SAMPLED LOSS&#39;</span><span class="p">)</span>
+      <span class="n">inputs</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s2">&quot;decoder_output&quot;</span><span class="p">][</span><span class="s1">&#39;inputs&#39;</span><span class="p">]</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">_hid_dim</span> <span class="o">=</span> <span class="n">inputs</span><span class="o">.</span><span class="n">get_shape</span><span class="p">()</span><span class="o">.</span><span class="n">as_list</span><span class="p">()[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+      <span class="n">inputs</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">inputs</span><span class="p">,</span> <span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hid_dim</span><span class="p">))</span>
+      <span class="n">targets</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">target_sequence</span><span class="p">,</span> <span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
+      <span class="n">crossent</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">sampled_softmax_loss</span><span class="p">(</span><span class="n">input_dict</span><span class="p">[</span><span class="s2">&quot;decoder_output&quot;</span><span class="p">][</span><span class="s1">&#39;weights&#39;</span><span class="p">],</span> 
+                                            <span class="n">input_dict</span><span class="p">[</span><span class="s2">&quot;decoder_output&quot;</span><span class="p">][</span><span class="s1">&#39;bias&#39;</span><span class="p">],</span> 
+                                            <span class="n">targets</span><span class="p">,</span> 
+                                            <span class="n">inputs</span><span class="p">,</span>
+                                            <span class="n">input_dict</span><span class="p">[</span><span class="s1">&#39;decoder_output&#39;</span><span class="p">][</span><span class="s1">&#39;num_sampled&#39;</span><span class="p">],</span>
+                                            <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span><span class="p">)</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_average_across_timestep</span><span class="p">:</span>
+        <span class="n">loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reduce_mean</span><span class="p">(</span><span class="n">crossent</span><span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reduce_sum</span><span class="p">(</span><span class="n">crossent</span><span class="p">)</span>
+        <span class="n">loss</span> <span class="o">/=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_batch_size</span>
+
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">logits</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="s2">&quot;decoder_output&quot;</span><span class="p">][</span><span class="s2">&quot;logits&quot;</span><span class="p">]</span>
+
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_offset_target_by_one</span><span class="p">:</span>
+        <span class="c1"># this is necessary for auto-regressive models</span>
+        <span class="n">current_ts</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">to_int32</span><span class="p">(</span><span class="n">tf</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span>
+            <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">target_sequence</span><span class="p">)[</span><span class="mi">1</span><span class="p">],</span>
+            <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">logits</span><span class="p">)[</span><span class="mi">1</span><span class="p">],</span>
+        <span class="p">))</span> <span class="o">-</span> <span class="mi">1</span>
+
+        <span class="n">logits</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">slice</span><span class="p">(</span>
+            <span class="n">logits</span><span class="p">,</span>
+            <span class="n">begin</span><span class="o">=</span><span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">],</span>
+            <span class="n">size</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">current_ts</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">],</span>
+        <span class="p">)</span>                                 
+        <span class="n">target_sequence</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">slice</span><span class="p">(</span><span class="n">target_sequence</span><span class="p">,</span>
+                                   <span class="n">begin</span><span class="o">=</span><span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span>
+                                   <span class="n">size</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">current_ts</span><span class="p">])</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">current_ts</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">to_int32</span><span class="p">(</span><span class="n">tf</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span>
+            <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">target_sequence</span><span class="p">)[</span><span class="mi">1</span><span class="p">],</span>
+            <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">logits</span><span class="p">)[</span><span class="mi">1</span><span class="p">],</span>
+        <span class="p">))</span>
+
+      <span class="c1"># Cast logits after potential slice</span>
+      <span class="k">if</span> <span class="n">logits</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">base_dtype</span> <span class="o">!=</span> <span class="n">tf</span><span class="o">.</span><span class="n">float32</span><span class="p">:</span>
+        <span class="n">logits</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span><span class="n">logits</span><span class="p">,</span> <span class="n">tf</span><span class="o">.</span><span class="n">float32</span><span class="p">)</span>
+
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_do_mask</span><span class="p">:</span>
+        <span class="k">if</span> <span class="n">tgt_lengths</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+          <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;If you are masking loss, tgt_lengths can&#39;t be None&quot;</span><span class="p">)</span>
+        <span class="n">mask</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">sequence_mask</span><span class="p">(</span><span class="n">lengths</span><span class="o">=</span><span class="n">tgt_lengths</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span>
+                                <span class="n">maxlen</span><span class="o">=</span><span class="n">current_ts</span><span class="p">,</span>
+                                <span class="n">dtype</span><span class="o">=</span><span class="n">logits</span><span class="o">.</span><span class="n">dtype</span><span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">mask</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span><span class="n">tf</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">target_sequence</span><span class="p">),</span> <span class="n">logits</span><span class="o">.</span><span class="n">dtype</span><span class="p">)</span>
+
+      <span class="n">crossent</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">sparse_softmax_cross_entropy_with_logits</span><span class="p">(</span>
+          <span class="n">labels</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">target_sequence</span><span class="p">,</span> <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]),</span>
+          <span class="n">logits</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">logits</span><span class="p">,</span> <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tgt_vocab_size</span><span class="p">]),</span>
+      <span class="p">)</span>
+
+
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_average_across_timestep</span><span class="p">:</span>
+        <span class="n">loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reduce_mean</span><span class="p">(</span><span class="n">crossent</span> <span class="o">*</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">mask</span><span class="p">,</span> <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]))</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reduce_sum</span><span class="p">(</span><span class="n">crossent</span> <span class="o">*</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">mask</span><span class="p">,</span> <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]))</span>
+        <span class="n">loss</span> <span class="o">/=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_batch_size</span>
+    <span class="k">return</span> <span class="n">loss</span></div></div>
+   
 </pre></div>
 
            </div>
diff --git a/docs/html/_modules/losses/tacotron_loss.html b/docs/html/_modules/losses/tacotron_loss.html
index 0555b0c12..4494fa548 100644
--- a/docs/html/_modules/losses/tacotron_loss.html
+++ b/docs/html/_modules/losses/tacotron_loss.html
@@ -158,7 +158,6 @@ <h1>Source code for losses.tacotron_loss</h1><div class="highlight"><pre>
 <span></span><span class="c1"># Copyright (c) 2018 NVIDIA Corporation</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
-<span class="kn">from</span> <span class="nn">six.moves</span> <span class="k">import</span> <span class="nb">range</span>
 
 <span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 
@@ -169,6 +168,7 @@ <h1>Source code for losses.tacotron_loss</h1><div class="highlight"><pre>
 
   <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">params</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s2">&quot;tacotron_loss&quot;</span><span class="p">):</span>
     <span class="nb">super</span><span class="p">(</span><span class="n">TacotronLoss</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">name</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_n_feats</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span>
 
 <div class="viewcode-block" id="TacotronLoss.get_optional_params"><a class="viewcode-back" href="../../api-docs/losses.html#losses.tacotron_loss.TacotronLoss.get_optional_params">[docs]</a>  <span class="k">def</span> <span class="nf">get_optional_params</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Static method with description of optional parameters.</span>
@@ -189,19 +189,25 @@ <h1>Source code for losses.tacotron_loss</h1><div class="highlight"><pre>
 <span class="sd">    Args:</span>
 <span class="sd">      input_dict (dict): inputs to compute loss. Contains:</span>
 
-<span class="sd">          &quot;decoder_output&quot;: dicionary containing:</span>
+<span class="sd">          * &quot;decoder_output&quot;: dicionary containing:</span>
+
 <span class="sd">              &quot;outputs&quot;: array containing [</span>
+
 <span class="sd">                  * decoder_predictions: spectrogram predicted by the decoder</span>
 <span class="sd">                    rnn of shape [batch, time, feats]</span>
 <span class="sd">                  * post_net_predictions: spectrogram after adding the residual</span>
 <span class="sd">                    corrections from the post net of shape [batch, time, feats]</span>
 <span class="sd">                  * stop_token_predictions: stop_token predictions of shape</span>
 <span class="sd">                    [batch, time, 1]</span>
+
 <span class="sd">              ]</span>
-<span class="sd">          &quot;target_tensors&quot;: array containing [</span>
+
+<span class="sd">          * &quot;target_tensors&quot;: array containing [</span>
+
 <span class="sd">              * spec: the true spectrogram of shape [batch, time, feats]</span>
 <span class="sd">              * stop_token: the stop_token of shape [batch, time]</span>
-<span class="sd">          ]</span>
+
+<span class="sd">            ]</span>
 
 <span class="sd">    Returns:</span>
 <span class="sd">       Singleton loss tensor</span>
@@ -232,7 +238,7 @@ <h1>Source code for losses.tacotron_loss</h1><div class="highlight"><pre>
         <span class="p">)</span>
     <span class="p">)</span>
 
-    <span class="n">predictions_pad</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span>
+    <span class="n">post_net_pad</span> <span class="o">=</span> <span class="n">decoder_pad</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span>
         <span class="p">[</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">max_length</span> <span class="o">-</span> <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">decoder_predictions</span><span class="p">)[</span><span class="mi">1</span><span class="p">],</span> <span class="n">num_feats</span><span class="p">]</span>
     <span class="p">)</span>
     <span class="n">stop_token_pred_pad</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span>
@@ -241,10 +247,10 @@ <h1>Source code for losses.tacotron_loss</h1><div class="highlight"><pre>
     <span class="n">spec_pad</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">([</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">max_length</span> <span class="o">-</span> <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">spec</span><span class="p">)[</span><span class="mi">1</span><span class="p">],</span> <span class="n">num_feats</span><span class="p">])</span>
     <span class="n">stop_token_pad</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">zeros</span><span class="p">([</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">max_length</span> <span class="o">-</span> <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">spec</span><span class="p">)[</span><span class="mi">1</span><span class="p">],</span> <span class="mi">1</span><span class="p">])</span>
     <span class="n">decoder_predictions</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
-        <span class="p">[</span><span class="n">decoder_predictions</span><span class="p">,</span> <span class="n">predictions_pad</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
+        <span class="p">[</span><span class="n">decoder_predictions</span><span class="p">,</span> <span class="n">decoder_pad</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
     <span class="p">)</span>
     <span class="n">post_net_predictions</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
-        <span class="p">[</span><span class="n">post_net_predictions</span><span class="p">,</span> <span class="n">predictions_pad</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
+        <span class="p">[</span><span class="n">post_net_predictions</span><span class="p">,</span> <span class="n">post_net_pad</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
     <span class="p">)</span>
     <span class="n">stop_token_predictions</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
         <span class="p">[</span><span class="n">stop_token_predictions</span><span class="p">,</span> <span class="n">stop_token_pred_pad</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
@@ -252,16 +258,19 @@ <h1>Source code for losses.tacotron_loss</h1><div class="highlight"><pre>
     <span class="n">spec</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">spec</span><span class="p">,</span> <span class="n">spec_pad</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
     <span class="n">stop_token</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">stop_token</span><span class="p">,</span> <span class="n">stop_token_pad</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
 
+    <span class="n">decoder_target</span> <span class="o">=</span> <span class="n">spec</span>
+    <span class="n">post_net_target</span> <span class="o">=</span> <span class="n">spec</span>
+
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;use_mask&quot;</span><span class="p">,</span> <span class="kc">True</span><span class="p">):</span>
       <span class="n">mask</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">sequence_mask</span><span class="p">(</span>
           <span class="n">lengths</span><span class="o">=</span><span class="n">spec_lengths</span><span class="p">,</span> <span class="n">maxlen</span><span class="o">=</span><span class="n">max_length</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">float32</span>
       <span class="p">)</span>
       <span class="n">mask</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">expand_dims</span><span class="p">(</span><span class="n">mask</span><span class="p">,</span> <span class="n">axis</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span>
       <span class="n">decoder_loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">losses</span><span class="o">.</span><span class="n">mean_squared_error</span><span class="p">(</span>
-          <span class="n">labels</span><span class="o">=</span><span class="n">spec</span><span class="p">,</span> <span class="n">predictions</span><span class="o">=</span><span class="n">decoder_predictions</span><span class="p">,</span> <span class="n">weights</span><span class="o">=</span><span class="n">mask</span>
+          <span class="n">labels</span><span class="o">=</span><span class="n">decoder_target</span><span class="p">,</span> <span class="n">predictions</span><span class="o">=</span><span class="n">decoder_predictions</span><span class="p">,</span> <span class="n">weights</span><span class="o">=</span><span class="n">mask</span>
       <span class="p">)</span>
       <span class="n">post_net_loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">losses</span><span class="o">.</span><span class="n">mean_squared_error</span><span class="p">(</span>
-          <span class="n">labels</span><span class="o">=</span><span class="n">spec</span><span class="p">,</span> <span class="n">predictions</span><span class="o">=</span><span class="n">post_net_predictions</span><span class="p">,</span> <span class="n">weights</span><span class="o">=</span><span class="n">mask</span>
+          <span class="n">labels</span><span class="o">=</span><span class="n">post_net_target</span><span class="p">,</span> <span class="n">predictions</span><span class="o">=</span><span class="n">post_net_predictions</span><span class="p">,</span> <span class="n">weights</span><span class="o">=</span><span class="n">mask</span>
       <span class="p">)</span>
       <span class="n">stop_token_loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">sigmoid_cross_entropy_with_logits</span><span class="p">(</span>
           <span class="n">labels</span><span class="o">=</span><span class="n">stop_token</span><span class="p">,</span> <span class="n">logits</span><span class="o">=</span><span class="n">stop_token_predictions</span>
@@ -271,10 +280,10 @@ <h1>Source code for losses.tacotron_loss</h1><div class="highlight"><pre>
 
     <span class="k">else</span><span class="p">:</span>
       <span class="n">decoder_loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">losses</span><span class="o">.</span><span class="n">mean_squared_error</span><span class="p">(</span>
-          <span class="n">labels</span><span class="o">=</span><span class="n">spec</span><span class="p">,</span> <span class="n">predictions</span><span class="o">=</span><span class="n">decoder_predictions</span>
+          <span class="n">labels</span><span class="o">=</span><span class="n">decoder_target</span><span class="p">,</span> <span class="n">predictions</span><span class="o">=</span><span class="n">decoder_predictions</span>
       <span class="p">)</span>
       <span class="n">post_net_loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">losses</span><span class="o">.</span><span class="n">mean_squared_error</span><span class="p">(</span>
-          <span class="n">labels</span><span class="o">=</span><span class="n">spec</span><span class="p">,</span> <span class="n">predictions</span><span class="o">=</span><span class="n">post_net_predictions</span>
+          <span class="n">labels</span><span class="o">=</span><span class="n">post_net_target</span><span class="p">,</span> <span class="n">predictions</span><span class="o">=</span><span class="n">post_net_predictions</span>
       <span class="p">)</span>
       <span class="n">stop_token_loss</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">sigmoid_cross_entropy_with_logits</span><span class="p">(</span>
           <span class="n">labels</span><span class="o">=</span><span class="n">stop_token</span><span class="p">,</span> <span class="n">logits</span><span class="o">=</span><span class="n">stop_token_predictions</span>
diff --git a/docs/html/_modules/models/model.html b/docs/html/_modules/models/model.html
index 724ea882e..9e261b93a 100644
--- a/docs/html/_modules/models/model.html
+++ b/docs/html/_modules/models/model.html
@@ -158,15 +158,14 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
 <span></span><span class="c1"># Copyright (c) 2017 NVIDIA Corporation</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
+<span class="kn">from</span> <span class="nn">six.moves</span> <span class="k">import</span> <span class="nb">range</span>
 
 <span class="kn">import</span> <span class="nn">abc</span>
-<span class="kn">import</span> <span class="nn">copy</span>
-<span class="kn">import</span> <span class="nn">time</span>
-
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
 <span class="kn">import</span> <span class="nn">six</span>
-<span class="kn">from</span> <span class="nn">six.moves</span> <span class="k">import</span> <span class="nb">range</span>
 <span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">import</span> <span class="nn">time</span>
 
 <span class="k">try</span><span class="p">:</span>
   <span class="kn">from</span> <span class="nn">inspect</span> <span class="k">import</span> <span class="n">signature</span>
@@ -220,7 +219,11 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
         <span class="s1">&#39;print_samples_steps&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>  <span class="c1"># could be int or None</span>
         <span class="s1">&#39;print_bench_info_steps&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>  <span class="c1"># could be int or None</span>
         <span class="s1">&#39;save_checkpoint_steps&#39;</span><span class="p">:</span> <span class="kc">None</span><span class="p">,</span>  <span class="c1"># could be int or None</span>
+        <span class="s1">&#39;restore_best_checkpoint&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="c1"># whether to restore best check point</span>
         <span class="s1">&#39;eval_steps&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+        <span class="s1">&#39;base_logdir&#39;</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+        <span class="s1">&#39;finetune&#39;</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+        <span class="s1">&#39;eval_batch_size_per_gpu&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
 
         <span class="s1">&#39;random_seed&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
         <span class="s1">&#39;num_epochs&#39;</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
@@ -360,6 +363,11 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
 
     <span class="c1"># parameter checks</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">=</span> <span class="n">mode</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_interactive</span> <span class="o">=</span> <span class="kc">False</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">==</span> <span class="s2">&quot;interactive_infer&quot;</span><span class="p">:</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="o">=</span> <span class="s2">&quot;infer&quot;</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">_interactive</span> <span class="o">=</span> <span class="kc">True</span>
+
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span><span class="s2">&quot;train&quot;</span><span class="p">,</span> <span class="s2">&quot;infer&quot;</span><span class="p">,</span> <span class="s2">&quot;eval&quot;</span><span class="p">]:</span>
       <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Mode has to be one of [&#39;train&#39;, &#39;infer&#39;, &#39;eval&#39;]&quot;</span><span class="p">)</span>
 
@@ -382,6 +390,13 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
     <span class="k">if</span> <span class="s1">&#39;print_bench_info_steps&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;print_bench_info_steps&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
 
+    <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;finetune&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;finetune&#39;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;base_logdir&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;base_logdir&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;eval_batch_size_per_gpu&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
+        <span class="s1">&#39;eval_batch_size_per_gpu&#39;</span><span class="p">,</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;batch_size_per_gpu&#39;</span><span class="p">]</span>
+    <span class="p">)</span>
+
     <span class="c1"># checking that frequencies of samples and loss are aligned</span>
     <span class="n">s_fr</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;print_samples_steps&#39;</span><span class="p">]</span>
     <span class="n">l_fr</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;print_loss_steps&#39;</span><span class="p">]</span>
@@ -401,6 +416,9 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
         <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;Either &quot;gpu_ids&quot; or &quot;num_gpus&quot; has to &#39;</span>
                          <span class="s1">&#39;be specified in the config&#39;</span><span class="p">)</span>
 
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_interactive</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_gpu_ids</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Interactive infer is meant to be used with 1 gpu&quot;</span><span class="p">)</span>
+
     <span class="c1"># setting random seed</span>
     <span class="n">rs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;random_seed&#39;</span><span class="p">,</span> <span class="nb">int</span><span class="p">(</span><span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()))</span>
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">on_horovod</span><span class="p">:</span>
@@ -412,8 +430,12 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
       <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;dtype&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">float32</span>
 
     <span class="n">dl_params</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;data_layer_params&#39;</span><span class="p">,</span> <span class="p">{})</span>
-    <span class="n">dl_params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;batch_size_per_gpu&#39;</span><span class="p">]</span>
+    <span class="k">if</span> <span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train&#39;</span><span class="p">:</span>
+      <span class="n">dl_params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;batch_size_per_gpu&#39;</span><span class="p">]</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">dl_params</span><span class="p">[</span><span class="s1">&#39;batch_size&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;eval_batch_size_per_gpu&#39;</span><span class="p">]</span>
     <span class="n">dl_params</span><span class="p">[</span><span class="s1">&#39;mode&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_mode</span>
+    <span class="n">dl_params</span><span class="p">[</span><span class="s1">&#39;interactive&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_interactive</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">on_horovod</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_data_layer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_params</span><span class="p">[</span><span class="s1">&#39;data_layer&#39;</span><span class="p">](</span>
@@ -462,7 +484,7 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">_num_objects_per_step</span> <span class="o">=</span> <span class="kc">None</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">skip_update_ph</span> <span class="o">=</span> <span class="kc">None</span></div>
 
-<div class="viewcode-block" id="Model.compile"><a class="viewcode-back" href="../../api-docs/models.html#models.model.Model.compile">[docs]</a>  <span class="k">def</span> <span class="nf">compile</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">force_var_reuse</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+<div class="viewcode-block" id="Model.compile"><a class="viewcode-back" href="../../api-docs/models.html#models.model.Model.compile">[docs]</a>  <span class="k">def</span> <span class="nf">compile</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">force_var_reuse</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">checkpoint</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">use_trt</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">precision</span><span class="o">=</span><span class="s1">&#39;FP32&#39;</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;TensorFlow graph is built here.&quot;&quot;&quot;</span>
     <span class="k">if</span> <span class="s1">&#39;initializer&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">:</span>
       <span class="n">initializer</span> <span class="o">=</span> <span class="kc">None</span>
@@ -483,12 +505,18 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
         <span class="p">):</span>
           <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Building graph on GPU:</span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">gpu_id</span><span class="p">))</span>
 
-          <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">(</span><span class="n">gpu_cnt</span><span class="p">)</span><span class="o">.</span><span class="n">build_graph</span><span class="p">()</span>
+          <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_interactive</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">(</span><span class="n">gpu_cnt</span><span class="p">)</span><span class="o">.</span><span class="n">create_interactive_placeholders</span><span class="p">()</span>
+          <span class="k">else</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">(</span><span class="n">gpu_cnt</span><span class="p">)</span><span class="o">.</span><span class="n">build_graph</span><span class="p">()</span>
           <span class="n">input_tensors</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">(</span><span class="n">gpu_cnt</span><span class="p">)</span><span class="o">.</span><span class="n">input_tensors</span>
 
-          <span class="n">loss</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_cnt</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_build_forward_pass_graph</span><span class="p">(</span>
+          <span class="n">loss</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_cnt</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">build_forward_pass_graph</span><span class="p">(</span>
               <span class="n">input_tensors</span><span class="p">,</span>
               <span class="n">gpu_id</span><span class="o">=</span><span class="n">gpu_cnt</span><span class="p">,</span>
+              <span class="n">checkpoint</span><span class="o">=</span><span class="n">checkpoint</span><span class="p">,</span>
+              <span class="n">use_trt</span><span class="o">=</span><span class="n">use_trt</span><span class="p">,</span>
+              <span class="n">precision</span><span class="o">=</span><span class="n">precision</span>
           <span class="p">)</span>
           <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_cnt</span><span class="p">]</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> \
              <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_cnt</span><span class="p">],</span> <span class="nb">list</span><span class="p">):</span>
@@ -594,9 +622,76 @@ <h1>Source code for models.model</h1><div class="highlight"><pre>
         <span class="k">else</span><span class="p">:</span>
           <span class="n">deco_print</span><span class="p">(</span><span class="s1">&#39;Total trainable parameters: </span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">total_params</span><span class="p">))</span></div>
 
+<div class="viewcode-block" id="Model.build_forward_pass_graph"><a class="viewcode-back" href="../../api-docs/models.html#models.model.Model.build_forward_pass_graph">[docs]</a>  <span class="k">def</span> <span class="nf">build_forward_pass_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_tensors</span><span class="p">,</span> <span class="n">gpu_id</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">checkpoint</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">use_trt</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">precision</span><span class="o">=</span><span class="s1">&#39;FP32&#39;</span><span class="p">):</span>
+    <span class="sd">&quot;&quot;&quot;Wrapper around _build_forward_pass_graph with option of using TF-TRT&quot;&quot;&quot;</span>
+    <span class="k">if</span> <span class="n">use_trt</span><span class="p">:</span>
+      <span class="kn">import</span> <span class="nn">tensorflow.contrib.tensorrt</span> <span class="k">as</span> <span class="nn">trt</span>
+      <span class="c1"># Create temporary graph which will contain the native TF graph</span>
+      <span class="n">tf_config</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">ConfigProto</span><span class="p">()</span>
+      <span class="n">tf_config</span><span class="o">.</span><span class="n">gpu_options</span><span class="o">.</span><span class="n">allow_growth</span> <span class="o">=</span> <span class="kc">True</span>
+      <span class="n">temp_graph</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">Graph</span><span class="p">()</span>
+      <span class="k">with</span> <span class="n">temp_graph</span><span class="o">.</span><span class="n">as_default</span><span class="p">()</span> <span class="k">as</span> <span class="n">tf_graph</span><span class="p">:</span>
+        <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">Session</span><span class="p">(</span><span class="n">config</span><span class="o">=</span><span class="n">tf_config</span><span class="p">)</span> <span class="k">as</span> <span class="n">tf_sess</span><span class="p">:</span>
+          <span class="n">input_placeholders</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">:</span> <span class="p">[</span>
+            <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span><span class="n">shape</span><span class="o">=</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s1">&#39;input_map1&#39;</span><span class="p">),</span>
+            <span class="n">tf</span><span class="o">.</span><span class="n">placeholder</span><span class="p">(</span><span class="n">shape</span><span class="o">=</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">int32</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s1">&#39;input_map2&#39;</span><span class="p">)</span>
+            <span class="p">]}</span>
+          <span class="n">loss</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_id</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_build_forward_pass_graph</span><span class="p">(</span>
+              <span class="n">input_placeholders</span><span class="p">,</span>
+              <span class="n">gpu_id</span><span class="o">=</span><span class="n">gpu_id</span>
+          <span class="p">)</span>
+          <span class="n">output_node_names</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;:0&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_id</span><span class="p">]]</span>
+          <span class="c1"># Restore checkpoint here because we have to freeze the graph</span>
+          <span class="n">tf_saver</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">Saver</span><span class="p">()</span>
+          <span class="n">tf_saver</span><span class="o">.</span><span class="n">restore</span><span class="p">(</span><span class="n">save_path</span><span class="o">=</span><span class="n">checkpoint</span><span class="p">,</span> <span class="n">sess</span><span class="o">=</span><span class="n">tf_sess</span><span class="p">)</span>
+          <span class="n">frozen_graph</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">graph_util</span><span class="o">.</span><span class="n">convert_variables_to_constants</span><span class="p">(</span>
+                <span class="n">tf_sess</span><span class="p">,</span>
+                <span class="n">tf_sess</span><span class="o">.</span><span class="n">graph_def</span><span class="p">,</span>
+                <span class="n">output_node_names</span><span class="o">=</span><span class="n">output_node_names</span>
+          <span class="p">)</span>
+          <span class="n">num_nodes</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">frozen_graph</span><span class="o">.</span><span class="n">node</span><span class="p">)</span>
+          <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Converting graph using TensorFlow-TensorRT...&#39;</span><span class="p">)</span>
+          <span class="n">frozen_graph</span> <span class="o">=</span> <span class="n">trt</span><span class="o">.</span><span class="n">create_inference_graph</span><span class="p">(</span>
+            <span class="n">input_graph_def</span><span class="o">=</span><span class="n">frozen_graph</span><span class="p">,</span>
+            <span class="n">outputs</span><span class="o">=</span><span class="n">output_node_names</span><span class="p">,</span>
+            <span class="n">max_batch_size</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span>
+            <span class="n">max_workspace_size_bytes</span><span class="o">=</span><span class="mi">4096</span> <span class="o">&lt;&lt;</span> <span class="mi">20</span><span class="p">,</span>
+            <span class="n">precision_mode</span><span class="o">=</span><span class="n">precision</span><span class="p">,</span>
+            <span class="n">minimum_segment_size</span><span class="o">=</span><span class="mi">3</span>
+          <span class="p">)</span>
+          <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Total node count before and after TF-TRT conversion:&#39;</span><span class="p">,</span> <span class="n">num_nodes</span><span class="p">,</span> <span class="s1">&#39;-&gt;&#39;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">frozen_graph</span><span class="o">.</span><span class="n">node</span><span class="p">))</span>
+          <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;TRT node count:&#39;</span><span class="p">,</span> <span class="nb">len</span><span class="p">([</span><span class="mi">1</span> <span class="k">for</span> <span class="n">n</span> <span class="ow">in</span> <span class="n">frozen_graph</span><span class="o">.</span><span class="n">node</span> <span class="k">if</span> <span class="nb">str</span><span class="p">(</span><span class="n">n</span><span class="o">.</span><span class="n">op</span><span class="p">)</span><span class="o">==</span><span class="s1">&#39;TRTEngineOp&#39;</span><span class="p">]))</span>
+      <span class="c1"># Perform calibration for INT8 precision mode</span>
+      <span class="k">if</span> <span class="n">precision</span> <span class="o">==</span> <span class="s1">&#39;int8&#39;</span><span class="p">:</span>
+          <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">Session</span><span class="p">(</span><span class="n">config</span><span class="o">=</span><span class="n">tf_config</span><span class="p">)</span> <span class="k">as</span> <span class="n">tf_sess</span><span class="p">:</span>
+            <span class="n">calib_graph</span> <span class="o">=</span> <span class="n">frozen_graph</span>
+            <span class="n">num_iterations</span> <span class="o">=</span> <span class="mi">10</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Calibrating INT8...&#39;</span><span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">import_graph_def</span><span class="p">(</span><span class="n">calib_graph</span><span class="p">,</span>
+                <span class="n">input_map</span><span class="o">=</span><span class="p">{</span><span class="s1">&#39;input_map1&#39;</span><span class="p">:</span> <span class="n">input_tensors</span><span class="p">[</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">][</span><span class="mi">0</span><span class="p">]},</span>
+                <span class="n">return_elements</span><span class="o">=</span><span class="p">[</span><span class="n">x</span><span class="o">+</span><span class="s1">&#39;:0&#39;</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">output_node_names</span><span class="p">],</span>
+                <span class="n">name</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_num_objects_per_step</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_num_objects_per_step</span><span class="p">(</span><span class="n">worker_id</span><span class="p">)</span>
+                                    <span class="k">for</span> <span class="n">worker_id</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">num_gpus</span><span class="p">)]</span>
+            <span class="n">results_per_batch</span> <span class="o">=</span> <span class="n">iterate_data</span><span class="p">(</span>
+              <span class="bp">self</span><span class="p">,</span> <span class="n">tf_sess</span><span class="p">,</span> <span class="n">compute_loss</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;infer&#39;</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">num_steps</span><span class="o">=</span><span class="n">num_iterations</span>
+            <span class="p">)</span>
+            <span class="n">frozen_graph</span> <span class="o">=</span> <span class="n">trt</span><span class="o">.</span><span class="n">calib_graph_to_infer_graph</span><span class="p">(</span><span class="n">calib_graph</span><span class="p">)</span>
+            <span class="k">del</span> <span class="n">calib_graph</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;INT8 graph created.&#39;</span><span class="p">)</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Nodes INT8:&#39;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">frozen_graph</span><span class="o">.</span><span class="n">node</span><span class="p">))</span>
+      <span class="c1"># Import TRT converted graph to default graph, mapping it to the original input tensors</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">import_graph_def</span><span class="p">(</span><span class="n">frozen_graph</span><span class="p">,</span>
+          <span class="n">input_map</span><span class="o">=</span><span class="p">{</span><span class="s1">&#39;input_map1&#39;</span><span class="p">:</span> <span class="n">input_tensors</span><span class="p">[</span><span class="s1">&#39;source_tensors&#39;</span><span class="p">][</span><span class="mi">0</span><span class="p">]},</span>
+          <span class="n">return_elements</span><span class="o">=</span><span class="p">[</span><span class="n">x</span><span class="o">+</span><span class="s1">&#39;:0&#39;</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">output_node_names</span><span class="p">],</span>
+          <span class="n">name</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+      <span class="k">return</span> <span class="n">loss</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_outputs</span><span class="p">[</span><span class="n">gpu_id</span><span class="p">]</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_build_forward_pass_graph</span><span class="p">(</span><span class="n">input_tensors</span><span class="p">,</span> <span class="n">gpu_id</span><span class="p">)</span></div>
+
 <div class="viewcode-block" id="Model._build_forward_pass_graph"><a class="viewcode-back" href="../../api-docs/models.html#models.model.Model._build_forward_pass_graph">[docs]</a>  <span class="nd">@abc</span><span class="o">.</span><span class="n">abstractmethod</span>
   <span class="k">def</span> <span class="nf">_build_forward_pass_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_tensors</span><span class="p">,</span> <span class="n">gpu_id</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
-    <span class="sd">&quot;&quot;&quot;This method should create the graph of the forward pass of the model.</span>
+    <span class="sd">&quot;&quot;&quot;Abstract method. Should create the graph of the forward pass of the model.</span>
 
 <span class="sd">    Args:</span>
 <span class="sd">      input_tensors: ``input_tensors`` defined by the data_layer class.</span>
diff --git a/docs/html/_modules/models/text2speech.html b/docs/html/_modules/models/text2speech.html
index 460e5929e..574cb4797 100644
--- a/docs/html/_modules/models/text2speech.html
+++ b/docs/html/_modules/models/text2speech.html
@@ -158,21 +158,19 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
 <span></span><span class="c1"># Copyright (c) 2018 NVIDIA Corporation</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
+<span class="kn">from</span> <span class="nn">six</span> <span class="k">import</span> <span class="n">BytesIO</span>
 <span class="kn">from</span> <span class="nn">six.moves</span> <span class="k">import</span> <span class="nb">range</span>
 
-<span class="kn">import</span> <span class="nn">librosa</span>
+<span class="kn">from</span> <span class="nn">scipy.io.wavfile</span> <span class="k">import</span> <span class="n">write</span>
 
+<span class="kn">import</span> <span class="nn">librosa</span>
 <span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
-
 <span class="kn">import</span> <span class="nn">matplotlib</span> <span class="k">as</span> <span class="nn">mpl</span>
 <span class="n">mpl</span><span class="o">.</span><span class="n">use</span><span class="p">(</span><span class="s1">&#39;Agg&#39;</span><span class="p">)</span>
 <span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">from</span> <span class="nn">scipy.io.wavfile</span> <span class="k">import</span> <span class="n">write</span>
+<span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 
 <span class="kn">from</span> <span class="nn">.encoder_decoder</span> <span class="k">import</span> <span class="n">EncoderDecoderModel</span>
-<span class="kn">from</span> <span class="nn">six</span> <span class="k">import</span> <span class="n">StringIO</span>
-
 
 <div class="viewcode-block" id="plot_spectrograms"><a class="viewcode-back" href="../../api-docs/models.html#models.text2speech.plot_spectrograms">[docs]</a><span class="k">def</span> <span class="nf">plot_spectrograms</span><span class="p">(</span>
     <span class="n">specs</span><span class="p">,</span>
@@ -213,14 +211,12 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
   <span class="n">num_figs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">specs</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span>
   <span class="n">fig</span><span class="p">,</span> <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="n">nrows</span><span class="o">=</span><span class="n">num_figs</span><span class="p">,</span> <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">8</span><span class="p">,</span> <span class="n">num_figs</span> <span class="o">*</span> <span class="mi">3</span><span class="p">))</span>
 
-  <span class="n">figures</span> <span class="o">=</span> <span class="p">[]</span>
   <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="p">(</span><span class="n">spec</span><span class="p">,</span> <span class="n">title</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">specs</span><span class="p">,</span> <span class="n">titles</span><span class="p">)):</span>
     <span class="n">spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span><span class="n">spec</span><span class="p">,</span> <span class="p">((</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">),</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s2">&quot;constant&quot;</span><span class="p">,</span> <span class="n">constant_values</span><span class="o">=</span><span class="mf">0.</span><span class="p">)</span>
     <span class="n">spec</span> <span class="o">=</span> <span class="n">spec</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span>
     <span class="n">colour</span> <span class="o">=</span> <span class="n">ax</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span>
         <span class="n">spec</span><span class="o">.</span><span class="n">T</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="s1">&#39;viridis&#39;</span><span class="p">,</span> <span class="n">interpolation</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">aspect</span><span class="o">=</span><span class="s1">&#39;auto&#39;</span>
     <span class="p">)</span>
-    <span class="n">figures</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">colour</span><span class="p">)</span>
     <span class="n">ax</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">invert_yaxis</span><span class="p">()</span>
     <span class="n">ax</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_title</span><span class="p">(</span><span class="n">title</span><span class="p">)</span>
     <span class="n">fig</span><span class="o">.</span><span class="n">colorbar</span><span class="p">(</span><span class="n">colour</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
@@ -231,17 +227,21 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
   <span class="n">ax</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">stop_token_pred</span><span class="p">,</span> <span class="s1">&#39;g.&#39;</span><span class="p">)</span>
   <span class="n">ax</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">axvline</span><span class="p">(</span><span class="n">x</span><span class="o">=</span><span class="n">audio_length</span><span class="p">)</span>
   <span class="n">ax</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">set_xlim</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">specs</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+  <span class="n">ax</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">set_title</span><span class="p">(</span><span class="s2">&quot;stop token&quot;</span><span class="p">)</span>
+
+  <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;time&#39;</span><span class="p">)</span>
+  <span class="n">plt</span><span class="o">.</span><span class="n">tight_layout</span><span class="p">()</span>
+
   <span class="n">cb</span> <span class="o">=</span> <span class="n">fig</span><span class="o">.</span><span class="n">colorbar</span><span class="p">(</span><span class="n">colour</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
   <span class="n">cb</span><span class="o">.</span><span class="n">remove</span><span class="p">()</span>
 
-  <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;time&#39;</span><span class="p">)</span>
 
   <span class="k">if</span> <span class="n">save_to_tensorboard</span><span class="p">:</span>
     <span class="n">tag</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{}</span><span class="s2">_image&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">append</span><span class="p">)</span>
-    <span class="n">s</span> <span class="o">=</span> <span class="n">StringIO</span><span class="p">()</span>
-    <span class="n">fig</span><span class="o">.</span><span class="n">savefig</span><span class="p">(</span><span class="n">s</span><span class="p">,</span> <span class="n">dpi</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
+    <span class="n">iostream</span> <span class="o">=</span> <span class="n">BytesIO</span><span class="p">()</span>
+    <span class="n">fig</span><span class="o">.</span><span class="n">savefig</span><span class="p">(</span><span class="n">iostream</span><span class="p">,</span> <span class="n">dpi</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
     <span class="n">summary</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">Summary</span><span class="o">.</span><span class="n">Image</span><span class="p">(</span>
-        <span class="n">encoded_image_string</span><span class="o">=</span><span class="n">s</span><span class="o">.</span><span class="n">getvalue</span><span class="p">(),</span>
+        <span class="n">encoded_image_string</span><span class="o">=</span><span class="n">iostream</span><span class="o">.</span><span class="n">getvalue</span><span class="p">(),</span>
         <span class="n">height</span><span class="o">=</span><span class="nb">int</span><span class="p">(</span><span class="n">fig</span><span class="o">.</span><span class="n">get_figheight</span><span class="p">()</span> <span class="o">*</span> <span class="mi">300</span><span class="p">),</span>
         <span class="n">width</span><span class="o">=</span><span class="nb">int</span><span class="p">(</span><span class="n">fig</span><span class="o">.</span><span class="n">get_figwidth</span><span class="p">()</span> <span class="o">*</span> <span class="mi">300</span><span class="p">)</span>
     <span class="p">)</span>
@@ -266,7 +266,15 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
 
 
 <div class="viewcode-block" id="save_audio"><a class="viewcode-back" href="../../api-docs/models.html#models.text2speech.save_audio">[docs]</a><span class="k">def</span> <span class="nf">save_audio</span><span class="p">(</span>
-    <span class="n">magnitudes</span><span class="p">,</span> <span class="n">logdir</span><span class="p">,</span> <span class="n">step</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;train&quot;</span><span class="p">,</span> <span class="n">number</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">save_to_tensorboard</span><span class="o">=</span><span class="kc">False</span>
+    <span class="n">magnitudes</span><span class="p">,</span>
+    <span class="n">logdir</span><span class="p">,</span>
+    <span class="n">step</span><span class="p">,</span>
+    <span class="n">sampling_rate</span><span class="p">,</span>
+    <span class="n">n_fft</span><span class="o">=</span><span class="mi">1024</span><span class="p">,</span>
+    <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;train&quot;</span><span class="p">,</span>
+    <span class="n">number</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+    <span class="n">save_format</span><span class="o">=</span><span class="s2">&quot;tensorboard&quot;</span><span class="p">,</span>
+    <span class="n">power</span><span class="o">=</span><span class="mf">1.5</span>
 <span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">  Helper function to create a wav file to be logged to disk or a tf.Summary to</span>
@@ -277,33 +285,46 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
 <span class="sd">      energy spectrogram.</span>
 <span class="sd">    logdir (str): dir to save image file is save_to_tensorboard is disabled.</span>
 <span class="sd">    step (int): current training step</span>
+<span class="sd">    sampling_rate (int): samplng rate in Hz of the audio to be saved.</span>
+<span class="sd">    n_fft (int): number of filters for fft and ifft.</span>
 <span class="sd">    number (int): Current sample number (used if evaluating more than 1 sample</span>
 <span class="sd">    mode (str): Optional string to append to file name eg. train, eval, infer</span>
 <span class="sd">      from a batch)</span>
-<span class="sd">    save_to_tensorboard (bool): If False, the created file is saved to the</span>
-<span class="sd">      logdir as a wav file. If True, the function returns a tf.Summary object</span>
-<span class="sd">      containing the wav file and will be logged to the current tensorboard file.</span>
+<span class="sd">    save_format: save_audio can either return the np.array containing the</span>
+<span class="sd">      generated sound, log the wav file to the disk, or return a tensorboard</span>
+<span class="sd">      summary object. Each method can be enabled by passing save_format as</span>
+<span class="sd">      &quot;np.array&quot;, &quot;tensorboard&quot;, or &quot;disk&quot; respectively.</span>
 
 <span class="sd">  Returns:</span>
 <span class="sd">    tf.Summary or None</span>
 <span class="sd">  &quot;&quot;&quot;</span>
-  <span class="n">signal</span> <span class="o">=</span> <span class="n">griffin_lim</span><span class="p">(</span><span class="n">magnitudes</span><span class="o">.</span><span class="n">T</span><span class="o">**</span><span class="mf">1.2</span><span class="p">)</span>
-  <span class="k">if</span> <span class="n">save_to_tensorboard</span><span class="p">:</span>
+  <span class="n">signal</span> <span class="o">=</span> <span class="n">griffin_lim</span><span class="p">(</span><span class="n">magnitudes</span><span class="o">.</span><span class="n">T</span><span class="o">**</span><span class="n">power</span><span class="p">,</span> <span class="n">n_fft</span><span class="o">=</span><span class="n">n_fft</span><span class="p">)</span>
+  <span class="k">if</span> <span class="n">save_format</span> <span class="o">==</span> <span class="s2">&quot;np.array&quot;</span><span class="p">:</span>
+    <span class="k">return</span> <span class="n">signal</span>
+  <span class="k">elif</span> <span class="n">save_format</span> <span class="o">==</span> <span class="s2">&quot;tensorboard&quot;</span><span class="p">:</span>
     <span class="n">tag</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{}</span><span class="s2">_audio&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">mode</span><span class="p">)</span>
-    <span class="n">s</span> <span class="o">=</span> <span class="n">StringIO</span><span class="p">()</span>
-    <span class="n">write</span><span class="p">(</span><span class="n">s</span><span class="p">,</span> <span class="mi">22050</span><span class="p">,</span> <span class="n">signal</span><span class="p">)</span>
-    <span class="n">summary</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">Summary</span><span class="o">.</span><span class="n">Audio</span><span class="p">(</span><span class="n">encoded_audio_string</span><span class="o">=</span><span class="n">s</span><span class="o">.</span><span class="n">getvalue</span><span class="p">())</span>
+    <span class="n">iostream</span> <span class="o">=</span> <span class="n">BytesIO</span><span class="p">()</span>
+    <span class="n">write</span><span class="p">(</span><span class="n">iostream</span><span class="p">,</span> <span class="n">sampling_rate</span><span class="p">,</span> <span class="n">signal</span><span class="p">)</span>
+    <span class="n">summary</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">Summary</span><span class="o">.</span><span class="n">Audio</span><span class="p">(</span><span class="n">encoded_audio_string</span><span class="o">=</span><span class="n">iostream</span><span class="o">.</span><span class="n">getvalue</span><span class="p">())</span>
     <span class="n">summary</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">Summary</span><span class="o">.</span><span class="n">Value</span><span class="p">(</span><span class="n">tag</span><span class="o">=</span><span class="n">tag</span><span class="p">,</span> <span class="n">audio</span><span class="o">=</span><span class="n">summary</span><span class="p">)</span>
     <span class="k">return</span> <span class="n">summary</span>
-  <span class="k">else</span><span class="p">:</span>
+  <span class="k">elif</span> <span class="n">save_format</span> <span class="o">==</span> <span class="s2">&quot;disk&quot;</span><span class="p">:</span>
     <span class="n">file_name</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="si">{}</span><span class="s1">/sample_step</span><span class="si">{}</span><span class="s1">_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{}</span><span class="s1">.wav&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">logdir</span><span class="p">,</span> <span class="n">step</span><span class="p">,</span> <span class="n">number</span><span class="p">,</span> <span class="n">mode</span><span class="p">)</span>
     <span class="k">if</span> <span class="n">logdir</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s1">&#39;/&#39;</span><span class="p">:</span>
       <span class="n">file_name</span> <span class="o">=</span> <span class="s2">&quot;./&quot;</span> <span class="o">+</span> <span class="n">file_name</span>
-    <span class="n">write</span><span class="p">(</span><span class="n">file_name</span><span class="p">,</span> <span class="mi">22050</span><span class="p">,</span> <span class="n">signal</span><span class="p">)</span>
+    <span class="n">write</span><span class="p">(</span><span class="n">file_name</span><span class="p">,</span> <span class="n">sampling_rate</span><span class="p">,</span> <span class="n">signal</span><span class="p">)</span>
+    <span class="k">return</span> <span class="kc">None</span>
+  <span class="k">else</span><span class="p">:</span>
+    <span class="nb">print</span><span class="p">((</span>
+        <span class="s2">&quot;WARN: The save format passed to save_audio was not understood. No &quot;</span>
+        <span class="s2">&quot;sound files will be saved for the current step. &quot;</span>
+        <span class="s2">&quot;Received &#39;</span><span class="si">{}</span><span class="s2">&#39;.&quot;</span>
+        <span class="s2">&quot;Expected one of &#39;np.array&#39;, &#39;tensorboard&#39;, or &#39;disk&#39;&quot;</span>
+    <span class="p">)</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">save_format</span><span class="p">))</span>
     <span class="k">return</span> <span class="kc">None</span></div>
 
 
-<div class="viewcode-block" id="griffin_lim"><a class="viewcode-back" href="../../api-docs/models.html#models.text2speech.griffin_lim">[docs]</a><span class="k">def</span> <span class="nf">griffin_lim</span><span class="p">(</span><span class="n">magnitudes</span><span class="p">,</span> <span class="n">n_iters</span><span class="o">=</span><span class="mi">50</span><span class="p">):</span>
+<div class="viewcode-block" id="griffin_lim"><a class="viewcode-back" href="../../api-docs/models.html#models.text2speech.griffin_lim">[docs]</a><span class="k">def</span> <span class="nf">griffin_lim</span><span class="p">(</span><span class="n">magnitudes</span><span class="p">,</span> <span class="n">n_iters</span><span class="o">=</span><span class="mi">50</span><span class="p">,</span> <span class="n">n_fft</span><span class="o">=</span><span class="mi">1024</span><span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">  Griffin-Lim algorithm to convert magnitude spectrograms to audio signals</span>
 <span class="sd">  &quot;&quot;&quot;</span>
@@ -313,7 +334,7 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
   <span class="n">signal</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">istft</span><span class="p">(</span><span class="n">complex_spec</span><span class="p">)</span>
 
   <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_iters</span><span class="p">):</span>
-    <span class="n">_</span><span class="p">,</span> <span class="n">phase</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">magphase</span><span class="p">(</span><span class="n">librosa</span><span class="o">.</span><span class="n">stft</span><span class="p">(</span><span class="n">signal</span><span class="p">,</span> <span class="n">n_fft</span><span class="o">=</span><span class="mi">1024</span><span class="p">))</span>
+    <span class="n">_</span><span class="p">,</span> <span class="n">phase</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">magphase</span><span class="p">(</span><span class="n">librosa</span><span class="o">.</span><span class="n">stft</span><span class="p">(</span><span class="n">signal</span><span class="p">,</span> <span class="n">n_fft</span><span class="o">=</span><span class="n">n_fft</span><span class="p">))</span>
     <span class="n">complex_spec</span> <span class="o">=</span> <span class="n">magnitudes</span> <span class="o">*</span> <span class="n">phase</span>
     <span class="n">signal</span> <span class="o">=</span> <span class="n">librosa</span><span class="o">.</span><span class="n">istft</span><span class="p">(</span><span class="n">complex_spec</span><span class="p">)</span>
   <span class="k">return</span> <span class="n">signal</span></div>
@@ -333,12 +354,6 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
     <span class="nb">super</span><span class="p">(</span><span class="n">Text2Speech</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="n">mode</span><span class="p">,</span> <span class="n">hvd</span><span class="o">=</span><span class="n">hvd</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_save_to_tensorboard</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;save_to_tensorboard&quot;</span><span class="p">]</span>
 
-  <span class="k">def</span> <span class="nf">_create_decoder</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;decoder_params&#39;</span><span class="p">][</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;num_audio_features&#39;</span><span class="p">]</span>
-    <span class="p">)</span>
-    <span class="k">return</span> <span class="nb">super</span><span class="p">(</span><span class="n">Text2Speech</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="n">_create_decoder</span><span class="p">()</span>
-
 <div class="viewcode-block" id="Text2Speech.maybe_print_logs"><a class="viewcode-back" href="../../api-docs/models.html#models.text2speech.Text2Speech.maybe_print_logs">[docs]</a>  <span class="k">def</span> <span class="nf">maybe_print_logs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_values</span><span class="p">,</span> <span class="n">output_values</span><span class="p">,</span> <span class="n">training_step</span><span class="p">):</span>
     <span class="n">dict_to_log</span> <span class="o">=</span> <span class="p">{}</span>
     <span class="n">step</span> <span class="o">=</span> <span class="n">training_step</span>
@@ -385,11 +400,17 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
     <span class="n">predicted_final_spec</span> <span class="o">=</span> <span class="n">predicted_final_spec</span><span class="p">[:</span><span class="n">audio_length</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="p">:]</span>
     <span class="n">predicted_final_spec</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">(</span>
     <span class="p">)</span><span class="o">.</span><span class="n">get_magnitude_spec</span><span class="p">(</span><span class="n">predicted_final_spec</span><span class="p">)</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_save_to_tensorboard</span><span class="p">:</span>
+      <span class="n">save_format</span> <span class="o">=</span> <span class="s2">&quot;tensorboard&quot;</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">save_format</span> <span class="o">=</span> <span class="s2">&quot;disk&quot;</span>
     <span class="n">wav_summary</span> <span class="o">=</span> <span class="n">save_audio</span><span class="p">(</span>
         <span class="n">predicted_final_spec</span><span class="p">,</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;logdir&quot;</span><span class="p">],</span>
         <span class="n">step</span><span class="p">,</span>
-        <span class="n">save_to_tensorboard</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_save_to_tensorboard</span>
+        <span class="n">n_fft</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">n_fft</span><span class="p">,</span>
+        <span class="n">sampling_rate</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">sampling_rate</span><span class="p">,</span>
+        <span class="n">save_format</span><span class="o">=</span><span class="n">save_format</span>
     <span class="p">)</span>
     <span class="n">dict_to_log</span><span class="p">[</span><span class="s1">&#39;audio&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">wav_summary</span>
 
@@ -442,12 +463,18 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
 
       <span class="n">predicted_final_spec</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">(</span>
       <span class="p">)</span><span class="o">.</span><span class="n">get_magnitude_spec</span><span class="p">(</span><span class="n">predicted_final_spec</span><span class="p">)</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_save_to_tensorboard</span><span class="p">:</span>
+        <span class="n">save_format</span> <span class="o">=</span> <span class="s2">&quot;tensorboard&quot;</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">save_format</span> <span class="o">=</span> <span class="s2">&quot;disk&quot;</span>
       <span class="n">wav_summary</span> <span class="o">=</span> <span class="n">save_audio</span><span class="p">(</span>
           <span class="n">predicted_final_spec</span><span class="p">,</span>
           <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;logdir&quot;</span><span class="p">],</span>
           <span class="n">step</span><span class="p">,</span>
+          <span class="n">n_fft</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">n_fft</span><span class="p">,</span>
+          <span class="n">sampling_rate</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">sampling_rate</span><span class="p">,</span>
           <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;eval&quot;</span><span class="p">,</span>
-          <span class="n">save_to_tensorboard</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_save_to_tensorboard</span>
+          <span class="n">save_format</span><span class="o">=</span><span class="n">save_format</span>
       <span class="p">)</span>
       <span class="n">dict_to_log</span><span class="p">[</span><span class="s1">&#39;audio&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">wav_summary</span>
 
@@ -491,7 +518,7 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
 
         <span class="k">if</span> <span class="s2">&quot;mel&quot;</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;output_type&#39;</span><span class="p">]:</span>
           <span class="n">mag_spec</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">(</span>
-          <span class="p">)</span><span class="o">.</span><span class="n">inverse_mel</span><span class="p">(</span><span class="n">predicted_final_spec</span><span class="p">)</span>
+          <span class="p">)</span><span class="o">.</span><span class="n">get_magnitude_spec</span><span class="p">(</span><span class="n">predicted_final_spec</span><span class="p">)</span>
           <span class="n">log_mag_spec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">mag_spec</span><span class="p">,</span> <span class="n">a_min</span><span class="o">=</span><span class="mf">1e-5</span><span class="p">,</span> <span class="n">a_max</span><span class="o">=</span><span class="kc">None</span><span class="p">))</span>
           <span class="n">specs</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">log_mag_spec</span><span class="p">)</span>
           <span class="n">titles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s2">&quot;linear spectrogram&quot;</span><span class="p">)</span>
@@ -516,14 +543,14 @@ <h1>Source code for models.text2speech</h1><div class="highlight"><pre>
               <span class="n">predicted_final_spec</span><span class="p">,</span>
               <span class="bp">self</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s2">&quot;logdir&quot;</span><span class="p">],</span>
               <span class="mi">0</span><span class="p">,</span>
+              <span class="n">n_fft</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">n_fft</span><span class="p">,</span>
+              <span class="n">sampling_rate</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">sampling_rate</span><span class="p">,</span>
               <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;infer&quot;</span><span class="p">,</span>
               <span class="n">number</span><span class="o">=</span><span class="n">i</span> <span class="o">*</span> <span class="n">batch_size</span> <span class="o">+</span> <span class="n">j</span><span class="p">,</span>
-              <span class="n">save_to_tensorboard</span><span class="o">=</span><span class="kc">False</span>
+              <span class="n">save_format</span><span class="o">=</span><span class="s2">&quot;disk&quot;</span>
           <span class="p">)</span>
 
-          <span class="n">dict_to_log</span><span class="p">[</span><span class="s1">&#39;audio&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">wav_summary</span>
-
-    <span class="k">return</span> <span class="p">{}</span></div></div>
+          <span class="n">dict_to_log</span><span class="p">[</span><span class="s1">&#39;audio&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">wav_summary</span></div></div>
 </pre></div>
 
            </div>
diff --git a/docs/html/_modules/models/text2text.html b/docs/html/_modules/models/text2text.html
index 1d65eb5a7..e84bf6d0e 100644
--- a/docs/html/_modules/models/text2text.html
+++ b/docs/html/_modules/models/text2text.html
@@ -244,17 +244,23 @@ <h1>Source code for models.text2text</h1><div class="highlight"><pre>
         <span class="n">output_strings</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">text_ids_to_string</span><span class="p">(</span>
             <span class="n">output_sample</span><span class="p">[</span><span class="n">i</span><span class="p">],</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;target_idx2seq&#39;</span><span class="p">],</span>
-            <span class="n">S_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;GO_SYMBOL&#39;</span><span class="p">],</span>
-            <span class="n">EOS_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;END_SYMBOL&#39;</span><span class="p">],</span>
-            <span class="n">PAD_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;PAD_SYMBOL&#39;</span><span class="p">],</span>
-            <span class="n">ignore_special</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">delim</span><span class="o">=</span><span class="s1">&#39; &#39;</span><span class="p">,</span>
+            <span class="n">S_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;GO_SYMBOL&#39;</span><span class="p">,</span>
+                                         <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">),</span>
+            <span class="n">EOS_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;END_SYMBOL&#39;</span><span class="p">,</span>
+                                           <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="p">),</span>
+            <span class="n">PAD_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;PAD_SYMBOL&#39;</span><span class="p">,</span>
+                                           <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="p">),</span>
+          <span class="n">ignore_special</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">delim</span><span class="o">=</span><span class="s1">&#39; &#39;</span><span class="p">,</span>
         <span class="p">))</span>
         <span class="n">input_strings</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">text_ids_to_string</span><span class="p">(</span>
             <span class="n">input_sample</span><span class="p">[</span><span class="n">i</span><span class="p">],</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;source_idx2seq&#39;</span><span class="p">],</span>
-            <span class="n">S_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;GO_SYMBOL&#39;</span><span class="p">],</span>
-            <span class="n">EOS_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;END_SYMBOL&#39;</span><span class="p">],</span>
-            <span class="n">PAD_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;PAD_SYMBOL&#39;</span><span class="p">],</span>
+            <span class="n">S_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;GO_SYMBOL&#39;</span><span class="p">,</span>
+                                         <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">S_ID</span><span class="o">.</span><span class="n">value</span><span class="p">),</span>
+            <span class="n">EOS_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;END_SYMBOL&#39;</span><span class="p">,</span>
+                                           <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">EOS_ID</span><span class="o">.</span><span class="n">value</span><span class="p">),</span>
+            <span class="n">PAD_ID</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;PAD_SYMBOL&#39;</span><span class="p">,</span>
+                                           <span class="n">SpecialTextTokens</span><span class="o">.</span><span class="n">PAD_ID</span><span class="p">),</span>
             <span class="n">ignore_special</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">delim</span><span class="o">=</span><span class="s1">&#39; &#39;</span><span class="p">,</span>
         <span class="p">))</span>
     <span class="k">return</span> <span class="n">input_strings</span><span class="p">,</span> <span class="n">output_strings</span></div>
diff --git a/docs/html/_modules/parts/cnns/conv_blocks.html b/docs/html/_modules/parts/cnns/conv_blocks.html
index 1bdc45edb..dc05c893d 100644
--- a/docs/html/_modules/parts/cnns/conv_blocks.html
+++ b/docs/html/_modules/parts/cnns/conv_blocks.html
@@ -170,7 +170,7 @@ <h1>Source code for parts.cnns.conv_blocks</h1><div class="highlight"><pre>
 <span class="p">}</span>
 
 <div class="viewcode-block" id="conv_actv"><a class="viewcode-back" href="../../../api-docs/parts.cnns.html#parts.cnns.conv_blocks.conv_actv">[docs]</a><span class="k">def</span> <span class="nf">conv_actv</span><span class="p">(</span><span class="n">layer_type</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">inputs</span><span class="p">,</span> <span class="n">filters</span><span class="p">,</span> <span class="n">kernel_size</span><span class="p">,</span> <span class="n">activation_fn</span><span class="p">,</span> <span class="n">strides</span><span class="p">,</span>
-              <span class="n">padding</span><span class="p">,</span> <span class="n">regularizer</span><span class="p">,</span> <span class="n">training</span><span class="p">,</span> <span class="n">data_format</span><span class="p">):</span>
+              <span class="n">padding</span><span class="p">,</span> <span class="n">regularizer</span><span class="p">,</span> <span class="n">training</span><span class="p">,</span> <span class="n">data_format</span><span class="p">,</span> <span class="n">dilation</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;Helper function that applies convolution and activation.</span>
 <span class="sd">    Args:</span>
 <span class="sd">      layer_type: the following types are supported</span>
@@ -185,6 +185,7 @@ <h1>Source code for parts.cnns.conv_blocks</h1><div class="highlight"><pre>
       <span class="n">kernel_size</span><span class="o">=</span><span class="n">kernel_size</span><span class="p">,</span>
       <span class="n">strides</span><span class="o">=</span><span class="n">strides</span><span class="p">,</span>
       <span class="n">padding</span><span class="o">=</span><span class="n">padding</span><span class="p">,</span>
+      <span class="n">dilation_rate</span><span class="o">=</span><span class="n">dilation</span><span class="p">,</span>
       <span class="n">kernel_regularizer</span><span class="o">=</span><span class="n">regularizer</span><span class="p">,</span>
       <span class="n">use_bias</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
       <span class="n">data_format</span><span class="o">=</span><span class="n">data_format</span><span class="p">,</span>
@@ -198,9 +199,8 @@ <h1>Source code for parts.cnns.conv_blocks</h1><div class="highlight"><pre>
 
 <div class="viewcode-block" id="conv_bn_actv"><a class="viewcode-back" href="../../../api-docs/parts.cnns.html#parts.cnns.conv_blocks.conv_bn_actv">[docs]</a><span class="k">def</span> <span class="nf">conv_bn_actv</span><span class="p">(</span><span class="n">layer_type</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">inputs</span><span class="p">,</span> <span class="n">filters</span><span class="p">,</span> <span class="n">kernel_size</span><span class="p">,</span> <span class="n">activation_fn</span><span class="p">,</span> <span class="n">strides</span><span class="p">,</span>
                  <span class="n">padding</span><span class="p">,</span> <span class="n">regularizer</span><span class="p">,</span> <span class="n">training</span><span class="p">,</span> <span class="n">data_format</span><span class="p">,</span> <span class="n">bn_momentum</span><span class="p">,</span>
-                 <span class="n">bn_epsilon</span><span class="p">):</span>
+                 <span class="n">bn_epsilon</span><span class="p">,</span> <span class="n">dilation</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;Helper function that applies convolution, batch norm and activation.</span>
-<span class="sd">    Accepts inputs in &#39;channels_last&#39; format only.</span>
 <span class="sd">    Args:</span>
 <span class="sd">      layer_type: the following types are supported</span>
 <span class="sd">        &#39;conv1d&#39;, &#39;conv2d&#39;</span>
@@ -214,6 +214,7 @@ <h1>Source code for parts.cnns.conv_blocks</h1><div class="highlight"><pre>
       <span class="n">kernel_size</span><span class="o">=</span><span class="n">kernel_size</span><span class="p">,</span>
       <span class="n">strides</span><span class="o">=</span><span class="n">strides</span><span class="p">,</span>
       <span class="n">padding</span><span class="o">=</span><span class="n">padding</span><span class="p">,</span>
+      <span class="n">dilation_rate</span><span class="o">=</span><span class="n">dilation</span><span class="p">,</span>
       <span class="n">kernel_regularizer</span><span class="o">=</span><span class="n">regularizer</span><span class="p">,</span>
       <span class="n">use_bias</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
       <span class="n">data_format</span><span class="o">=</span><span class="n">data_format</span><span class="p">,</span>
@@ -223,7 +224,8 @@ <h1>Source code for parts.cnns.conv_blocks</h1><div class="highlight"><pre>
   <span class="c1"># To-Do check if batchnorm works smoothly for &gt;4 dimensional tensors</span>
   <span class="n">squeeze</span> <span class="o">=</span> <span class="kc">False</span>
   <span class="k">if</span> <span class="n">layer_type</span> <span class="o">==</span> <span class="s2">&quot;conv1d&quot;</span><span class="p">:</span>
-    <span class="n">conv</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">expand_dims</span><span class="p">(</span><span class="n">conv</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>  <span class="c1"># NWC --&gt; NHWC</span>
+    <span class="n">axis</span> <span class="o">=</span> <span class="mi">1</span> <span class="k">if</span> <span class="n">data_format</span> <span class="o">==</span> <span class="s1">&#39;channels_last&#39;</span> <span class="k">else</span> <span class="mi">2</span>
+    <span class="n">conv</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">expand_dims</span><span class="p">(</span><span class="n">conv</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="n">axis</span><span class="p">)</span>  <span class="c1"># NWC --&gt; NHWC</span>
     <span class="n">squeeze</span> <span class="o">=</span> <span class="kc">True</span>
 
   <span class="n">bn</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">batch_normalization</span><span class="p">(</span>
@@ -237,12 +239,87 @@ <h1>Source code for parts.cnns.conv_blocks</h1><div class="highlight"><pre>
   <span class="p">)</span>
 
   <span class="k">if</span> <span class="n">squeeze</span><span class="p">:</span>
-    <span class="n">bn</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">bn</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+    <span class="n">bn</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">bn</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="n">axis</span><span class="p">)</span>
 
   <span class="n">output</span> <span class="o">=</span> <span class="n">bn</span>
   <span class="k">if</span> <span class="n">activation_fn</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
     <span class="n">output</span> <span class="o">=</span> <span class="n">activation_fn</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
   <span class="k">return</span> <span class="n">output</span></div>
+
+
+<div class="viewcode-block" id="conv_ln_actv"><a class="viewcode-back" href="../../../api-docs/parts.cnns.html#parts.cnns.conv_blocks.conv_ln_actv">[docs]</a><span class="k">def</span> <span class="nf">conv_ln_actv</span><span class="p">(</span><span class="n">layer_type</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">inputs</span><span class="p">,</span> <span class="n">filters</span><span class="p">,</span> <span class="n">kernel_size</span><span class="p">,</span> <span class="n">activation_fn</span><span class="p">,</span> <span class="n">strides</span><span class="p">,</span>
+                 <span class="n">padding</span><span class="p">,</span> <span class="n">regularizer</span><span class="p">,</span> <span class="n">training</span><span class="p">,</span> <span class="n">data_format</span><span class="p">,</span> <span class="n">dilation</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+  <span class="sd">&quot;&quot;&quot;Helper function that applies convolution, layer norm and activation.</span>
+<span class="sd">    Args:</span>
+<span class="sd">      layer_type: the following types are supported</span>
+<span class="sd">        &#39;conv1d&#39;, &#39;conv2d&#39;</span>
+<span class="sd">  &quot;&quot;&quot;</span>
+  <span class="n">layer</span> <span class="o">=</span> <span class="n">layers_dict</span><span class="p">[</span><span class="n">layer_type</span><span class="p">]</span>
+
+  <span class="n">conv</span> <span class="o">=</span> <span class="n">layer</span><span class="p">(</span>
+      <span class="n">name</span><span class="o">=</span><span class="s2">&quot;</span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">name</span><span class="p">),</span>
+      <span class="n">inputs</span><span class="o">=</span><span class="n">inputs</span><span class="p">,</span>
+      <span class="n">filters</span><span class="o">=</span><span class="n">filters</span><span class="p">,</span>
+      <span class="n">kernel_size</span><span class="o">=</span><span class="n">kernel_size</span><span class="p">,</span>
+      <span class="n">strides</span><span class="o">=</span><span class="n">strides</span><span class="p">,</span>
+      <span class="n">padding</span><span class="o">=</span><span class="n">padding</span><span class="p">,</span>
+      <span class="n">dilation_rate</span><span class="o">=</span><span class="n">dilation</span><span class="p">,</span>
+      <span class="n">kernel_regularizer</span><span class="o">=</span><span class="n">regularizer</span><span class="p">,</span>
+      <span class="n">use_bias</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+      <span class="n">data_format</span><span class="o">=</span><span class="n">data_format</span><span class="p">,</span>
+  <span class="p">)</span>
+
+  <span class="k">if</span> <span class="n">data_format</span> <span class="o">==</span> <span class="s1">&#39;channels_first&#39;</span><span class="p">:</span>
+    <span class="k">if</span> <span class="n">layer_type</span> <span class="o">==</span> <span class="s2">&quot;conv1d&quot;</span><span class="p">:</span>
+      <span class="n">conv</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">conv</span><span class="p">,</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">1</span><span class="p">])</span>
+    <span class="k">elif</span> <span class="n">layer_type</span> <span class="o">==</span> <span class="s2">&quot;conv2d&quot;</span><span class="p">:</span>
+      <span class="n">conv</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">conv</span><span class="p">,</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">1</span><span class="p">])</span>
+  <span class="n">ln</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">contrib</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">layer_norm</span><span class="p">(</span>
+      <span class="n">inputs</span><span class="o">=</span><span class="n">conv</span><span class="p">,</span>
+  <span class="p">)</span>
+  <span class="k">if</span> <span class="n">data_format</span> <span class="o">==</span> <span class="s1">&#39;channels_first&#39;</span><span class="p">:</span>
+    <span class="k">if</span> <span class="n">layer_type</span> <span class="o">==</span> <span class="s2">&quot;conv1d&quot;</span><span class="p">:</span>
+      <span class="n">ln</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">ln</span><span class="p">,</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">1</span><span class="p">])</span>
+    <span class="k">elif</span> <span class="n">layer_type</span> <span class="o">==</span> <span class="s2">&quot;conv2d&quot;</span><span class="p">:</span>
+      <span class="n">ln</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">ln</span><span class="p">,</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">])</span>
+
+  <span class="n">output</span> <span class="o">=</span> <span class="n">ln</span>
+  <span class="k">if</span> <span class="n">activation_fn</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+    <span class="n">output</span> <span class="o">=</span> <span class="n">activation_fn</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
+  <span class="k">return</span> <span class="n">output</span></div>
+
+<div class="viewcode-block" id="conv_in_actv"><a class="viewcode-back" href="../../../api-docs/parts.cnns.html#parts.cnns.conv_blocks.conv_in_actv">[docs]</a><span class="k">def</span> <span class="nf">conv_in_actv</span><span class="p">(</span><span class="n">layer_type</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">inputs</span><span class="p">,</span> <span class="n">filters</span><span class="p">,</span> <span class="n">kernel_size</span><span class="p">,</span> <span class="n">activation_fn</span><span class="p">,</span> <span class="n">strides</span><span class="p">,</span>
+                 <span class="n">padding</span><span class="p">,</span> <span class="n">regularizer</span><span class="p">,</span> <span class="n">training</span><span class="p">,</span> <span class="n">data_format</span><span class="p">,</span> <span class="n">dilation</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+  <span class="sd">&quot;&quot;&quot;Helper function that applies convolution, instance norm and activation.</span>
+<span class="sd">    Args:</span>
+<span class="sd">      layer_type: the following types are supported</span>
+<span class="sd">        &#39;conv1d&#39;, &#39;conv2d&#39;</span>
+<span class="sd">  &quot;&quot;&quot;</span>
+  <span class="n">layer</span> <span class="o">=</span> <span class="n">layers_dict</span><span class="p">[</span><span class="n">layer_type</span><span class="p">]</span>
+
+  <span class="n">conv</span> <span class="o">=</span> <span class="n">layer</span><span class="p">(</span>
+      <span class="n">name</span><span class="o">=</span><span class="s2">&quot;</span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">name</span><span class="p">),</span>
+      <span class="n">inputs</span><span class="o">=</span><span class="n">inputs</span><span class="p">,</span>
+      <span class="n">filters</span><span class="o">=</span><span class="n">filters</span><span class="p">,</span>
+      <span class="n">kernel_size</span><span class="o">=</span><span class="n">kernel_size</span><span class="p">,</span>
+      <span class="n">strides</span><span class="o">=</span><span class="n">strides</span><span class="p">,</span>
+      <span class="n">padding</span><span class="o">=</span><span class="n">padding</span><span class="p">,</span>
+      <span class="n">dilation_rate</span><span class="o">=</span><span class="n">dilation</span><span class="p">,</span>
+      <span class="n">kernel_regularizer</span><span class="o">=</span><span class="n">regularizer</span><span class="p">,</span>
+      <span class="n">use_bias</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+      <span class="n">data_format</span><span class="o">=</span><span class="n">data_format</span><span class="p">,</span>
+  <span class="p">)</span>
+
+  <span class="n">sn</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">contrib</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">instance_norm</span><span class="p">(</span>
+      <span class="n">inputs</span><span class="o">=</span><span class="n">conv</span><span class="p">,</span>
+      <span class="n">data_format</span><span class="o">=</span><span class="s2">&quot;NHWC&quot;</span> <span class="k">if</span> <span class="n">data_format</span> <span class="o">==</span> <span class="s1">&#39;channels_last&#39;</span> <span class="k">else</span> <span class="s2">&quot;NCHW&quot;</span>
+  <span class="p">)</span>
+
+  <span class="n">output</span> <span class="o">=</span> <span class="n">sn</span>
+  <span class="k">if</span> <span class="n">activation_fn</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+    <span class="n">output</span> <span class="o">=</span> <span class="n">activation_fn</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
+  <span class="k">return</span> <span class="n">output</span></div>
+
 </pre></div>
 
            </div>
diff --git a/docs/html/_modules/parts/convs2s/attention_wn_layer.html b/docs/html/_modules/parts/convs2s/attention_wn_layer.html
index 610a45e6f..120513f31 100644
--- a/docs/html/_modules/parts/convs2s/attention_wn_layer.html
+++ b/docs/html/_modules/parts/convs2s/attention_wn_layer.html
@@ -171,7 +171,12 @@ <h1>Source code for parts.convs2s.attention_wn_layer</h1><div class="highlight">
 <div class="viewcode-block" id="AttentionLayerNormalized"><a class="viewcode-back" href="../../../api-docs/parts.convs2s.html#parts.convs2s.attention_wn_layer.AttentionLayerNormalized">[docs]</a><span class="k">class</span> <span class="nc">AttentionLayerNormalized</span><span class="p">(</span><span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Layer</span><span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;Attention layer for convs2s with weight normalization&quot;&quot;&quot;</span>
 
-<div class="viewcode-block" id="AttentionLayerNormalized.__init__"><a class="viewcode-back" href="../../../api-docs/parts.convs2s.html#parts.convs2s.attention_wn_layer.AttentionLayerNormalized.__init__">[docs]</a>  <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">in_dim</span><span class="p">,</span> <span class="n">embed_size</span><span class="p">,</span> <span class="n">layer_id</span><span class="p">,</span> <span class="n">add_res</span><span class="p">,</span> <span class="n">mode</span><span class="p">):</span>
+<div class="viewcode-block" id="AttentionLayerNormalized.__init__"><a class="viewcode-back" href="../../../api-docs/parts.convs2s.html#parts.convs2s.attention_wn_layer.AttentionLayerNormalized.__init__">[docs]</a>  <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">in_dim</span><span class="p">,</span> <span class="n">embed_size</span><span class="p">,</span> <span class="n">layer_id</span><span class="p">,</span> <span class="n">add_res</span><span class="p">,</span> <span class="n">mode</span><span class="p">,</span>
+               <span class="n">scaling_factor</span><span class="o">=</span><span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">0.5</span><span class="p">),</span>
+               <span class="n">normalization_type</span><span class="o">=</span><span class="s2">&quot;weight_norm&quot;</span><span class="p">,</span>
+               <span class="n">regularizer</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+               <span class="n">init_var</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+               <span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;initializes the attention layer.</span>
 <span class="sd">    It uses weight normalization for linear projections</span>
 <span class="sd">    (Salimans &amp; Kingma, 2016)  w = g * v/2-norm(v)</span>
@@ -186,6 +191,9 @@ <h1>Source code for parts.convs2s.attention_wn_layer</h1><div class="highlight">
     <span class="nb">super</span><span class="p">(</span><span class="n">AttentionLayerNormalized</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
 
     <span class="bp">self</span><span class="o">.</span><span class="n">add_res</span> <span class="o">=</span> <span class="n">add_res</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span> <span class="o">=</span> <span class="n">scaling_factor</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span> <span class="o">=</span> <span class="n">regularizer</span>
+
     <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;attention_layer_&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">layer_id</span><span class="p">)):</span>
 
       <span class="c1"># linear projection layer to project the attention input to target space</span>
@@ -194,7 +202,11 @@ <h1>Source code for parts.convs2s.attention_wn_layer</h1><div class="highlight">
           <span class="n">embed_size</span><span class="p">,</span>
           <span class="n">dropout</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
           <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;att_linear_mapping_tgt_embed&quot;</span><span class="p">,</span>
-          <span class="n">mode</span><span class="o">=</span><span class="n">mode</span><span class="p">)</span>
+          <span class="n">mode</span><span class="o">=</span><span class="n">mode</span><span class="p">,</span>
+          <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">,</span>
+          <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+          <span class="n">init_var</span><span class="o">=</span><span class="n">init_var</span>
+      <span class="p">)</span>
 
       <span class="c1"># linear projection layer to project back to the input space</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">out_proj</span> <span class="o">=</span> <span class="n">FeedFowardNetworkNormalized</span><span class="p">(</span>
@@ -202,7 +214,11 @@ <h1>Source code for parts.convs2s.attention_wn_layer</h1><div class="highlight">
           <span class="n">in_dim</span><span class="p">,</span>
           <span class="n">dropout</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
           <span class="n">var_scope_name</span><span class="o">=</span><span class="s2">&quot;att_linear_mapping_out&quot;</span><span class="p">,</span>
-          <span class="n">mode</span><span class="o">=</span><span class="n">mode</span><span class="p">)</span></div>
+          <span class="n">mode</span><span class="o">=</span><span class="n">mode</span><span class="p">,</span>
+          <span class="n">normalization_type</span><span class="o">=</span><span class="n">normalization_type</span><span class="p">,</span>
+          <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">,</span>
+          <span class="n">init_var</span><span class="o">=</span><span class="n">init_var</span>
+      <span class="p">)</span></div>
 
 <div class="viewcode-block" id="AttentionLayerNormalized.call"><a class="viewcode-back" href="../../../api-docs/parts.convs2s.html#parts.convs2s.attention_wn_layer.AttentionLayerNormalized.call">[docs]</a>  <span class="k">def</span> <span class="nf">call</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">,</span> <span class="n">target_embed</span><span class="p">,</span> <span class="n">encoder_output_a</span><span class="p">,</span> <span class="n">encoder_output_b</span><span class="p">,</span>
            <span class="n">input_attention_bias</span><span class="p">):</span>
@@ -224,7 +240,7 @@ <h1>Source code for parts.convs2s.attention_wn_layer</h1><div class="highlight">
 <span class="sd">    &quot;&quot;&quot;</span>
 
     <span class="n">h_proj</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">tgt_embed_proj</span><span class="p">(</span><span class="nb">input</span><span class="p">)</span>
-    <span class="n">d_proj</span> <span class="o">=</span> <span class="p">(</span><span class="n">h_proj</span> <span class="o">+</span> <span class="n">target_embed</span><span class="p">)</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">0.5</span><span class="p">)</span>
+    <span class="n">d_proj</span> <span class="o">=</span> <span class="p">(</span><span class="n">h_proj</span> <span class="o">+</span> <span class="n">target_embed</span><span class="p">)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span>
     <span class="n">att_score</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">matmul</span><span class="p">(</span><span class="n">d_proj</span><span class="p">,</span> <span class="n">encoder_output_a</span><span class="p">,</span> <span class="n">transpose_b</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
 
     <span class="c1"># Masking need to be done in float32. Added to support mixed-precision training.</span>
@@ -245,7 +261,7 @@ <h1>Source code for parts.convs2s.attention_wn_layer</h1><div class="highlight">
     <span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_proj</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">add_res</span><span class="p">:</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="p">(</span><span class="n">output</span> <span class="o">+</span> <span class="nb">input</span><span class="p">)</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">0.5</span><span class="p">)</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="p">(</span><span class="n">output</span> <span class="o">+</span> <span class="nb">input</span><span class="p">)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">scaling_factor</span>
 
     <span class="k">return</span> <span class="n">output</span></div></div>
 </pre></div>
diff --git a/docs/html/_modules/parts/convs2s/conv_wn_layer.html b/docs/html/_modules/parts/convs2s/conv_wn_layer.html
index 3ee5b38d3..319ec5a13 100644
--- a/docs/html/_modules/parts/convs2s/conv_wn_layer.html
+++ b/docs/html/_modules/parts/convs2s/conv_wn_layer.html
@@ -166,6 +166,7 @@ <h1>Source code for parts.convs2s.conv_wn_layer</h1><div class="highlight"><pre>
 <span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 <span class="kn">import</span> <span class="nn">math</span>
 <span class="kn">from</span> <span class="nn">open_seq2seq.parts.convs2s.utils</span> <span class="k">import</span> <span class="n">gated_linear_units</span>
+<span class="kn">from</span> <span class="nn">open_seq2seq.parts.transformer.common</span> <span class="k">import</span> <span class="n">LayerNormalization</span>
 
 
 <div class="viewcode-block" id="Conv1DNetworkNormalized"><a class="viewcode-back" href="../../../api-docs/parts.convs2s.html#parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized">[docs]</a><span class="k">class</span> <span class="nc">Conv1DNetworkNormalized</span><span class="p">(</span><span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Layer</span><span class="p">):</span>
@@ -181,7 +182,10 @@ <h1>Source code for parts.convs2s.conv_wn_layer</h1><div class="highlight"><pre>
                <span class="n">conv_padding</span><span class="p">,</span>
                <span class="n">decode_padding</span><span class="p">,</span>
                <span class="n">activation</span><span class="o">=</span><span class="n">gated_linear_units</span><span class="p">,</span>
-               <span class="n">normalization_type</span><span class="o">=</span><span class="s2">&quot;weight_norm&quot;</span><span class="p">):</span>
+               <span class="n">normalization_type</span><span class="o">=</span><span class="s2">&quot;weight_norm&quot;</span><span class="p">,</span>
+               <span class="n">regularizer</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="c1"># tf.contrib.layers.l2_regularizer(scale=1e-4)</span>
+               <span class="n">init_var</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+               <span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;initializes the 1D convolution layer.</span>
 <span class="sd">    It uses weight normalization (Salimans &amp; Kingma, 2016)  w = g * v/2-norm(v)</span>
 
@@ -200,7 +204,9 @@ <h1>Source code for parts.convs2s.conv_wn_layer</h1><div class="highlight"><pre>
 <span class="sd">      activation: the activation function applies after the convolution</span>
 <span class="sd">      normalization_type: str specifies the normalization used for the layer.</span>
 <span class="sd">                    &quot;weight_norm&quot; for weight normalization or</span>
-<span class="sd">                    &quot;batch_norm&quot; for batch normalization</span>
+<span class="sd">                    &quot;batch_norm&quot; for batch normalization or</span>
+<span class="sd">                    &quot;layer_norm&quot; for layer normalization</span>
+<span class="sd">      regularizer: the regularizer for the batch normalization</span>
 
 <span class="sd">    &quot;&quot;&quot;</span>
 
@@ -212,19 +218,28 @@ <h1>Source code for parts.convs2s.conv_wn_layer</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">kernel_width</span> <span class="o">=</span> <span class="n">kernel_width</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">layer_id</span> <span class="o">=</span> <span class="n">layer_id</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">act_func</span> <span class="o">=</span> <span class="n">activation</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span> <span class="o">=</span> <span class="n">regularizer</span>
 
     <span class="k">if</span> <span class="n">normalization_type</span> <span class="o">==</span> <span class="s2">&quot;batch_norm&quot;</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span> <span class="o">=</span> <span class="kc">True</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span> <span class="o">=</span> <span class="kc">False</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span> <span class="o">=</span> <span class="kc">False</span>
     <span class="k">elif</span> <span class="n">normalization_type</span> <span class="o">==</span> <span class="s2">&quot;weight_norm&quot;</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span> <span class="o">=</span> <span class="kc">False</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span> <span class="o">=</span> <span class="kc">True</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span> <span class="o">=</span> <span class="kc">True</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span> <span class="o">=</span> <span class="kc">False</span>
+    <span class="k">elif</span> <span class="n">normalization_type</span> <span class="o">==</span> <span class="s2">&quot;layer_norm&quot;</span><span class="p">:</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span> <span class="o">=</span> <span class="kc">True</span>
     <span class="k">elif</span> <span class="n">normalization_type</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span> <span class="o">=</span> <span class="kc">False</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span> <span class="o">=</span> <span class="kc">True</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span> <span class="o">=</span> <span class="kc">False</span>
     <span class="k">else</span><span class="p">:</span>
       <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Wrong normalization type: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">normalization_type</span><span class="p">))</span>
 
@@ -234,8 +249,11 @@ <h1>Source code for parts.convs2s.conv_wn_layer</h1><div class="highlight"><pre>
       <span class="n">conv_out_size</span> <span class="o">=</span> <span class="n">out_dim</span>
 
     <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="s2">&quot;conv_layer_&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">layer_id</span><span class="p">)):</span>
-      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span><span class="p">:</span>
+      <span class="k">if</span> <span class="n">init_var</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
         <span class="n">V_std</span> <span class="o">=</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mf">4.0</span> <span class="o">*</span> <span class="n">hidden_dropout</span> <span class="o">/</span> <span class="p">(</span><span class="n">kernel_width</span> <span class="o">*</span> <span class="n">in_dim</span><span class="p">))</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">V_std</span> <span class="o">=</span> <span class="n">init_var</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span><span class="p">:</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">V</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
             <span class="s1">&#39;V&#39;</span><span class="p">,</span>
             <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="n">kernel_width</span><span class="p">,</span> <span class="n">in_dim</span><span class="p">,</span> <span class="n">conv_out_size</span><span class="p">],</span>
@@ -249,8 +267,9 @@ <h1>Source code for parts.convs2s.conv_wn_layer</h1><div class="highlight"><pre>
         <span class="bp">self</span><span class="o">.</span><span class="n">W</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
             <span class="s1">&#39;W&#39;</span><span class="p">,</span>
             <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="n">kernel_width</span><span class="p">,</span> <span class="n">in_dim</span><span class="p">,</span> <span class="n">conv_out_size</span><span class="p">],</span>
-            <span class="n">initializer</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">random_normal_initializer</span><span class="p">(</span><span class="n">mean</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">stddev</span><span class="o">=</span><span class="mf">0.01</span><span class="p">),</span>
-            <span class="n">trainable</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+            <span class="n">initializer</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">random_normal_initializer</span><span class="p">(</span><span class="n">mean</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">stddev</span><span class="o">=</span><span class="n">V_std</span><span class="p">),</span>
+            <span class="n">trainable</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+            <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">)</span>
 
       <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span><span class="p">:</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
@@ -259,7 +278,13 @@ <h1>Source code for parts.convs2s.conv_wn_layer</h1><div class="highlight"><pre>
             <span class="n">initializer</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">zeros_initializer</span><span class="p">(),</span>
             <span class="n">trainable</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
       <span class="k">else</span><span class="p">:</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="o">=</span> <span class="kc">None</span></div>
+        <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="o">=</span> <span class="kc">None</span>
+
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span><span class="p">:</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">layer_norm</span> <span class="o">=</span> <span class="n">LayerNormalization</span><span class="p">(</span><span class="n">out_dim</span><span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">layer_norm</span> <span class="o">=</span> <span class="kc">None</span></div>
+
 
 <div class="viewcode-block" id="Conv1DNetworkNormalized.call"><a class="viewcode-back" href="../../../api-docs/parts.convs2s.html#parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized.call">[docs]</a>  <span class="k">def</span> <span class="nf">call</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Applies convolution with gated linear units on x.</span>
@@ -270,40 +295,42 @@ <h1>Source code for parts.convs2s.conv_wn_layer</h1><div class="highlight"><pre>
 <span class="sd">    Returns:</span>
 <span class="sd">      float32 tensor with shape [batch_size, length, out_dim].</span>
 <span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">x</span> <span class="o">=</span> <span class="nb">input</span>
+    <span class="n">output</span> <span class="o">=</span> <span class="nb">input</span>
+
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s2">&quot;train&quot;</span><span class="p">:</span>
-      <span class="n">x</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">dropout</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dropout</span><span class="p">)</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">dropout</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dropout</span><span class="p">)</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">decode_padding</span><span class="p">:</span>
-      <span class="n">x</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
-          <span class="n">x</span><span class="p">,</span> <span class="p">[[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">],</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">kernel_width</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">kernel_width</span> <span class="o">-</span> <span class="mi">1</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">]],</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+          <span class="n">output</span><span class="p">,</span> <span class="p">[[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">],</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">kernel_width</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">kernel_width</span> <span class="o">-</span> <span class="mi">1</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">]],</span>
           <span class="s2">&quot;CONSTANT&quot;</span><span class="p">)</span>
 
     <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">conv1d</span><span class="p">(</span>
-        <span class="n">value</span><span class="o">=</span><span class="n">x</span><span class="p">,</span> <span class="n">filters</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">W</span><span class="p">,</span> <span class="n">stride</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">conv_padding</span><span class="p">)</span>
-
-    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">bias_add</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">b</span><span class="p">)</span>
+        <span class="n">value</span><span class="o">=</span><span class="n">output</span><span class="p">,</span> <span class="n">filters</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">W</span><span class="p">,</span> <span class="n">stride</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">conv_padding</span><span class="p">)</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">decode_padding</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">kernel_width</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
       <span class="n">output</span> <span class="o">=</span> <span class="n">output</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">:</span><span class="o">-</span><span class="bp">self</span><span class="o">.</span><span class="n">kernel_width</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="p">:]</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span><span class="p">:</span>
       <span class="c1"># trick to make batchnorm work for mixed precision training.</span>
-      <span class="c1"># To-Do check if batchnorm works smoothly for &gt;4 dimensional tensors</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">expand_dims</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>  <span class="c1"># NWC --&gt; NHWC</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">batch_normalization</span><span class="p">(</span>
+      <span class="n">bn_input</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">expand_dims</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+      <span class="n">bn_output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">batch_normalization</span><span class="p">(</span>
           <span class="n">name</span><span class="o">=</span><span class="s2">&quot;batch_norm_&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">layer_id</span><span class="p">),</span>
-          <span class="n">inputs</span><span class="o">=</span><span class="n">output</span><span class="p">,</span>
-          <span class="c1">#gamma_regularizer=regularizer,</span>
+          <span class="n">inputs</span><span class="o">=</span><span class="n">bn_input</span><span class="p">,</span>
           <span class="n">training</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train&#39;</span><span class="p">,</span>
           <span class="n">axis</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span>
-          <span class="n">momentum</span><span class="o">=</span><span class="mf">0.99</span><span class="p">,</span>
-          <span class="n">epsilon</span><span class="o">=</span><span class="mf">1e-4</span><span class="p">,</span>
+          <span class="n">momentum</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+          <span class="n">epsilon</span><span class="o">=</span><span class="mf">1e-4</span>
       <span class="p">)</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">bn_output</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span><span class="p">:</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">layer_norm</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">bias_add</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">b</span><span class="p">)</span>
 
-    <span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">act_func</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">act_func</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">act_func</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
     <span class="k">return</span> <span class="n">output</span></div></div>
 </pre></div>
 
diff --git a/docs/html/_modules/parts/convs2s/ffn_wn_layer.html b/docs/html/_modules/parts/convs2s/ffn_wn_layer.html
index b44b4d8ad..00beff4c6 100644
--- a/docs/html/_modules/parts/convs2s/ffn_wn_layer.html
+++ b/docs/html/_modules/parts/convs2s/ffn_wn_layer.html
@@ -165,6 +165,7 @@ <h1>Source code for parts.convs2s.ffn_wn_layer</h1><div class="highlight"><pre>
 
 <span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 <span class="kn">import</span> <span class="nn">math</span>
+<span class="kn">from</span> <span class="nn">open_seq2seq.parts.transformer.common</span> <span class="k">import</span> <span class="n">LayerNormalization</span>
 
 
 <div class="viewcode-block" id="FeedFowardNetworkNormalized"><a class="viewcode-back" href="../../../api-docs/parts.convs2s.html#parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized">[docs]</a><span class="k">class</span> <span class="nc">FeedFowardNetworkNormalized</span><span class="p">(</span><span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Layer</span><span class="p">):</span>
@@ -176,7 +177,10 @@ <h1>Source code for parts.convs2s.ffn_wn_layer</h1><div class="highlight"><pre>
                <span class="n">dropout</span><span class="p">,</span>
                <span class="n">var_scope_name</span><span class="p">,</span>
                <span class="n">mode</span><span class="p">,</span>
-               <span class="n">normalization_type</span><span class="o">=</span><span class="s2">&quot;weight_norm&quot;</span><span class="p">):</span>
+               <span class="n">normalization_type</span><span class="o">=</span><span class="s2">&quot;weight_norm&quot;</span><span class="p">,</span>
+               <span class="n">regularizer</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+               <span class="n">init_var</span><span class="o">=</span><span class="kc">None</span>
+               <span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;initializes the linear layer.</span>
 <span class="sd">    This layer projects from in_dim-dimenstional space to out_dim-dimentional space.</span>
 <span class="sd">    It uses weight normalization (Salimans &amp; Kingma, 2016)  w = g * v/2-norm(v)</span>
@@ -196,6 +200,7 @@ <h1>Source code for parts.convs2s.ffn_wn_layer</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span> <span class="o">=</span> <span class="n">out_dim</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">in_dim</span> <span class="o">=</span> <span class="n">in_dim</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">normalization_type</span> <span class="o">=</span> <span class="n">normalization_type</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span> <span class="o">=</span> <span class="n">regularizer</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">var_scope_name</span> <span class="o">=</span> <span class="n">var_scope_name</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">mode</span> <span class="o">=</span> <span class="n">mode</span>
 
@@ -203,21 +208,34 @@ <h1>Source code for parts.convs2s.ffn_wn_layer</h1><div class="highlight"><pre>
       <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span> <span class="o">=</span> <span class="kc">True</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span> <span class="o">=</span> <span class="kc">False</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span> <span class="o">=</span> <span class="kc">False</span>
     <span class="k">elif</span> <span class="n">normalization_type</span> <span class="o">==</span> <span class="s2">&quot;weight_norm&quot;</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span> <span class="o">=</span> <span class="kc">False</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span> <span class="o">=</span> <span class="kc">True</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span> <span class="o">=</span> <span class="kc">True</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span> <span class="o">=</span> <span class="kc">False</span>
+    <span class="k">elif</span> <span class="n">normalization_type</span> <span class="o">==</span> <span class="s2">&quot;layer_norm&quot;</span><span class="p">:</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span> <span class="o">=</span> <span class="kc">True</span>
     <span class="k">elif</span> <span class="n">normalization_type</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span> <span class="o">=</span> <span class="kc">False</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span> <span class="o">=</span> <span class="kc">True</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span> <span class="o">=</span> <span class="kc">False</span>
+      <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span> <span class="o">=</span> <span class="kc">False</span>
     <span class="k">else</span><span class="p">:</span>
       <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Wrong normalization type: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">normalization_type</span><span class="p">))</span>
 
     <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">variable_scope</span><span class="p">(</span><span class="n">var_scope_name</span><span class="p">):</span>
+      <span class="k">if</span> <span class="n">init_var</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+        <span class="n">V_std</span> <span class="o">=</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">dropout</span> <span class="o">*</span> <span class="mf">1.0</span> <span class="o">/</span> <span class="n">in_dim</span><span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">V_std</span> <span class="o">=</span> <span class="n">init_var</span>
+
       <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span><span class="p">:</span>
         <span class="n">V_initializer</span> <span class="o">=</span> \
-          <span class="n">tf</span><span class="o">.</span><span class="n">random_normal_initializer</span><span class="p">(</span><span class="n">mean</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">stddev</span><span class="o">=</span><span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">dropout</span> <span class="o">*</span> <span class="mf">1.0</span> <span class="o">/</span> <span class="n">in_dim</span><span class="p">))</span>
+          <span class="n">tf</span><span class="o">.</span><span class="n">random_normal_initializer</span><span class="p">(</span><span class="n">mean</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">stddev</span><span class="o">=</span><span class="n">V_std</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">V</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
             <span class="s1">&#39;V&#39;</span><span class="p">,</span>
             <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="n">in_dim</span><span class="p">,</span> <span class="n">out_dim</span><span class="p">],</span>
@@ -229,8 +247,9 @@ <h1>Source code for parts.convs2s.ffn_wn_layer</h1><div class="highlight"><pre>
         <span class="bp">self</span><span class="o">.</span><span class="n">V</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
             <span class="s1">&#39;W&#39;</span><span class="p">,</span>
             <span class="n">shape</span><span class="o">=</span><span class="p">[</span><span class="n">in_dim</span><span class="p">,</span> <span class="n">out_dim</span><span class="p">],</span>
-            <span class="n">initializer</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">random_normal_initializer</span><span class="p">(</span><span class="n">mean</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">stddev</span><span class="o">=</span><span class="mf">0.01</span><span class="p">),</span>
-            <span class="n">trainable</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+            <span class="n">initializer</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">random_normal_initializer</span><span class="p">(</span><span class="n">mean</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">stddev</span><span class="o">=</span><span class="n">V_std</span><span class="p">),</span>
+            <span class="n">trainable</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">)</span>
+
       <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias_enabled</span><span class="p">:</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span>
             <span class="s1">&#39;b&#39;</span><span class="p">,</span>
@@ -238,7 +257,13 @@ <h1>Source code for parts.convs2s.ffn_wn_layer</h1><div class="highlight"><pre>
             <span class="n">initializer</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">zeros_initializer</span><span class="p">(),</span>
             <span class="n">trainable</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
       <span class="k">else</span><span class="p">:</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="o">=</span> <span class="kc">None</span></div>
+        <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="o">=</span> <span class="kc">None</span>
+
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span><span class="p">:</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">layer_norm</span> <span class="o">=</span> <span class="n">LayerNormalization</span><span class="p">(</span><span class="n">out_dim</span><span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">layer_norm</span> <span class="o">=</span> <span class="kc">None</span></div>
+
 
 <div class="viewcode-block" id="FeedFowardNetworkNormalized.call"><a class="viewcode-back" href="../../../api-docs/parts.convs2s.html#parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized.call">[docs]</a>  <span class="k">def</span> <span class="nf">call</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
     <span class="sd">&quot;&quot;&quot;Projects x with its linear transformation.</span>
@@ -252,29 +277,33 @@ <h1>Source code for parts.convs2s.ffn_wn_layer</h1><div class="highlight"><pre>
     <span class="n">batch_size</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">x</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
 
     <span class="n">x</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">in_dim</span><span class="p">])</span>
-    <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">matmul</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">V</span><span class="p">)</span>
-    <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="p">[</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">])</span>
+    <span class="n">y</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">matmul</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">V</span><span class="p">)</span>
+    <span class="n">y</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="p">[</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">])</span>
 
     <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">wn_enabled</span><span class="p">:</span>
       <span class="c1"># x*(v*(g/2-norm(v)))</span>
       <span class="n">scaler</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">div</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">g</span><span class="p">,</span> <span class="n">tf</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">V</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">scaler</span><span class="p">,</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">])</span> <span class="o">*</span> <span class="n">output</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">scaler</span><span class="p">,</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">])</span> <span class="o">*</span> <span class="n">y</span>
 
-    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">output</span> <span class="o">+</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">b</span><span class="p">,</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">])</span>
-
-    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span><span class="p">:</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">expand_dims</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">batch_normalization</span><span class="p">(</span>
+    <span class="k">elif</span> <span class="bp">self</span><span class="o">.</span><span class="n">apply_batch_norm</span><span class="p">:</span>
+      <span class="n">bn_input</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">expand_dims</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+      <span class="n">bn_output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">batch_normalization</span><span class="p">(</span>
           <span class="n">name</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">var_scope_name</span> <span class="o">+</span> <span class="s2">&quot;_batch_norm&quot;</span><span class="p">,</span>
-          <span class="n">inputs</span><span class="o">=</span><span class="n">output</span><span class="p">,</span>
-          <span class="c1">#gamma_regularizer=regularizer,</span>
+          <span class="n">inputs</span><span class="o">=</span><span class="n">bn_input</span><span class="p">,</span>
           <span class="n">training</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train&#39;</span><span class="p">,</span>
           <span class="n">axis</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span>
-          <span class="n">momentum</span><span class="o">=</span><span class="mf">0.99</span><span class="p">,</span>
-          <span class="n">epsilon</span><span class="o">=</span><span class="mf">1e-4</span><span class="p">,</span>
+          <span class="n">momentum</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+          <span class="n">epsilon</span><span class="o">=</span><span class="mf">1e-4</span>
       <span class="p">)</span>
-      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">output</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">bn_output</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+
+    <span class="k">elif</span> <span class="bp">self</span><span class="o">.</span><span class="n">apply_layer_norm</span><span class="p">:</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">layer_norm</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="n">y</span>
+
+    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">b</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+      <span class="n">output</span> <span class="o">=</span> <span class="n">output</span> <span class="o">+</span> <span class="n">tf</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">b</span><span class="p">,</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">])</span>
 
     <span class="k">return</span> <span class="n">output</span></div></div>
 </pre></div>
diff --git a/docs/html/_modules/parts/rnns/attention_wrapper.html b/docs/html/_modules/parts/rnns/attention_wrapper.html
index b077297ee..670253cf4 100644
--- a/docs/html/_modules/parts/rnns/attention_wrapper.html
+++ b/docs/html/_modules/parts/rnns/attention_wrapper.html
@@ -155,8 +155,7 @@
            <div itemprop="articleBody">
             
   <h1>Source code for parts.rnns.attention_wrapper</h1><div class="highlight"><pre>
-<span></span><span class="c1"># pylint: skip-file</span>
-<span class="c1"># Copyright 2017 The TensorFlow Authors. All Rights Reserved.</span>
+<span></span><span class="c1"># Copyright 2017 The TensorFlow Authors. All Rights Reserved.</span>
 <span class="c1">#</span>
 <span class="c1"># Licensed under the Apache License, Version 2.0 (the &quot;License&quot;);</span>
 <span class="c1"># you may not use this file except in compliance with the License.</span>
@@ -933,7 +932,7 @@ <h1>Source code for parts.rnns.attention_wrapper</h1><div class="highlight"><pre
         <span class="n">score_mask_value</span><span class="o">=</span><span class="n">score_mask_value</span><span class="p">,</span>
         <span class="n">name</span><span class="o">=</span><span class="n">name</span>
     <span class="p">)</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">location_layer</span> <span class="o">=</span> <span class="n">LocationLayer</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">31</span><span class="p">,</span> <span class="n">num_units</span><span class="p">)</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">location_layer</span> <span class="o">=</span> <span class="n">LocationLayer</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="n">num_units</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_num_units</span> <span class="o">=</span> <span class="n">num_units</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="n">name</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">use_bias</span> <span class="o">=</span> <span class="n">use_bias</span></div>
@@ -961,12 +960,10 @@ <h1>Source code for parts.rnns.attention_wrapper</h1><div class="highlight"><pre
           <span class="n">processed_query</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_keys</span><span class="p">,</span> <span class="n">processed_location</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">use_bias</span>
       <span class="p">)</span>
     <span class="n">alignments</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_probability_fn</span><span class="p">(</span><span class="n">score</span><span class="p">,</span> <span class="n">state</span><span class="p">)</span>
-
     <span class="n">next_state</span> <span class="o">=</span> <span class="n">alignments</span> <span class="o">+</span> <span class="n">state</span>
 
     <span class="k">return</span> <span class="n">alignments</span><span class="p">,</span> <span class="n">next_state</span></div>
 
-
 <div class="viewcode-block" id="safe_cumprod"><a class="viewcode-back" href="../../../api-docs/parts.rnns.html#parts.rnns.attention_wrapper.safe_cumprod">[docs]</a><span class="k">def</span> <span class="nf">safe_cumprod</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;Computes cumprod of x in logspace using cumsum to avoid underflow.</span>
 
@@ -1591,10 +1588,7 @@ <h1>Source code for parts.rnns.attention_wrapper</h1><div class="highlight"><pre
 <span class="sd">        is a list, and its length does not match that of `attention_layer_size`.</span>
 <span class="sd">    &quot;&quot;&quot;</span>
     <span class="nb">super</span><span class="p">(</span><span class="n">AttentionWrapper</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">)</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="n">rnn_cell_impl</span><span class="o">.</span><span class="n">_like_rnncell</span><span class="p">(</span><span class="n">cell</span><span class="p">):</span>  <span class="c1"># pylint: disable=protected-access</span>
-      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span>
-          <span class="s2">&quot;cell must be an RNNCell, saw type: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">type</span><span class="p">(</span><span class="n">cell</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span>
-      <span class="p">)</span>
+    <span class="n">rnn_cell_impl</span><span class="o">.</span><span class="n">assert_like_rnncell</span><span class="p">(</span><span class="s2">&quot;cell&quot;</span><span class="p">,</span><span class="n">cell</span><span class="p">)</span>
     <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">attention_mechanism</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="nb">tuple</span><span class="p">)):</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">_is_multi</span> <span class="o">=</span> <span class="kc">True</span>
       <span class="n">attention_mechanisms</span> <span class="o">=</span> <span class="n">attention_mechanism</span>
diff --git a/docs/html/_modules/parts/rnns/rnn_beam_search_decoder.html b/docs/html/_modules/parts/rnns/rnn_beam_search_decoder.html
index 07f933af3..adc11aeb7 100644
--- a/docs/html/_modules/parts/rnns/rnn_beam_search_decoder.html
+++ b/docs/html/_modules/parts/rnns/rnn_beam_search_decoder.html
@@ -354,8 +354,7 @@ <h1>Source code for parts.rnns.rnn_beam_search_decoder</h1><div class="highlight
 <span class="sd">      ValueError: If `start_tokens` is not a vector or</span>
 <span class="sd">        `end_token` is not a scalar.</span>
 <span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="n">rnn_cell_impl</span><span class="o">.</span><span class="n">_like_rnncell</span><span class="p">(</span><span class="n">cell</span><span class="p">):</span>  <span class="c1"># pylint: disable=protected-access</span>
-      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s2">&quot;cell must be an RNNCell, received: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">type</span><span class="p">(</span><span class="n">cell</span><span class="p">))</span>
+    <span class="n">rnn_cell_impl</span><span class="o">.</span><span class="n">assert_like_rnncell</span><span class="p">(</span><span class="s2">&quot;cell&quot;</span><span class="p">,</span><span class="n">cell</span><span class="p">)</span>
     <span class="k">if</span> <span class="p">(</span><span class="n">output_layer</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span>
         <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">output_layer</span><span class="p">,</span> <span class="n">layers_base</span><span class="o">.</span><span class="n">Layer</span><span class="p">)):</span>
       <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span>
diff --git a/docs/html/_modules/parts/rnns/utils.html b/docs/html/_modules/parts/rnns/utils.html
index 992a3a72a..9bc7f383d 100644
--- a/docs/html/_modules/parts/rnns/utils.html
+++ b/docs/html/_modules/parts/rnns/utils.html
@@ -158,10 +158,14 @@ <h1>Source code for parts.rnns.utils</h1><div class="highlight"><pre>
 <span></span><span class="c1"># Copyright (c) 2017 NVIDIA Corporation</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
+
+<span class="kn">import</span> <span class="nn">math</span>
+
 <span class="kn">from</span> <span class="nn">six.moves</span> <span class="k">import</span> <span class="nb">range</span>
+<span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
 
-<span class="kn">from</span> <span class="nn">tensorflow.python.ops.rnn_cell</span> <span class="k">import</span> <span class="n">ResidualWrapper</span><span class="p">,</span> <span class="n">DropoutWrapper</span><span class="p">,</span>\
-                                           <span class="n">MultiRNNCell</span>
+<span class="kn">from</span> <span class="nn">tensorflow.python.ops.rnn_cell</span> <span class="k">import</span> <span class="n">ResidualWrapper</span><span class="p">,</span> <span class="n">DropoutWrapper</span>
+<span class="kn">from</span> <span class="nn">open_seq2seq.parts.rnns.weight_drop</span> <span class="k">import</span> <span class="n">WeightDropLayerNormBasicLSTMCell</span>
 <span class="kn">from</span> <span class="nn">open_seq2seq.parts.rnns.slstm</span> <span class="k">import</span> <span class="n">BasicSLSTMCell</span>
 <span class="kn">from</span> <span class="nn">open_seq2seq.parts.rnns.glstm</span> <span class="k">import</span> <span class="n">GLSTMCell</span>
 <span class="kn">from</span> <span class="nn">open_seq2seq.parts.rnns.zoneout</span> <span class="k">import</span> <span class="n">ZoneoutWrapper</span>
@@ -172,9 +176,17 @@ <h1>Source code for parts.rnns.utils</h1><div class="highlight"><pre>
     <span class="n">cell_params</span><span class="p">,</span>
     <span class="n">dp_input_keep_prob</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
     <span class="n">dp_output_keep_prob</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+    <span class="n">recurrent_keep_prob</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+    <span class="n">input_weight_keep_prob</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+    <span class="n">recurrent_weight_keep_prob</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+    <span class="n">weight_variational</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+    <span class="n">dropout_seed</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
     <span class="n">zoneout_prob</span><span class="o">=</span><span class="mf">0.</span><span class="p">,</span>
     <span class="n">training</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-    <span class="n">residual_connections</span><span class="o">=</span><span class="kc">False</span>
+    <span class="n">residual_connections</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+    <span class="n">awd_initializer</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+    <span class="n">variational_recurrent</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="c1"># in case they want to use DropoutWrapper</span>
+    <span class="n">dtype</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
 <span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;Creates an instance of the rnn cell.</span>
 <span class="sd">     Such cell describes one step one layer and can include residual connection</span>
@@ -194,6 +206,24 @@ <h1>Source code for parts.rnns.utils</h1><div class="highlight"><pre>
 <span class="sd">     Returns:</span>
 <span class="sd">       TF RNN instance</span>
 <span class="sd">  &quot;&quot;&quot;</span>
+  <span class="k">if</span> <span class="n">awd_initializer</span><span class="p">:</span>
+    <span class="n">val</span> <span class="o">=</span> <span class="mf">1.0</span><span class="o">/</span><span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">cell_params</span><span class="p">[</span><span class="s1">&#39;num_units&#39;</span><span class="p">])</span>
+    <span class="n">cell_params</span><span class="p">[</span><span class="s1">&#39;initializer&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">random_uniform_initializer</span><span class="p">(</span><span class="n">minval</span><span class="o">=-</span><span class="n">val</span><span class="p">,</span> <span class="n">maxval</span><span class="o">=</span><span class="n">val</span><span class="p">)</span>
+  <span class="c1"># else:</span>
+  <span class="c1">#   cell_params[&#39;initializer&#39;] = tf.contrib.layers.xavier_initializer()</span>
+  <span class="k">if</span> <span class="s1">&#39;WeightDropLayerNormBasicLSTMCell&#39;</span> <span class="ow">in</span> <span class="nb">str</span><span class="p">(</span><span class="n">cell_class</span><span class="p">):</span>
+    <span class="k">if</span> <span class="n">recurrent_keep_prob</span> <span class="o">&lt;</span> <span class="mf">1.0</span><span class="p">:</span>
+      <span class="n">cell_params</span><span class="p">[</span><span class="s1">&#39;recurrent_keep_prob&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">recurrent_keep_prob</span>
+    <span class="k">if</span> <span class="n">input_weight_keep_prob</span> <span class="o">&lt;</span> <span class="mf">1.0</span><span class="p">:</span>
+      <span class="n">cell_params</span><span class="p">[</span><span class="s1">&#39;input_weight_keep_prob&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">input_weight_keep_prob</span>
+    <span class="k">if</span> <span class="n">recurrent_weight_keep_prob</span> <span class="o">&lt;</span> <span class="mf">1.0</span><span class="p">:</span>
+      <span class="n">cell_params</span><span class="p">[</span><span class="s1">&#39;recurrent_weight_keep_prob&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">recurrent_weight_keep_prob</span>
+    <span class="k">if</span> <span class="n">weight_variational</span><span class="p">:</span>
+      <span class="n">cell_params</span><span class="p">[</span><span class="s1">&#39;weight_variational&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">weight_variational</span> <span class="c1"># which is basically True</span>
+    <span class="k">if</span> <span class="n">dropout_seed</span><span class="p">:</span>
+      <span class="n">cell_params</span><span class="p">[</span><span class="s1">&#39;dropout_seed&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">dropout_seed</span>
+
+
   <span class="n">cell</span> <span class="o">=</span> <span class="n">cell_class</span><span class="p">(</span><span class="o">**</span><span class="n">cell_params</span><span class="p">)</span>
   <span class="k">if</span> <span class="n">residual_connections</span><span class="p">:</span>
     <span class="n">cell</span> <span class="o">=</span> <span class="n">ResidualWrapper</span><span class="p">(</span><span class="n">cell</span><span class="p">)</span>
@@ -202,13 +232,16 @@ <h1>Source code for parts.rnns.utils</h1><div class="highlight"><pre>
   <span class="p">):</span>
     <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
         <span class="s2">&quot;Currently applying both dropout and zoneout on the same cell.&quot;</span>
-        <span class="s2">&quot;This is not recommended&quot;</span>
+        <span class="s2">&quot;This is currently not supported.&quot;</span>
     <span class="p">)</span>
-  <span class="k">if</span> <span class="n">dp_input_keep_prob</span> <span class="o">!=</span> <span class="mf">1.0</span> <span class="ow">or</span> <span class="n">dp_output_keep_prob</span> <span class="o">!=</span> <span class="mf">1.0</span><span class="p">:</span>
+  <span class="k">if</span> <span class="n">dp_input_keep_prob</span> <span class="o">!=</span> <span class="mf">1.0</span> <span class="ow">or</span> <span class="n">dp_output_keep_prob</span> <span class="o">!=</span> <span class="mf">1.0</span> <span class="ow">and</span> <span class="n">training</span><span class="p">:</span>
     <span class="n">cell</span> <span class="o">=</span> <span class="n">DropoutWrapper</span><span class="p">(</span>
         <span class="n">cell</span><span class="p">,</span>
         <span class="n">input_keep_prob</span><span class="o">=</span><span class="n">dp_input_keep_prob</span><span class="p">,</span>
-        <span class="n">output_keep_prob</span><span class="o">=</span><span class="n">dp_output_keep_prob</span>
+        <span class="n">output_keep_prob</span><span class="o">=</span><span class="n">dp_output_keep_prob</span><span class="p">,</span>
+        <span class="n">variational_recurrent</span><span class="o">=</span><span class="n">variational_recurrent</span><span class="p">,</span>
+        <span class="n">dtype</span><span class="o">=</span><span class="n">dtype</span><span class="p">,</span>
+        <span class="n">seed</span><span class="o">=</span><span class="n">dropout_seed</span>
     <span class="p">)</span>
   <span class="k">if</span> <span class="n">zoneout_prob</span> <span class="o">&gt;</span> <span class="mf">0.</span><span class="p">:</span>
     <span class="n">cell</span> <span class="o">=</span> <span class="n">ZoneoutWrapper</span><span class="p">(</span><span class="n">cell</span><span class="p">,</span> <span class="n">zoneout_prob</span><span class="p">,</span> <span class="n">is_training</span><span class="o">=</span><span class="n">training</span><span class="p">)</span>
diff --git a/docs/html/_modules/parts/tacotron/tacotron_decoder.html b/docs/html/_modules/parts/tacotron/tacotron_decoder.html
index 08a3e7542..6ad94ba02 100644
--- a/docs/html/_modules/parts/tacotron/tacotron_decoder.html
+++ b/docs/html/_modules/parts/tacotron/tacotron_decoder.html
@@ -204,6 +204,7 @@ <h1>Source code for parts.tacotron.tacotron_decoder</h1><div class="highlight"><
       <span class="n">decoder_cell</span><span class="p">,</span>
       <span class="n">helper</span><span class="p">,</span>
       <span class="n">initial_decoder_state</span><span class="p">,</span>
+      <span class="n">attention_type</span><span class="p">,</span>
       <span class="n">spec_layer</span><span class="p">,</span>
       <span class="n">stop_token_layer</span><span class="p">,</span>
       <span class="n">prenet</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
@@ -217,6 +218,7 @@ <h1>Source code for parts.tacotron.tacotron_decoder</h1><div class="highlight"><
 <span class="sd">      helper: A `Helper` instance.</span>
 <span class="sd">      initial_decoder_state: A (possibly nested tuple of...) tensors and</span>
 <span class="sd">        TensorArrays. The initial state of the RNNCell.</span>
+<span class="sd">      attention_type: The type of attention used</span>
 <span class="sd">      stop_token_layer: An instance of `tf.layers.Layer`, i.e.,</span>
 <span class="sd">        `tf.layers.Dense`. Stop token layer to apply to the RNN output to</span>
 <span class="sd">        predict when to stop the decoder</span>
@@ -243,6 +245,7 @@ <h1>Source code for parts.tacotron.tacotron_decoder</h1><div class="highlight"><
     <span class="bp">self</span><span class="o">.</span><span class="n">_decoder_initial_state</span> <span class="o">=</span> <span class="n">initial_decoder_state</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_spec_layer</span> <span class="o">=</span> <span class="n">spec_layer</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_stop_token_layer</span> <span class="o">=</span> <span class="n">stop_token_layer</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_attention_type</span> <span class="o">=</span> <span class="n">attention_type</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span> <span class="o">=</span> <span class="n">dtype</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_prenet</span> <span class="o">=</span> <span class="n">prenet</span>
 
@@ -325,7 +328,7 @@ <h1>Source code for parts.tacotron.tacotron_decoder</h1><div class="highlight"><
       <span class="n">cell_outputs</span><span class="p">,</span> <span class="n">cell_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_decoder_cell</span><span class="p">(</span><span class="n">inputs</span><span class="p">,</span> <span class="n">state</span><span class="p">)</span>
 
       <span class="c1"># If we are training and not using scheduled sampling, we can move</span>
-      <span class="c1"># all projection layers outside decoder, should be faster?</span>
+      <span class="c1"># all projection layers outside decoder,</span>
       <span class="c1"># else we must project inside decoder</span>
       <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_spec_layer</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
         <span class="n">spec_outputs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_spec_layer</span><span class="p">(</span><span class="n">cell_outputs</span><span class="p">)</span>
@@ -336,6 +339,7 @@ <h1>Source code for parts.tacotron.tacotron_decoder</h1><div class="highlight"><
       <span class="k">else</span><span class="p">:</span>
         <span class="n">stop_token_output</span> <span class="o">=</span> <span class="n">cell_outputs</span>
 
+
       <span class="n">sample_ids</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_helper</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span>
           <span class="n">time</span><span class="o">=</span><span class="n">time</span><span class="p">,</span> <span class="n">outputs</span><span class="o">=</span><span class="n">spec_outputs</span><span class="p">,</span> <span class="n">state</span><span class="o">=</span><span class="n">cell_state</span>
       <span class="p">)</span>
diff --git a/docs/html/_modules/parts/tacotron/tacotron_helper.html b/docs/html/_modules/parts/tacotron/tacotron_helper.html
index 4d6b944d8..58059ff21 100644
--- a/docs/html/_modules/parts/tacotron/tacotron_helper.html
+++ b/docs/html/_modules/parts/tacotron/tacotron_helper.html
@@ -182,13 +182,12 @@ <h1>Source code for parts.tacotron.tacotron_helper</h1><div class="highlight"><p
 <span class="kn">from</span> <span class="nn">tensorflow.contrib.seq2seq.python.ops.helper</span> <span class="k">import</span> <span class="n">Helper</span>
 <span class="kn">from</span> <span class="nn">tensorflow.python.framework</span> <span class="k">import</span> <span class="n">tensor_shape</span>
 <span class="kn">from</span> <span class="nn">tensorflow.python.framework</span> <span class="k">import</span> <span class="n">dtypes</span>
+<span class="kn">from</span> <span class="nn">tensorflow.python.framework</span> <span class="k">import</span> <span class="n">ops</span>
 <span class="kn">from</span> <span class="nn">tensorflow.python.ops</span> <span class="k">import</span> <span class="n">math_ops</span>
 <span class="kn">from</span> <span class="nn">tensorflow.python.ops</span> <span class="k">import</span> <span class="n">array_ops</span>
 <span class="kn">from</span> <span class="nn">tensorflow.python.ops</span> <span class="k">import</span> <span class="n">control_flow_ops</span>
 <span class="kn">from</span> <span class="nn">tensorflow.python.ops</span> <span class="k">import</span> <span class="n">tensor_array_ops</span>
 <span class="kn">from</span> <span class="nn">tensorflow.python.util</span> <span class="k">import</span> <span class="n">nest</span>
-<span class="kn">from</span> <span class="nn">tensorflow.python.ops.distributions</span> <span class="k">import</span> <span class="n">bernoulli</span>
-<span class="kn">from</span> <span class="nn">tensorflow.python.ops</span> <span class="k">import</span> <span class="n">gen_array_ops</span>
 
 <span class="n">_transpose_batch_time</span> <span class="o">=</span> <span class="n">decoder</span><span class="o">.</span><span class="n">_transpose_batch_time</span>
 
@@ -210,7 +209,6 @@ <h1>Source code for parts.tacotron.tacotron_helper</h1><div class="highlight"><p
       <span class="n">inputs</span><span class="p">,</span>
       <span class="n">sequence_length</span><span class="p">,</span>
       <span class="n">prenet</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-      <span class="n">sampling_prob</span><span class="o">=</span><span class="mf">0.</span><span class="p">,</span>
       <span class="n">time_major</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
       <span class="n">sample_ids_shape</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
       <span class="n">sample_ids_dtype</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
@@ -238,7 +236,6 @@ <h1>Source code for parts.tacotron.tacotron_helper</h1><div class="highlight"><p
     <span class="bp">self</span><span class="o">.</span><span class="n">_sequence_length</span> <span class="o">=</span> <span class="n">sequence_length</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_batch_size</span> <span class="o">=</span> <span class="n">array_ops</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="n">sequence_length</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_seed</span> <span class="o">=</span> <span class="kc">None</span>
-    <span class="bp">self</span><span class="o">.</span><span class="n">_sampling_prob</span> <span class="o">=</span> <span class="n">sampling_prob</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_mask_decoder_sequence</span> <span class="o">=</span> <span class="n">mask_decoder_sequence</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_prenet</span> <span class="o">=</span> <span class="n">prenet</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_zero_inputs</span> <span class="o">=</span> <span class="n">nest</span><span class="o">.</span><span class="n">map_structure</span><span class="p">(</span>
@@ -287,47 +284,6 @@ <h1>Source code for parts.tacotron.tacotron_helper</h1><div class="highlight"><p
       <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prenet</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
         <span class="n">next_input</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prenet</span><span class="p">(</span><span class="n">next_input</span><span class="p">)</span>
         <span class="n">out</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prenet</span><span class="p">(</span><span class="n">out</span><span class="p">)</span>
-      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sampling_prob</span> <span class="o">&gt;</span> <span class="mf">0.</span><span class="p">:</span>
-        <span class="n">next_input</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">stop_gradient</span><span class="p">(</span><span class="n">next_input</span><span class="p">)</span>
-        <span class="n">out</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">stop_gradient</span><span class="p">(</span><span class="n">out</span><span class="p">)</span>
-        <span class="n">select_sampler</span> <span class="o">=</span> <span class="n">bernoulli</span><span class="o">.</span><span class="n">Bernoulli</span><span class="p">(</span>
-            <span class="n">probs</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_sampling_prob</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">dtypes</span><span class="o">.</span><span class="n">bool</span>
-        <span class="p">)</span>
-        <span class="n">select_sample</span> <span class="o">=</span> <span class="n">select_sampler</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span>
-            <span class="n">sample_shape</span><span class="o">=</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">),</span> <span class="n">seed</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_seed</span>
-        <span class="p">)</span>
-        <span class="n">select_sample</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">select_sample</span><span class="p">,</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_dim</span><span class="p">])</span>
-        <span class="n">sample_ids</span> <span class="o">=</span> <span class="n">array_ops</span><span class="o">.</span><span class="n">where</span><span class="p">(</span>
-            <span class="n">select_sample</span><span class="p">,</span> <span class="n">out</span><span class="p">,</span>
-            <span class="n">gen_array_ops</span><span class="o">.</span><span class="n">fill</span><span class="p">(</span>
-                <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_dim</span><span class="p">],</span>
-                <span class="n">tf</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span><span class="o">-</span><span class="mf">20.</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dtype</span><span class="p">)</span>
-            <span class="p">)</span>
-        <span class="p">)</span>
-        <span class="n">where_sampling</span> <span class="o">=</span> <span class="n">math_ops</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span>
-            <span class="n">array_ops</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">sample_ids</span> <span class="o">&gt;</span> <span class="o">-</span><span class="mi">20</span><span class="p">),</span> <span class="n">dtypes</span><span class="o">.</span><span class="n">int32</span>
-        <span class="p">)</span>
-        <span class="n">where_not_sampling</span> <span class="o">=</span> <span class="n">math_ops</span><span class="o">.</span><span class="n">cast</span><span class="p">(</span>
-            <span class="n">array_ops</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">sample_ids</span> <span class="o">&lt;=</span> <span class="o">-</span><span class="mi">20</span><span class="p">),</span> <span class="n">dtypes</span><span class="o">.</span><span class="n">int32</span>
-        <span class="p">)</span>
-        <span class="n">sample_ids_sampling</span> <span class="o">=</span> <span class="n">array_ops</span><span class="o">.</span><span class="n">gather_nd</span><span class="p">(</span><span class="n">sample_ids</span><span class="p">,</span> <span class="n">where_sampling</span><span class="p">)</span>
-        <span class="n">inputs_not_sampling</span> <span class="o">=</span> <span class="n">array_ops</span><span class="o">.</span><span class="n">gather_nd</span><span class="p">(</span>
-            <span class="n">next_input</span><span class="p">,</span> <span class="n">where_not_sampling</span>
-        <span class="p">)</span>
-        <span class="n">sampled_next_inputs</span> <span class="o">=</span> <span class="n">sample_ids_sampling</span>
-        <span class="n">base_shape</span> <span class="o">=</span> <span class="n">array_ops</span><span class="o">.</span><span class="n">shape</span><span class="p">(</span><span class="n">next_input</span><span class="p">)</span>
-
-        <span class="n">next_input</span> <span class="o">=</span> <span class="p">(</span>
-            <span class="n">array_ops</span><span class="o">.</span><span class="n">scatter_nd</span><span class="p">(</span>
-                <span class="n">indices</span><span class="o">=</span><span class="n">where_sampling</span><span class="p">,</span>
-                <span class="n">updates</span><span class="o">=</span><span class="n">sampled_next_inputs</span><span class="p">,</span>
-                <span class="n">shape</span><span class="o">=</span><span class="n">base_shape</span>
-            <span class="p">)</span> <span class="o">+</span> <span class="n">array_ops</span><span class="o">.</span><span class="n">scatter_nd</span><span class="p">(</span>
-                <span class="n">indices</span><span class="o">=</span><span class="n">where_not_sampling</span><span class="p">,</span>
-                <span class="n">updates</span><span class="o">=</span><span class="n">inputs_not_sampling</span><span class="p">,</span>
-                <span class="n">shape</span><span class="o">=</span><span class="n">base_shape</span>
-            <span class="p">)</span>
-        <span class="p">)</span>
       <span class="k">return</span> <span class="n">next_input</span>
 
     <span class="n">next_inputs</span> <span class="o">=</span> <span class="n">control_flow_ops</span><span class="o">.</span><span class="n">cond</span><span class="p">(</span>
diff --git a/docs/html/_modules/parts/transformer/embedding_layer.html b/docs/html/_modules/parts/transformer/embedding_layer.html
index 8e75d7d05..99a81790b 100644
--- a/docs/html/_modules/parts/transformer/embedding_layer.html
+++ b/docs/html/_modules/parts/transformer/embedding_layer.html
@@ -184,12 +184,13 @@ <h1>Source code for parts.transformer.embedding_layer</h1><div class="highlight"
   <span class="sd">&quot;&quot;&quot;Calculates input embeddings and pre-softmax linear with shared weights.&quot;&quot;&quot;</span>
 
   <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">vocab_size</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">pad_vocab_to_eight</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">init_var</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-               <span class="n">embed_scale</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">pad_sym</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">mask_paddings</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
+               <span class="n">embed_scale</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">pad_sym</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">mask_paddings</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">regularizer</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
     <span class="nb">super</span><span class="p">(</span><span class="n">EmbeddingSharedWeights</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">hidden_size</span> <span class="o">=</span> <span class="n">hidden_size</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">embed_scale</span> <span class="o">=</span> <span class="n">embed_scale</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">pad_sym</span> <span class="o">=</span> <span class="n">pad_sym</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">mask_paddings</span> <span class="o">=</span> <span class="n">mask_paddings</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span> <span class="o">=</span> <span class="n">regularizer</span>
 
     <span class="n">padf</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span> <span class="k">if</span> <span class="n">x</span> <span class="o">%</span> <span class="mi">8</span> <span class="o">==</span> <span class="mi">0</span> <span class="k">else</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">8</span> <span class="o">-</span> <span class="n">x</span> <span class="o">%</span> <span class="mi">8</span>
     <span class="k">if</span> <span class="n">pad_vocab_to_eight</span><span class="p">:</span>
@@ -207,7 +208,8 @@ <h1>Source code for parts.transformer.embedding_layer</h1><div class="highlight"
       <span class="c1"># Create and initialize weights. The random normal initializer was chosen</span>
       <span class="c1"># randomly, and works well.</span>
       <span class="bp">self</span><span class="o">.</span><span class="n">shared_weights</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">get_variable</span><span class="p">(</span><span class="s2">&quot;weights&quot;</span><span class="p">,</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">vocab_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_size</span><span class="p">],</span>
-                                            <span class="n">initializer</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">random_normal_initializer</span><span class="p">(</span><span class="mf">0.</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">))</span>
+                                            <span class="n">initializer</span><span class="o">=</span><span class="n">tf</span><span class="o">.</span><span class="n">random_normal_initializer</span><span class="p">(</span><span class="mf">0.</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">init_var</span><span class="p">),</span> \
+                                            <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">regularizer</span><span class="p">)</span>
 
     <span class="bp">self</span><span class="o">.</span><span class="n">built</span> <span class="o">=</span> <span class="kc">True</span></div>
 
diff --git a/docs/html/_modules/utils/funcs.html b/docs/html/_modules/utils/funcs.html
index 804ee964a..13d2fd830 100644
--- a/docs/html/_modules/utils/funcs.html
+++ b/docs/html/_modules/utils/funcs.html
@@ -171,6 +171,7 @@ <h1>Source code for utils.funcs</h1><div class="highlight"><pre>
                                      <span class="n">collect_if_horovod</span>
 <span class="kn">from</span> <span class="nn">.hooks</span> <span class="k">import</span> <span class="n">PrintSamplesHook</span><span class="p">,</span> <span class="n">RunEvaluationHook</span><span class="p">,</span> <span class="n">PrintLossAndTimeHook</span><span class="p">,</span> \
                    <span class="n">BroadcastGlobalVariablesHook</span>
+<span class="kn">from</span> <span class="nn">open_seq2seq.models</span> <span class="k">import</span> <span class="n">LSTMLM</span>
 
 
 <div class="viewcode-block" id="train"><a class="viewcode-back" href="../../api-docs/utils.html#utils.funcs.train">[docs]</a><span class="k">def</span> <span class="nf">train</span><span class="p">(</span><span class="n">train_model</span><span class="p">,</span> <span class="n">eval_model</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">debug_port</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
@@ -208,6 +209,7 @@ <h1>Source code for utils.funcs</h1><div class="highlight"><pre>
             <span class="n">every_steps</span><span class="o">=</span><span class="n">eval_model</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;eval_steps&#39;</span><span class="p">],</span>
             <span class="n">model</span><span class="o">=</span><span class="n">eval_model</span><span class="p">,</span>
             <span class="n">last_step</span><span class="o">=</span><span class="n">train_model</span><span class="o">.</span><span class="n">last_step</span><span class="p">,</span>
+            <span class="n">print_ppl</span><span class="o">=</span><span class="nb">isinstance</span><span class="p">(</span><span class="n">eval_model</span><span class="p">,</span> <span class="n">LSTMLM</span><span class="p">),</span>
         <span class="p">),</span>
     <span class="p">)</span>
 
@@ -225,6 +227,7 @@ <h1>Source code for utils.funcs</h1><div class="highlight"><pre>
       <span class="n">hooks</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">PrintLossAndTimeHook</span><span class="p">(</span>
           <span class="n">every_steps</span><span class="o">=</span><span class="n">train_model</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;print_loss_steps&#39;</span><span class="p">],</span>
           <span class="n">model</span><span class="o">=</span><span class="n">train_model</span><span class="p">,</span>
+          <span class="n">print_ppl</span><span class="o">=</span><span class="nb">isinstance</span><span class="p">(</span><span class="n">train_model</span><span class="p">,</span> <span class="n">LSTMLM</span><span class="p">)</span>
       <span class="p">))</span>
     <span class="k">if</span> <span class="n">train_model</span><span class="o">.</span><span class="n">params</span><span class="p">[</span><span class="s1">&#39;print_samples_steps&#39;</span><span class="p">]</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
       <span class="c1"># noinspection PyTypeChecker</span>
@@ -325,8 +328,10 @@ <h1>Source code for utils.funcs</h1><div class="highlight"><pre>
       <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Not enough steps for benchmarking&quot;</span><span class="p">)</span></div>
 
 
-<div class="viewcode-block" id="restore_and_get_results"><a class="viewcode-back" href="../../api-docs/utils.html#utils.funcs.restore_and_get_results">[docs]</a><span class="k">def</span> <span class="nf">restore_and_get_results</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">,</span> <span class="n">mode</span><span class="p">):</span>
-  <span class="n">saver</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">Saver</span><span class="p">()</span>
+<div class="viewcode-block" id="restore_and_get_results"><a class="viewcode-back" href="../../api-docs/utils.html#utils.funcs.restore_and_get_results">[docs]</a><span class="k">def</span> <span class="nf">restore_and_get_results</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">,</span> <span class="n">mode</span><span class="p">,</span> <span class="n">use_trt</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+  <span class="k">if</span> <span class="ow">not</span> <span class="n">use_trt</span><span class="p">:</span>
+    <span class="c1"># Checkpoint is restored prior to freezing graph when using TRT</span>
+    <span class="n">saver</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">Saver</span><span class="p">()</span>
   <span class="n">sess_config</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">ConfigProto</span><span class="p">(</span><span class="n">allow_soft_placement</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
   <span class="c1"># pylint: disable=no-member</span>
   <span class="n">sess_config</span><span class="o">.</span><span class="n">gpu_options</span><span class="o">.</span><span class="n">allow_growth</span> <span class="o">=</span> <span class="kc">True</span>
@@ -334,20 +339,20 @@ <h1>Source code for utils.funcs</h1><div class="highlight"><pre>
     <span class="c1"># pylint: disable=no-member</span>
     <span class="n">sess_config</span><span class="o">.</span><span class="n">gpu_options</span><span class="o">.</span><span class="n">visible_device_list</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">hvd</span><span class="o">.</span><span class="n">local_rank</span><span class="p">())</span>
   <span class="k">with</span> <span class="n">tf</span><span class="o">.</span><span class="n">Session</span><span class="p">(</span><span class="n">config</span><span class="o">=</span><span class="n">sess_config</span><span class="p">)</span> <span class="k">as</span> <span class="n">sess</span><span class="p">:</span>
-    <span class="n">saver</span><span class="o">.</span><span class="n">restore</span><span class="p">(</span><span class="n">sess</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">)</span>
+    <span class="k">if</span> <span class="ow">not</span> <span class="n">use_trt</span><span class="p">:</span>
+      <span class="n">saver</span><span class="o">.</span><span class="n">restore</span><span class="p">(</span><span class="n">sess</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">)</span>
     <span class="n">results_per_batch</span> <span class="o">=</span> <span class="n">get_results_for_epoch</span><span class="p">(</span>
         <span class="n">model</span><span class="p">,</span> <span class="n">sess</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="n">mode</span><span class="p">,</span> <span class="n">compute_loss</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
     <span class="p">)</span>
   <span class="k">return</span> <span class="n">results_per_batch</span></div>
 
 
-<div class="viewcode-block" id="infer"><a class="viewcode-back" href="../../api-docs/utils.html#utils.funcs.infer">[docs]</a><span class="k">def</span> <span class="nf">infer</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">,</span> <span class="n">output_file</span><span class="p">):</span>
-  <span class="n">results_per_batch</span> <span class="o">=</span> <span class="n">restore_and_get_results</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;infer&quot;</span><span class="p">)</span>
+<div class="viewcode-block" id="infer"><a class="viewcode-back" href="../../api-docs/utils.html#utils.funcs.infer">[docs]</a><span class="k">def</span> <span class="nf">infer</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">,</span> <span class="n">output_file</span><span class="p">,</span> <span class="n">use_trt</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+  <span class="n">results_per_batch</span> <span class="o">=</span> <span class="n">restore_and_get_results</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;infer&quot;</span><span class="p">,</span> <span class="n">use_trt</span><span class="o">=</span><span class="n">use_trt</span><span class="p">)</span>
   <span class="k">if</span> <span class="ow">not</span> <span class="n">model</span><span class="o">.</span><span class="n">on_horovod</span> <span class="ow">or</span> <span class="n">model</span><span class="o">.</span><span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
     <span class="n">model</span><span class="o">.</span><span class="n">finalize_inference</span><span class="p">(</span><span class="n">results_per_batch</span><span class="p">,</span> <span class="n">output_file</span><span class="p">)</span>
     <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Finished inference&quot;</span><span class="p">)</span></div>
 
-
 <div class="viewcode-block" id="evaluate"><a class="viewcode-back" href="../../api-docs/utils.html#utils.funcs.evaluate">[docs]</a><span class="k">def</span> <span class="nf">evaluate</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">):</span>
   <span class="n">results_per_batch</span> <span class="o">=</span> <span class="n">restore_and_get_results</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;eval&quot;</span><span class="p">)</span>
   <span class="k">if</span> <span class="ow">not</span> <span class="n">model</span><span class="o">.</span><span class="n">on_horovod</span> <span class="ow">or</span> <span class="n">model</span><span class="o">.</span><span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
diff --git a/docs/html/_modules/utils/hooks.html b/docs/html/_modules/utils/hooks.html
index 7097cfc32..cd1338ba5 100644
--- a/docs/html/_modules/utils/hooks.html
+++ b/docs/html/_modules/utils/hooks.html
@@ -159,6 +159,7 @@ <h1>Source code for utils.hooks</h1><div class="highlight"><pre>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
 
+<span class="kn">import</span> <span class="nn">math</span>
 <span class="kn">import</span> <span class="nn">os</span>
 <span class="kn">import</span> <span class="nn">time</span>
 
@@ -259,7 +260,7 @@ <h1>Source code for utils.hooks</h1><div class="highlight"><pre>
 <div class="viewcode-block" id="PrintLossAndTimeHook"><a class="viewcode-back" href="../../api-docs/utils.html#utils.hooks.PrintLossAndTimeHook">[docs]</a><span class="k">class</span> <span class="nc">PrintLossAndTimeHook</span><span class="p">(</span><span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">SessionRunHook</span><span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;Session hook that prints training samples and prediction from time to time</span>
 <span class="sd">  &quot;&quot;&quot;</span>
-  <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">every_steps</span><span class="p">,</span> <span class="n">model</span><span class="p">):</span>
+  <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">every_steps</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">print_ppl</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
     <span class="nb">super</span><span class="p">(</span><span class="n">PrintLossAndTimeHook</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_timer</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">SecondOrStepTimer</span><span class="p">(</span><span class="n">every_steps</span><span class="o">=</span><span class="n">every_steps</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_every_steps</span> <span class="o">=</span> <span class="n">every_steps</span>
@@ -268,6 +269,7 @@ <h1>Source code for utils.hooks</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">_model</span> <span class="o">=</span> <span class="n">model</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_fetches</span> <span class="o">=</span> <span class="p">[</span><span class="n">model</span><span class="o">.</span><span class="n">loss</span><span class="p">]</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_last_time</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_print_ppl</span> <span class="o">=</span> <span class="n">print_ppl</span>
 
 <div class="viewcode-block" id="PrintLossAndTimeHook.begin"><a class="viewcode-back" href="../../api-docs/utils.html#utils.hooks.PrintLossAndTimeHook.begin">[docs]</a>  <span class="k">def</span> <span class="nf">begin</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_iter_count</span> <span class="o">=</span> <span class="mi">0</span>
@@ -296,7 +298,14 @@ <h1>Source code for utils.hooks</h1><div class="highlight"><pre>
       <span class="p">)</span>
 
     <span class="n">loss</span> <span class="o">=</span> <span class="n">results</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-    <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;loss = </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">loss</span><span class="p">),</span> <span class="n">start</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;, &quot;</span><span class="p">)</span>
+    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="o">.</span><span class="n">on_horovod</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="o">.</span><span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_print_ppl</span><span class="p">:</span>
+        <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;loss: </span><span class="si">{:.4f}</span><span class="s2"> | ppl = </span><span class="si">{:.4f}</span><span class="s2"> | bpc = </span><span class="si">{:.4f}</span><span class="s2">&quot;</span>
+                   <span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">math</span><span class="o">.</span><span class="n">exp</span><span class="p">(</span><span class="n">loss</span><span class="p">),</span>
+                           <span class="n">loss</span><span class="o">/</span><span class="n">math</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">2</span><span class="p">)),</span>
+                   <span class="n">start</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;, &quot;</span><span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;loss: </span><span class="si">{:.4f}</span><span class="s2"> &quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">loss</span><span class="p">),</span> <span class="n">start</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;, &quot;</span><span class="p">)</span>
 
     <span class="n">tm</span> <span class="o">=</span> <span class="p">(</span><span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_time</span><span class="p">)</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">_every_steps</span>
     <span class="n">m</span><span class="p">,</span> <span class="n">s</span> <span class="o">=</span> <span class="nb">divmod</span><span class="p">(</span><span class="n">tm</span><span class="p">,</span> <span class="mi">60</span><span class="p">)</span>
@@ -312,7 +321,7 @@ <h1>Source code for utils.hooks</h1><div class="highlight"><pre>
 <div class="viewcode-block" id="RunEvaluationHook"><a class="viewcode-back" href="../../api-docs/utils.html#utils.hooks.RunEvaluationHook">[docs]</a><span class="k">class</span> <span class="nc">RunEvaluationHook</span><span class="p">(</span><span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">SessionRunHook</span><span class="p">):</span>
   <span class="sd">&quot;&quot;&quot;Session hook that runs evaluation on a validation set</span>
 <span class="sd">  &quot;&quot;&quot;</span>
-  <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">every_steps</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">last_step</span><span class="o">=-</span><span class="mi">1</span><span class="p">):</span>
+  <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">every_steps</span><span class="p">,</span> <span class="n">model</span><span class="p">,</span> <span class="n">last_step</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span> <span class="n">print_ppl</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
     <span class="nb">super</span><span class="p">(</span><span class="n">RunEvaluationHook</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_timer</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">SecondOrStepTimer</span><span class="p">(</span><span class="n">every_steps</span><span class="o">=</span><span class="n">every_steps</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_iter_count</span> <span class="o">=</span> <span class="mi">0</span>
@@ -322,6 +331,7 @@ <h1>Source code for utils.hooks</h1><div class="highlight"><pre>
     <span class="bp">self</span><span class="o">.</span><span class="n">_last_step</span> <span class="o">=</span> <span class="n">last_step</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_eval_saver</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">Saver</span><span class="p">(</span><span class="n">save_relative_paths</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_best_eval_loss</span> <span class="o">=</span> <span class="mf">1e9</span>
+    <span class="bp">self</span><span class="o">.</span><span class="n">_print_ppl</span> <span class="o">=</span> <span class="n">print_ppl</span>
 
 <div class="viewcode-block" id="RunEvaluationHook.begin"><a class="viewcode-back" href="../../api-docs/utils.html#utils.hooks.RunEvaluationHook.begin">[docs]</a>  <span class="k">def</span> <span class="nf">begin</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
     <span class="bp">self</span><span class="o">.</span><span class="n">_iter_count</span> <span class="o">=</span> <span class="mi">0</span>
@@ -347,7 +357,15 @@ <h1>Source code for utils.hooks</h1><div class="highlight"><pre>
     <span class="p">)</span>
 
     <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="o">.</span><span class="n">on_horovod</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="o">.</span><span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-      <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Validation loss: </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">total_loss</span><span class="p">),</span> <span class="n">offset</span><span class="o">=</span><span class="mi">4</span><span class="p">)</span>
+      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_print_ppl</span><span class="p">:</span>
+        <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Validation loss: </span><span class="si">{:.4f}</span><span class="s2"> | ppl = </span><span class="si">{:.4f}</span><span class="s2"> | bpc = </span><span class="si">{:.4f}</span><span class="s2">&quot;</span>
+                   <span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">total_loss</span><span class="p">,</span> <span class="n">math</span><span class="o">.</span><span class="n">exp</span><span class="p">(</span><span class="n">total_loss</span><span class="p">),</span>
+                           <span class="n">total_loss</span><span class="o">/</span><span class="n">math</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">2</span><span class="p">)),</span> <span class="n">offset</span><span class="o">=</span><span class="mi">4</span><span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="n">deco_print</span><span class="p">(</span>
+          <span class="s2">&quot;Validation loss: </span><span class="si">{:.4f}</span><span class="s2"> &quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">total_loss</span><span class="p">),</span>
+          <span class="n">offset</span><span class="o">=</span><span class="mi">4</span><span class="p">)</span>
+
 
       <span class="n">dict_to_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="o">.</span><span class="n">finalize_evaluation</span><span class="p">(</span><span class="n">results_per_batch</span><span class="p">,</span> <span class="n">step</span><span class="p">)</span>
       <span class="n">dict_to_log</span><span class="p">[</span><span class="s1">&#39;eval_loss&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">total_loss</span>
diff --git a/docs/html/_modules/utils/utils.html b/docs/html/_modules/utils/utils.html
index dde35a299..e00fe07a7 100644
--- a/docs/html/_modules/utils/utils.html
+++ b/docs/html/_modules/utils/utils.html
@@ -159,9 +159,19 @@ <h1>Source code for utils.utils</h1><div class="highlight"><pre>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">absolute_import</span><span class="p">,</span> <span class="n">division</span><span class="p">,</span> <span class="n">print_function</span>
 <span class="kn">from</span> <span class="nn">__future__</span> <span class="k">import</span> <span class="n">unicode_literals</span>
 
+<span class="kn">import</span> <span class="nn">argparse</span>
+<span class="kn">import</span> <span class="nn">ast</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">import</span> <span class="nn">datetime</span>
+<span class="kn">import</span> <span class="nn">os</span>
+<span class="kn">import</span> <span class="nn">pprint</span>
+<span class="kn">import</span> <span class="nn">runpy</span>
+<span class="kn">import</span> <span class="nn">shutil</span>
 <span class="kn">import</span> <span class="nn">subprocess</span>
+<span class="kn">import</span> <span class="nn">sys</span>
 <span class="kn">import</span> <span class="nn">time</span>
 
+
 <span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
 <span class="kn">import</span> <span class="nn">six</span>
 <span class="kn">from</span> <span class="nn">six</span> <span class="k">import</span> <span class="n">string_types</span>
@@ -201,7 +211,7 @@ <h1>Source code for utils.utils</h1><div class="highlight"><pre>
 <span class="sd">    mode: could be &quot;sum&quot;, &quot;mean&quot; or &quot;gather&quot;, indicating reduce_sum or gather.</span>
 <span class="sd">        For &quot;sum&quot; and &quot;mean&quot; value has to be numerical, for &quot;gather&quot;, value has</span>
 <span class="sd">        to be iterable.</span>
-<span class="sd">        </span>
+
 <span class="sd">  Returns:</span>
 <span class="sd">    collected results if run on Horovod or value otherwise.</span>
 <span class="sd">  &quot;&quot;&quot;</span>
@@ -239,7 +249,7 @@ <h1>Source code for utils.utils</h1><div class="highlight"><pre>
   <span class="k">return</span> <span class="n">last_batch_clipped</span></div>
 
 
-<div class="viewcode-block" id="iterate_data"><a class="viewcode-back" href="../../api-docs/utils.html#utils.utils.iterate_data">[docs]</a><span class="k">def</span> <span class="nf">iterate_data</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">sess</span><span class="p">,</span> <span class="n">compute_loss</span><span class="p">,</span> <span class="n">mode</span><span class="p">,</span> <span class="n">verbose</span><span class="p">):</span>
+<div class="viewcode-block" id="iterate_data"><a class="viewcode-back" href="../../api-docs/utils.html#utils.utils.iterate_data">[docs]</a><span class="k">def</span> <span class="nf">iterate_data</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">sess</span><span class="p">,</span> <span class="n">compute_loss</span><span class="p">,</span> <span class="n">mode</span><span class="p">,</span> <span class="n">verbose</span><span class="p">,</span> <span class="n">num_steps</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
   <span class="n">total_time</span> <span class="o">=</span> <span class="mf">0.0</span>
   <span class="n">bench_start</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;bench_start&#39;</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span>
   <span class="n">results_per_batch</span> <span class="o">=</span> <span class="p">[]</span>
@@ -358,6 +368,9 @@ <h1>Source code for utils.utils</h1><div class="highlight"><pre>
     <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">fetches_vals</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
       <span class="k">break</span>
     <span class="n">step</span> <span class="o">+=</span> <span class="mi">1</span>
+    <span class="c1"># break early in the case of INT8 calibration</span>
+    <span class="k">if</span> <span class="n">num_steps</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">step</span> <span class="o">&gt;=</span> <span class="n">num_steps</span><span class="p">:</span>
+      <span class="k">break</span>
 
   <span class="k">if</span> <span class="n">verbose</span><span class="p">:</span>
     <span class="k">if</span> <span class="n">step</span> <span class="o">&gt;</span> <span class="n">bench_start</span><span class="p">:</span>
@@ -597,6 +610,306 @@ <h1>Source code for utils.utils</h1><div class="highlight"><pre>
       <span class="k">continue</span>
     <span class="n">cast_input_dict</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">=</span> <span class="n">input_dict</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
   <span class="k">return</span> <span class="n">cast_input_dict</span></div>
+
+<div class="viewcode-block" id="get_interactive_infer_results"><a class="viewcode-back" href="../../api-docs/utils.html#utils.utils.get_interactive_infer_results">[docs]</a><span class="k">def</span> <span class="nf">get_interactive_infer_results</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">sess</span><span class="p">,</span> <span class="n">model_in</span><span class="p">):</span>
+  <span class="n">fetches</span> <span class="o">=</span> <span class="p">[</span>
+      <span class="n">model</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">input_tensors</span><span class="p">,</span>
+      <span class="n">model</span><span class="o">.</span><span class="n">get_output_tensors</span><span class="p">(),</span>
+  <span class="p">]</span>
+
+  <span class="n">feed_dict</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">get_data_layer</span><span class="p">()</span><span class="o">.</span><span class="n">create_feed_dict</span><span class="p">(</span><span class="n">model_in</span><span class="p">)</span>
+
+  <span class="n">inputs</span><span class="p">,</span> <span class="n">outputs</span> <span class="o">=</span> <span class="n">sess</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">fetches</span><span class="p">,</span> <span class="n">feed_dict</span><span class="o">=</span><span class="n">feed_dict</span><span class="p">)</span>
+
+  <span class="k">return</span> <span class="n">model</span><span class="o">.</span><span class="n">infer</span><span class="p">(</span><span class="n">inputs</span><span class="p">,</span> <span class="n">outputs</span><span class="p">)</span></div>
+
+<div class="viewcode-block" id="get_base_config"><a class="viewcode-back" href="../../api-docs/utils.html#utils.utils.get_base_config">[docs]</a><span class="k">def</span> <span class="nf">get_base_config</span><span class="p">(</span><span class="n">args</span><span class="p">):</span>
+  <span class="sd">&quot;&quot;&quot;This function parses the command line arguments, reads the config file, and</span>
+<span class="sd">  gets the base_model from the config.</span>
+
+<span class="sd">  Args:</span>
+<span class="sd">    args (str): The command line arugments</span>
+
+<span class="sd">  Returns</span>
+<span class="sd">    args (dict): The arguments parsed into a dictionary</span>
+<span class="sd">    base_config (dict): The config read from the file and ammended with the</span>
+<span class="sd">      command line arguments</span>
+<span class="sd">    base_model (OpenSeq2Seq model): The model specified in the config file</span>
+<span class="sd">    config_module (dict): The raw config file processed by runpy</span>
+<span class="sd">  &quot;&quot;&quot;</span>
+  <span class="n">parser</span> <span class="o">=</span> <span class="n">argparse</span><span class="o">.</span><span class="n">ArgumentParser</span><span class="p">(</span><span class="n">description</span><span class="o">=</span><span class="s1">&#39;Experiment parameters&#39;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s2">&quot;--config_file&quot;</span><span class="p">,</span> <span class="n">required</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s2">&quot;Path to the configuration file&quot;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s2">&quot;--mode&quot;</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="s1">&#39;train&#39;</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s2">&quot;Could be </span><span class="se">\&quot;</span><span class="s2">train</span><span class="se">\&quot;</span><span class="s2">, </span><span class="se">\&quot;</span><span class="s2">eval</span><span class="se">\&quot;</span><span class="s2">, &quot;</span>
+                           <span class="s2">&quot;</span><span class="se">\&quot;</span><span class="s2">train_eval</span><span class="se">\&quot;</span><span class="s2"> or </span><span class="se">\&quot;</span><span class="s2">infer</span><span class="se">\&quot;</span><span class="s2">&quot;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s2">&quot;--infer_output_file&quot;</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s2">&quot;Path to the output of inference&quot;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--continue_learning&#39;</span><span class="p">,</span> <span class="n">dest</span><span class="o">=</span><span class="s1">&#39;continue_learning&#39;</span><span class="p">,</span>
+                      <span class="n">action</span><span class="o">=</span><span class="s1">&#39;store_true&#39;</span><span class="p">,</span> <span class="n">help</span><span class="o">=</span><span class="s2">&quot;whether to continue learning&quot;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--no_dir_check&#39;</span><span class="p">,</span> <span class="n">dest</span><span class="o">=</span><span class="s1">&#39;no_dir_check&#39;</span><span class="p">,</span>
+                      <span class="n">action</span><span class="o">=</span><span class="s1">&#39;store_true&#39;</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s2">&quot;whether to check that everything is correct &quot;</span>
+                           <span class="s2">&quot;with log directory&quot;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--benchmark&#39;</span><span class="p">,</span> <span class="n">dest</span><span class="o">=</span><span class="s1">&#39;benchmark&#39;</span><span class="p">,</span> <span class="n">action</span><span class="o">=</span><span class="s1">&#39;store_true&#39;</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;automatic config change for benchmarking&#39;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--bench_steps&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="s1">&#39;20&#39;</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;max_steps for benchmarking&#39;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--bench_start&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;first step to start counting time for benchmarking&#39;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--debug_port&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;run TensorFlow in debug mode on specified port&#39;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--enable_logs&#39;</span><span class="p">,</span> <span class="n">dest</span><span class="o">=</span><span class="s1">&#39;enable_logs&#39;</span><span class="p">,</span> <span class="n">action</span><span class="o">=</span><span class="s1">&#39;store_true&#39;</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;whether to log output, git info, cmd args, etc.&#39;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--use_trt&#39;</span><span class="p">,</span> <span class="n">dest</span><span class="o">=</span><span class="s1">&#39;use_trt&#39;</span><span class="p">,</span> <span class="n">action</span><span class="o">=</span><span class="s1">&#39;store_true&#39;</span><span class="p">,</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;use TF-TRT to optimize graph for inference (mode must be infer)&#39;</span><span class="p">)</span>
+  <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--precision&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">str</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="s1">&#39;fp32&#39;</span><span class="p">,</span>
+                      <span class="n">choices</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;fp32&#39;</span><span class="p">,</span> <span class="s1">&#39;fp16&#39;</span><span class="p">,</span> <span class="s1">&#39;int8&#39;</span><span class="p">],</span>
+                      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;precision for TF-TRT (only valid with --use_trt&#39;</span><span class="p">)</span>  
+  <span class="n">args</span><span class="p">,</span> <span class="n">unknown</span> <span class="o">=</span> <span class="n">parser</span><span class="o">.</span><span class="n">parse_known_args</span><span class="p">(</span><span class="n">args</span><span class="p">)</span>
+
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span>
+      <span class="s1">&#39;train&#39;</span><span class="p">,</span>
+      <span class="s1">&#39;eval&#39;</span><span class="p">,</span>
+      <span class="s1">&#39;train_eval&#39;</span><span class="p">,</span>
+      <span class="s1">&#39;infer&#39;</span><span class="p">,</span>
+      <span class="s1">&#39;interactive_infer&#39;</span>
+  <span class="p">]:</span>
+    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Mode has to be one of &quot;</span>
+                     <span class="s2">&quot;[&#39;train&#39;, &#39;eval&#39;, &#39;train_eval&#39;, &#39;infer&#39;, &quot;</span>
+                     <span class="s2">&quot;&#39;interactive_infer&#39;]&quot;</span><span class="p">)</span>
+  <span class="n">config_module</span> <span class="o">=</span> <span class="n">runpy</span><span class="o">.</span><span class="n">run_path</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">config_file</span><span class="p">,</span> <span class="n">init_globals</span><span class="o">=</span><span class="p">{</span><span class="s1">&#39;tf&#39;</span><span class="p">:</span> <span class="n">tf</span><span class="p">})</span>
+
+  <span class="n">base_config</span> <span class="o">=</span> <span class="n">config_module</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;base_params&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+  <span class="k">if</span> <span class="n">base_config</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;base_config dictionary has to be &#39;</span>
+                     <span class="s1">&#39;defined in the config file&#39;</span><span class="p">)</span>
+  <span class="n">base_model</span> <span class="o">=</span> <span class="n">config_module</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;base_model&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+  <span class="k">if</span> <span class="n">base_model</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;base_config class has to be defined in the config file&#39;</span><span class="p">)</span>
+
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">use_trt</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">!=</span> <span class="s1">&#39;infer&#39;</span><span class="p">:</span>
+    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;TensorRT is only supported for inference mode.&quot;</span><span class="p">)</span>
+
+  <span class="c1"># after we read the config, trying to overwrite some of the properties</span>
+  <span class="c1"># with command line arguments that were passed to the script</span>
+  <span class="n">parser_unk</span> <span class="o">=</span> <span class="n">argparse</span><span class="o">.</span><span class="n">ArgumentParser</span><span class="p">()</span>
+  <span class="k">for</span> <span class="n">pm</span><span class="p">,</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">flatten_dict</span><span class="p">(</span><span class="n">base_config</span><span class="p">)</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+    <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">value</span><span class="p">)</span> <span class="o">==</span> <span class="nb">int</span> <span class="ow">or</span> <span class="nb">type</span><span class="p">(</span><span class="n">value</span><span class="p">)</span> <span class="o">==</span> <span class="nb">float</span> <span class="ow">or</span> \
+       <span class="nb">isinstance</span><span class="p">(</span><span class="n">value</span><span class="p">,</span> <span class="n">string_types</span><span class="p">):</span>
+      <span class="n">parser_unk</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--&#39;</span> <span class="o">+</span> <span class="n">pm</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="n">value</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">type</span><span class="p">(</span><span class="n">value</span><span class="p">))</span>
+    <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">value</span><span class="p">)</span> <span class="o">==</span> <span class="nb">bool</span><span class="p">:</span>
+      <span class="n">parser_unk</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--&#39;</span> <span class="o">+</span> <span class="n">pm</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="n">value</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="n">ast</span><span class="o">.</span><span class="n">literal_eval</span><span class="p">)</span>
+  <span class="n">config_update</span> <span class="o">=</span> <span class="n">parser_unk</span><span class="o">.</span><span class="n">parse_args</span><span class="p">(</span><span class="n">unknown</span><span class="p">)</span>
+  <span class="n">nested_update</span><span class="p">(</span><span class="n">base_config</span><span class="p">,</span> <span class="n">nest_dict</span><span class="p">(</span><span class="nb">vars</span><span class="p">(</span><span class="n">config_update</span><span class="p">)))</span>
+
+  <span class="k">return</span> <span class="n">args</span><span class="p">,</span> <span class="n">base_config</span><span class="p">,</span> <span class="n">base_model</span><span class="p">,</span> <span class="n">config_module</span></div>
+
+<div class="viewcode-block" id="check_logdir"><a class="viewcode-back" href="../../api-docs/utils.html#utils.utils.check_logdir">[docs]</a><span class="k">def</span> <span class="nf">check_logdir</span><span class="p">(</span><span class="n">args</span><span class="p">,</span> <span class="n">base_config</span><span class="p">,</span> <span class="n">restore_best_checkpoint</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+  <span class="sd">&quot;&quot;&quot;A helper function that ensures the logdir is setup correctly</span>
+
+<span class="sd">  Args:</span>
+<span class="sd">    args (dict): Dictionary as returned from get_base_config()</span>
+<span class="sd">    base_config (dict): Dictionary as returned from get_base_config()</span>
+<span class="sd">    restore_best_checkpoint (bool): If True, will look for ckpt_dir + /best_models</span>
+<span class="sd">  Returns:</span>
+<span class="sd">    checkpoint: Either None if continue-learning is not set and training, or</span>
+<span class="sd">      the name of the checkpoint used to restore the model</span>
+<span class="sd">  &quot;&quot;&quot;</span>
+  <span class="c1"># checking that everything is correct with log directory</span>
+  <span class="n">logdir</span> <span class="o">=</span> <span class="n">base_config</span><span class="p">[</span><span class="s1">&#39;logdir&#39;</span><span class="p">]</span>
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">benchmark</span><span class="p">:</span>
+    <span class="n">args</span><span class="o">.</span><span class="n">no_dir_check</span> <span class="o">=</span> <span class="kc">True</span>
+  <span class="k">try</span><span class="p">:</span>
+    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_logs</span><span class="p">:</span>
+      <span class="n">ckpt_dir</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">logdir</span><span class="p">,</span> <span class="s1">&#39;logs&#39;</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="n">ckpt_dir</span> <span class="o">=</span> <span class="n">logdir</span>
+    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train&#39;</span> <span class="ow">or</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train_eval&#39;</span><span class="p">:</span>
+      <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="n">logdir</span><span class="p">):</span>
+        <span class="k">raise</span> <span class="ne">IOError</span><span class="p">(</span><span class="s2">&quot;There is a file with the same name as </span><span class="se">\&quot;</span><span class="s2">logdir</span><span class="se">\&quot;</span><span class="s2"> &quot;</span>
+                      <span class="s2">&quot;parameter. You should change the log directory path &quot;</span>
+                      <span class="s2">&quot;or delete the file to continue.&quot;</span><span class="p">)</span>
+
+      <span class="c1"># check if &quot;logdir&quot; directory exists and non-empty</span>
+      <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isdir</span><span class="p">(</span><span class="n">logdir</span><span class="p">)</span> <span class="ow">and</span> <span class="n">os</span><span class="o">.</span><span class="n">listdir</span><span class="p">(</span><span class="n">logdir</span><span class="p">)</span> <span class="o">!=</span> <span class="p">[]:</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="n">args</span><span class="o">.</span><span class="n">continue_learning</span><span class="p">:</span>
+          <span class="k">raise</span> <span class="ne">IOError</span><span class="p">(</span><span class="s2">&quot;Log directory is not empty. If you want to continue &quot;</span>
+                        <span class="s2">&quot;learning, you should provide &quot;</span>
+                        <span class="s2">&quot;</span><span class="se">\&quot;</span><span class="s2">--continue_learning</span><span class="se">\&quot;</span><span class="s2"> flag&quot;</span><span class="p">)</span>
+        <span class="n">checkpoint</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">latest_checkpoint</span><span class="p">(</span><span class="n">ckpt_dir</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">checkpoint</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+          <span class="k">raise</span> <span class="ne">IOError</span><span class="p">(</span>
+              <span class="s2">&quot;There is no valid TensorFlow checkpoint in the &quot;</span>
+              <span class="s2">&quot;</span><span class="si">{}</span><span class="s2"> directory. Can&#39;t load model&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">ckpt_dir</span><span class="p">)</span>
+          <span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">continue_learning</span><span class="p">:</span>
+          <span class="k">raise</span> <span class="ne">IOError</span><span class="p">(</span><span class="s2">&quot;The log directory is empty or does not exist. &quot;</span>
+                        <span class="s2">&quot;You should probably not provide &quot;</span>
+                        <span class="s2">&quot;</span><span class="se">\&quot;</span><span class="s2">--continue_learning</span><span class="se">\&quot;</span><span class="s2"> flag?&quot;</span><span class="p">)</span>
+        <span class="n">checkpoint</span> <span class="o">=</span> <span class="kc">None</span>
+    <span class="k">elif</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;infer&#39;</span> <span class="ow">or</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;eval&#39;</span> <span class="ow">or</span>
+        <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;interactive_infer&#39;</span><span class="p">):</span>
+      <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isdir</span><span class="p">(</span><span class="n">logdir</span><span class="p">)</span> <span class="ow">and</span> <span class="n">os</span><span class="o">.</span><span class="n">listdir</span><span class="p">(</span><span class="n">logdir</span><span class="p">)</span> <span class="o">!=</span> <span class="p">[]:</span>
+        <span class="k">if</span> <span class="n">restore_best_checkpoint</span><span class="p">:</span>
+          <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Restoring from best checkpoint&quot;</span><span class="p">)</span>
+          <span class="n">checkpoint</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">latest_checkpoint</span><span class="p">(</span><span class="n">ckpt_dir</span> <span class="o">+</span> <span class="s1">&#39;/best_models&#39;</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+          <span class="n">checkpoint</span> <span class="o">=</span> <span class="n">tf</span><span class="o">.</span><span class="n">train</span><span class="o">.</span><span class="n">latest_checkpoint</span><span class="p">(</span><span class="n">ckpt_dir</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">checkpoint</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+          <span class="k">raise</span> <span class="ne">IOError</span><span class="p">(</span>
+              <span class="s2">&quot;There is no valid TensorFlow checkpoint in the &quot;</span>
+              <span class="s2">&quot;</span><span class="si">{}</span><span class="s2"> directory. Can&#39;t load model&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">ckpt_dir</span><span class="p">)</span>
+          <span class="p">)</span>
+      <span class="k">else</span><span class="p">:</span>
+        <span class="k">raise</span> <span class="ne">IOError</span><span class="p">(</span>
+            <span class="s2">&quot;</span><span class="si">{}</span><span class="s2"> does not exist or is empty, can&#39;t restore model&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+                <span class="n">ckpt_dir</span>
+            <span class="p">)</span>
+        <span class="p">)</span>
+  <span class="k">except</span> <span class="ne">IOError</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">no_dir_check</span><span class="p">:</span>
+      <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Warning: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">e</span><span class="p">))</span>
+      <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Resuming operation since no_dir_check argument was provided&quot;</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+      <span class="k">raise</span>
+
+  <span class="k">return</span> <span class="n">checkpoint</span></div>
+
+<div class="viewcode-block" id="create_logdir"><a class="viewcode-back" href="../../api-docs/utils.html#utils.utils.create_logdir">[docs]</a><span class="k">def</span> <span class="nf">create_logdir</span><span class="p">(</span><span class="n">args</span><span class="p">,</span> <span class="n">base_config</span><span class="p">):</span>
+  <span class="sd">&quot;&quot;&quot;A helper function that ensures the logdir and log files are setup corretly.</span>
+<span class="sd">  Only called in --enable_logs is set.</span>
+
+<span class="sd">   Args:</span>
+<span class="sd">    args (dict): Dictionary as returned from get_base_config()</span>
+<span class="sd">    base_config (dict): Dictionary as returned from get_base_config()</span>
+
+<span class="sd">  Returns:</span>
+<span class="sd">    Some objects that need to be cleaned up in run.py</span>
+<span class="sd">  &quot;&quot;&quot;</span>
+  <span class="n">logdir</span> <span class="o">=</span> <span class="n">base_config</span><span class="p">[</span><span class="s1">&#39;logdir&#39;</span><span class="p">]</span>
+  <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">logdir</span><span class="p">):</span>
+    <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="n">logdir</span><span class="p">)</span>
+
+  <span class="n">tm_suf</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">_%H-%M-%S&#39;</span><span class="p">)</span>
+  <span class="n">shutil</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span>
+      <span class="n">args</span><span class="o">.</span><span class="n">config_file</span><span class="p">,</span>
+      <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">logdir</span><span class="p">,</span> <span class="s1">&#39;config_</span><span class="si">{}</span><span class="s1">.py&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">tm_suf</span><span class="p">)),</span>
+  <span class="p">)</span>
+
+  <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">logdir</span><span class="p">,</span> <span class="s1">&#39;cmd-args_</span><span class="si">{}</span><span class="s1">.log&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">tm_suf</span><span class="p">)),</span>
+            <span class="s1">&#39;w&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+    <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">sys</span><span class="o">.</span><span class="n">argv</span><span class="p">))</span>
+
+  <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">logdir</span><span class="p">,</span> <span class="s1">&#39;git-info_</span><span class="si">{}</span><span class="s1">.log&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">tm_suf</span><span class="p">)),</span>
+            <span class="s1">&#39;w&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+    <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;commit hash: </span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">get_git_hash</span><span class="p">()))</span>
+    <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">get_git_diff</span><span class="p">())</span>
+
+  <span class="n">old_stdout</span> <span class="o">=</span> <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span>
+  <span class="n">old_stderr</span> <span class="o">=</span> <span class="n">sys</span><span class="o">.</span><span class="n">stderr</span>
+  <span class="n">stdout_log</span> <span class="o">=</span> <span class="nb">open</span><span class="p">(</span>
+      <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">logdir</span><span class="p">,</span> <span class="s1">&#39;stdout_</span><span class="si">{}</span><span class="s1">.log&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">tm_suf</span><span class="p">)),</span> <span class="s1">&#39;a&#39;</span><span class="p">,</span> <span class="mi">1</span>
+  <span class="p">)</span>
+  <span class="n">stderr_log</span> <span class="o">=</span> <span class="nb">open</span><span class="p">(</span>
+      <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">logdir</span><span class="p">,</span> <span class="s1">&#39;stderr_</span><span class="si">{}</span><span class="s1">.log&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">tm_suf</span><span class="p">)),</span> <span class="s1">&#39;a&#39;</span><span class="p">,</span> <span class="mi">1</span>
+  <span class="p">)</span>
+  <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span> <span class="o">=</span> <span class="n">Logger</span><span class="p">(</span><span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="p">,</span> <span class="n">stdout_log</span><span class="p">)</span>
+  <span class="n">sys</span><span class="o">.</span><span class="n">stderr</span> <span class="o">=</span> <span class="n">Logger</span><span class="p">(</span><span class="n">sys</span><span class="o">.</span><span class="n">stderr</span><span class="p">,</span> <span class="n">stderr_log</span><span class="p">)</span>
+
+  <span class="k">return</span> <span class="n">old_stdout</span><span class="p">,</span> <span class="n">old_stderr</span><span class="p">,</span> <span class="n">stdout_log</span><span class="p">,</span> <span class="n">stderr_log</span></div>
+
+<div class="viewcode-block" id="create_model"><a class="viewcode-back" href="../../api-docs/utils.html#utils.utils.create_model">[docs]</a><span class="k">def</span> <span class="nf">create_model</span><span class="p">(</span><span class="n">args</span><span class="p">,</span> <span class="n">base_config</span><span class="p">,</span> <span class="n">config_module</span><span class="p">,</span> <span class="n">base_model</span><span class="p">,</span> <span class="n">hvd</span><span class="p">):</span>
+  <span class="sd">&quot;&quot;&quot;A helpful function that creates the train, eval, and infer models as</span>
+<span class="sd">  needed.</span>
+
+<span class="sd">  Args:</span>
+<span class="sd">    args (dict): Dictionary as returned from get_base_config()</span>
+<span class="sd">    base_config (dict): Dictionary as returned from get_base_config()</span>
+<span class="sd">    config_module: config_module as returned from get_base_config()</span>
+<span class="sd">    base_model (OpenSeq2Seq model): Dictionary as returned from</span>
+<span class="sd">      get_base_config()</span>
+<span class="sd">    hvd: Either None if Horovod is not enabled, or the Horovod library</span>
+
+<span class="sd">  Returns:</span>
+<span class="sd">    model: A compiled model. For the &#39;train_eval&#39; mode, a tuple containing the</span>
+<span class="sd">      (train_model, eval_model) is returned.</span>
+<span class="sd">  &quot;&quot;&quot;</span>
+  <span class="n">train_config</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">base_config</span><span class="p">)</span>
+  <span class="n">eval_config</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">base_config</span><span class="p">)</span>
+  <span class="n">infer_config</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">base_config</span><span class="p">)</span>
+
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train&#39;</span> <span class="ow">or</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train_eval&#39;</span><span class="p">:</span>
+    <span class="k">if</span> <span class="s1">&#39;train_params&#39;</span> <span class="ow">in</span> <span class="n">config_module</span><span class="p">:</span>
+      <span class="n">nested_update</span><span class="p">(</span><span class="n">train_config</span><span class="p">,</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">config_module</span><span class="p">[</span><span class="s1">&#39;train_params&#39;</span><span class="p">]))</span>
+    <span class="k">if</span> <span class="n">hvd</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+      <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Training config:&quot;</span><span class="p">)</span>
+      <span class="n">pprint</span><span class="o">.</span><span class="n">pprint</span><span class="p">(</span><span class="n">train_config</span><span class="p">)</span>
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;eval&#39;</span> <span class="ow">or</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train_eval&#39;</span><span class="p">:</span>
+    <span class="k">if</span> <span class="s1">&#39;eval_params&#39;</span> <span class="ow">in</span> <span class="n">config_module</span><span class="p">:</span>
+      <span class="n">nested_update</span><span class="p">(</span><span class="n">eval_config</span><span class="p">,</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">config_module</span><span class="p">[</span><span class="s1">&#39;eval_params&#39;</span><span class="p">]))</span>
+    <span class="k">if</span> <span class="n">hvd</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+      <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Evaluation config:&quot;</span><span class="p">)</span>
+      <span class="n">pprint</span><span class="o">.</span><span class="n">pprint</span><span class="p">(</span><span class="n">eval_config</span><span class="p">)</span>
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s2">&quot;infer&quot;</span><span class="p">:</span>
+    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">infer_output_file</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\&quot;</span><span class="s2">infer_output_file</span><span class="se">\&quot;</span><span class="s2"> command line parameter is &quot;</span>
+                       <span class="s2">&quot;required in inference mode&quot;</span><span class="p">)</span>
+    <span class="k">if</span> <span class="s2">&quot;infer_params&quot;</span> <span class="ow">in</span> <span class="n">config_module</span><span class="p">:</span>
+      <span class="n">nested_update</span><span class="p">(</span><span class="n">infer_config</span><span class="p">,</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">config_module</span><span class="p">[</span><span class="s1">&#39;infer_params&#39;</span><span class="p">]))</span>
+    <span class="k">if</span> <span class="n">hvd</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+      <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Inference config:&quot;</span><span class="p">)</span>
+      <span class="n">pprint</span><span class="o">.</span><span class="n">pprint</span><span class="p">(</span><span class="n">infer_config</span><span class="p">)</span>
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s2">&quot;interactive_infer&quot;</span><span class="p">:</span>
+    <span class="k">if</span> <span class="s2">&quot;interactive_infer_params&quot;</span> <span class="ow">in</span> <span class="n">config_module</span><span class="p">:</span>
+      <span class="n">nested_update</span><span class="p">(</span>
+          <span class="n">infer_config</span><span class="p">,</span>
+          <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">config_module</span><span class="p">[</span><span class="s1">&#39;interactive_infer_params&#39;</span><span class="p">])</span>
+      <span class="p">)</span>
+    <span class="k">if</span> <span class="n">hvd</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+      <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Inference config:&quot;</span><span class="p">)</span>
+      <span class="n">pprint</span><span class="o">.</span><span class="n">pprint</span><span class="p">(</span><span class="n">infer_config</span><span class="p">)</span>
+
+
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">benchmark</span><span class="p">:</span>
+    <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;Adjusting config for benchmarking&quot;</span><span class="p">)</span>
+    <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;print_samples_steps&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+    <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;print_loss_steps&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">1</span>
+    <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;save_summaries_steps&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+    <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;save_checkpoint_steps&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+    <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;logdir&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="s2">&quot;&quot;</span><span class="p">)</span>
+    <span class="k">if</span> <span class="s1">&#39;num_epochs&#39;</span> <span class="ow">in</span> <span class="n">train_config</span><span class="p">:</span>
+      <span class="k">del</span> <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;num_epochs&#39;</span><span class="p">]</span>
+    <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;max_steps&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">bench_steps</span>
+    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">bench_start</span><span class="p">:</span>
+      <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;bench_start&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">bench_start</span>
+    <span class="k">elif</span> <span class="s1">&#39;bench_start&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">train_config</span><span class="p">:</span>
+      <span class="n">train_config</span><span class="p">[</span><span class="s1">&#39;bench_start&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">10</span>  <span class="c1"># default value</span>
+
+    <span class="k">if</span> <span class="n">hvd</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="n">hvd</span><span class="o">.</span><span class="n">rank</span><span class="p">()</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+      <span class="n">deco_print</span><span class="p">(</span><span class="s2">&quot;New benchmarking config:&quot;</span><span class="p">)</span>
+      <span class="n">pprint</span><span class="o">.</span><span class="n">pprint</span><span class="p">(</span><span class="n">train_config</span><span class="p">)</span>
+    <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">=</span> <span class="s2">&quot;train&quot;</span>
+
+  <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train_eval&#39;</span><span class="p">:</span>
+    <span class="n">train_model</span> <span class="o">=</span> <span class="n">base_model</span><span class="p">(</span><span class="n">params</span><span class="o">=</span><span class="n">train_config</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;train&quot;</span><span class="p">,</span> <span class="n">hvd</span><span class="o">=</span><span class="n">hvd</span><span class="p">)</span>
+    <span class="n">train_model</span><span class="o">.</span><span class="n">compile</span><span class="p">()</span>
+    <span class="n">eval_model</span> <span class="o">=</span> <span class="n">base_model</span><span class="p">(</span><span class="n">params</span><span class="o">=</span><span class="n">eval_config</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;eval&quot;</span><span class="p">,</span> <span class="n">hvd</span><span class="o">=</span><span class="n">hvd</span><span class="p">)</span>
+    <span class="n">eval_model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">force_var_reuse</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+    <span class="n">model</span> <span class="o">=</span> <span class="p">(</span><span class="n">train_model</span><span class="p">,</span> <span class="n">eval_model</span><span class="p">)</span>
+  <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;train&#39;</span><span class="p">:</span>
+    <span class="n">model</span> <span class="o">=</span> <span class="n">base_model</span><span class="p">(</span><span class="n">params</span><span class="o">=</span><span class="n">train_config</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;train&quot;</span><span class="p">,</span> <span class="n">hvd</span><span class="o">=</span><span class="n">hvd</span><span class="p">)</span>
+    <span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">()</span>
+  <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">mode</span> <span class="o">==</span> <span class="s1">&#39;eval&#39;</span><span class="p">:</span>
+    <span class="n">model</span> <span class="o">=</span> <span class="n">base_model</span><span class="p">(</span><span class="n">params</span><span class="o">=</span><span class="n">eval_config</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;eval&quot;</span><span class="p">,</span> <span class="n">hvd</span><span class="o">=</span><span class="n">hvd</span><span class="p">)</span>
+    <span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">force_var_reuse</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+  <span class="k">else</span><span class="p">:</span>
+    <span class="n">model</span> <span class="o">=</span> <span class="n">base_model</span><span class="p">(</span><span class="n">params</span><span class="o">=</span><span class="n">infer_config</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">mode</span><span class="p">,</span> <span class="n">hvd</span><span class="o">=</span><span class="n">hvd</span><span class="p">)</span>
+    <span class="n">checkpoint</span> <span class="o">=</span> <span class="n">check_logdir</span><span class="p">(</span><span class="n">args</span><span class="p">,</span> <span class="n">base_config</span><span class="p">)</span>
+    <span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">checkpoint</span><span class="o">=</span><span class="n">checkpoint</span><span class="p">,</span> <span class="n">use_trt</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">use_trt</span><span class="p">,</span> <span class="n">precision</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">precision</span><span class="p">)</span>
+
+  <span class="k">return</span> <span class="n">model</span></div>
 </pre></div>
 
            </div>
diff --git a/docs/html/_sources/machine-translation.rst.txt b/docs/html/_sources/machine-translation.rst.txt
index 804935b2d..12a1da2c8 100644
--- a/docs/html/_sources/machine-translation.rst.txt
+++ b/docs/html/_sources/machine-translation.rst.txt
@@ -19,15 +19,15 @@ Currently we support following models:
      - Checkpoint
    * - :doc:`Transformer </machine-translation/transformer>`
      - 26.4
-     - `transformer-big.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/transformer-big.py>`_     
+     - `transformer-base.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/transformer-base.py>`_     
      - TBD
    * - :doc:`ConvS2S </machine-translation/convs2s>`
      - 25.0
-     - `en-de-convs2s.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-convs2s.py>`_
+     - `en-de-convs2s-8-gpu.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-convs2s-8-gpu.py>`_
      - TBD
    * - :doc:`GNMT </machine-translation/gnmt>`
      - 23.0
-     - `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_
+     - `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_
      - TBD
 
 The model specification and training parameters can be found in the corresponding config file. We measure BLEU scores using SacreBLEU.
diff --git a/docs/html/_sources/machine-translation/gnmt.rst.txt b/docs/html/_sources/machine-translation/gnmt.rst.txt
index 3c1176086..ba5aedb35 100644
--- a/docs/html/_sources/machine-translation/gnmt.rst.txt
+++ b/docs/html/_sources/machine-translation/gnmt.rst.txt
@@ -6,12 +6,12 @@ GNMT
 Model
 ~~~~~
 We have 2 models based on RNNs:
-  * small NMT (config `en-de-nmt-small.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-nmt-small.py>`_ ) model:
+  * small NMT (config `en-de-nmt-small.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-nmt-small.py>`_ ) model:
 
     - the embedding size for source and target is 512
     - 2 birectional LSTM layers in encoder, and 2 LSTM layers in decoder  with state 512
     - the attention mechanism with size 512
-  * GNMT-like model based on `Google NMT <https://ai.google/research/pubs/pub45610>`_  (config `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_ ):
+  * GNMT-like model based on `Google NMT <https://ai.google/research/pubs/pub45610>`_  (config `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_ ):
 
     - the embedding size for source and target is 1024
     - 8 LSTM layers in encoder, and 8 LSTM layers in decoder with state 1024
diff --git a/docs/html/_sources/models-and-recipes.rst.txt b/docs/html/_sources/models-and-recipes.rst.txt
deleted file mode 100644
index e98a2679d..000000000
--- a/docs/html/_sources/models-and-recipes.rst.txt
+++ /dev/null
@@ -1,173 +0,0 @@
-.. _models_and_recipes:
-
-Models and recipes
-==================
-
-
-.. note::
-    Currently OpenSeq2Seq has model implementations for machine translation and
-    automatic speech recognition.
-    All models work both in float32 and mixed precision.
-    We recommend you use :ref:`mixed precision training <mixed_precision>`
-    when training on Volta GPUs.
-
-
-To train models you can use the following commands (don't forget to substitute
-valid config_file path there and number of GPUs if using Horovod).
-
-With Horovod (highly recommended when using multiple GPUs)::
-
-    mpiexec --allow-run-as-root -np <num_gpus> python run.py --config_file=... --mode=train_eval --use_horovod=True --enable_logs
-
-Without Horovod::
-
-    python run.py --config_file=... --mode=train_eval --enable_logs
-
-The description of implemented models is available in the next sections:
-
-Machine translation
--------------------
-
-The table below contains description and results of
-machine translation models available in OpenSeq2Seq.
-Currently, we have GNMT-based model, Transformer-based models and
-ConvS2S-based models.
-
-We measure BLEU score on newstest2014.tok.de file using ``multi-bleu.perl`` script from Mosses.
-For more details about model descriptions and training setup,
-have a look at the `configuration files <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de>`_.
-
-
-.. list-table::
-   :widths: 1 1 1 1 1
-   :header-rows: 1
-
-   * - Config file
-     - BLEU
-     - Training setup and additional comments
-     - Short description of the model
-     - Checkpoint
-   * - `en-de-nmt-small.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-nmt-small.py>`_
-     - 20.23
-     - This model should train on a single GPU such as 1080Ti. It is trained using Adam optimizer.
-     - RNN-based. Bi-directional encoder with 2 layers and. GNMT-like decoder with 2 layers and attention. Uses LSTM cells of size 512.
-     - `link <https://drive.google.com/file/d/1Ty9hiOQx4V28jJmIbj7FWUyw7LVA39SF/view?usp=sharing>`_
-   * - `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_
-     - 23.89
-     - This model was trained on 4 GPUs with Adam optimizer and learning rate decay.
-     - RNN-based. This is GNMT-like model which tries to match the one described in https://arxiv.org/abs/1609.08144 as close as possible.
-     - `link <https://drive.google.com/file/d/1HVc4S8-wv1-AZK1JeWgn6YNITSFAMes_/view?usp=sharing>`_
-   * - `transformer-big.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/transformer-big.py>`_
-     - 26.17
-     - This model was trained on 4 GPUs with Adam optimizer and learning rate decay.
-     - Transformer "big" model. This model does not have any RNN layers
-     - `link <https://drive.google.com/file/d/151R6iCCtehRLpnH3nBmhEi_nhNO2mXW8/view?usp=sharing>`_
-   * - `en-de-convs2s.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-convs2s.py>`_
-     - xx.xx
-     - This model was trained on 4 GPUs with Adam optimizer, learning rate decay and warm-up.
-     - This is an implementation of the ConvS2S model proposed in https://arxiv.org/abs/1705.03122.
-     - Coming soon.
-
-GNMT model description: https://arxiv.org/abs/1609.08144.
-
-Transformer model description: https://arxiv.org/abs/1706.03762.
-
-ConvS2S model description: https://arxiv.org/abs/1705.03122.
-
-Speech recognition
-------------------
-
-The table below contains description and results of
-speech recognition models available in OpenSeq2Seq.
-Currently, we have DeepSpeech2-based models and Wav2Letter-based models.
-
-WER is the word error rate obtained on a dev-clean subset of LibriSpeech using
-greedy decoder (``decoder_params/use_language_model = False``).
-For the final evaluation we used ``batch_size_per_gpu = 1``
-to eliminate the effect of `cudnn padding issue <https://github.com/NVIDIA/OpenSeq2Seq/issues/69>`_.
-For more details about model descriptions and training setup,
-have a look at the `configuration files <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text>`_.
-
-.. list-table::
-   :widths: 1 1 1 1 1
-   :header-rows: 1
-
-   * - Config file
-     - WER
-     - Training setup and additional comments
-     - Short description of the model
-     - Checkpoint
-   * - `w2l_large_8gpus_mp.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2l_large_8gpus_mp.py>`_
-     - 7.19%
-     - This model was trained for 200 epochs using SGD with Momentum and LARC on
-       the full LibriSpeech in three days on eight GPUs using mixed precision.
-     - The model has 17 convolutional layers (256--1024 units, 11--29 kernel size).
-       We use batch norm between all layers.
-     - `link <https://drive.google.com/file/d/140edZXuzehCCaOxgEixJEesvo97EB5i1/view?usp=sharing>`_
-   * - `ds2_large_8gpus.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus.py>`_
-     - 9.28%
-     - This model was trained for 50 epochs using SGD with Momentum and LARC on
-       the full LibriSpeech in a few days using Horovod on eight GPUs.
-     - This model has 2 convolutional layers and 5 bidirectional
-       GRU layers with 800 units.
-     - `link <https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX>`_
-   * - `ds2_medium_4gpus.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_medium_4gpus.py>`_
-     - 22.60%
-     - This model was trained for 50 epochs using Adam on the full
-       LibriSpeech in a few days using Horovod on four GPUs.
-     - This model has 3 convolutional layers and 3 unidirectional
-       GRU layers with 1024 units.
-     - `link <https://drive.google.com/file/d/1XpnyZzMaO38RE4dSOJZkcaJ3T8B0lxKe/view?usp=sharing>`_
-   * - `ds2_small_1gpu.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_small_1gpu.py>`_
-     - 39.08%
-     - This model was trained for 12 epochs using Adam on a "clean" subset of
-       LibriSpeech in less than a day using a single GPU.
-     - This model has 2 convolutional layers and 2 bidirectional
-       GRU layers with 512 units.
-     - `link <https://drive.google.com/file/d/1-OEvxyg7rCogZhejen7pNuKkgvuwCdbk/view?usp=sharing>`_
-
-
-Deep Speech 2 model description: https://arxiv.org/abs/1512.02595.
-
-Wav2Letter model description: https://arxiv.org/abs/1609.03193, https://arxiv.org/abs/1712.09444.
-
-Text To Speech
----------------
-
-The table below contains description and results of
-text-to-speech models available in OpenSeq2Seq.
-Currently, we have a Tacotron2-based model.
-
-.. list-table::
-   :widths: 1 1 1 1 1
-   :header-rows: 1
-
-   * - Config file
-     - Samples
-     - Training setup and additional comments
-     - Short description of the model
-     - Checkpoint
-   * - `tacotron_LJ_float.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float.py>`_
-     - Coming soon.
-     - Learns magnitude spectrograms. Trained on 1 gpu for 100,000 steps with ADAM.
-     - Model tries to match the model description in https://arxiv.org/abs/1712.05884.
-       The only difference is that the stop token projection layer is placed after
-       the spectrogram projection layer.
-     - Coming soon.
-   * - `tacotron_LJ_float_8gpu.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float_8gpu.py>`_
-     - Coming soon.
-     - Learns magnitude spectrograms. Trained on 8 gpus for 30,000 steps with ADAM and larc.
-     - Model tries to match the model description in https://arxiv.org/abs/1712.05884.
-       The only difference is that the stop token projection layer is placed after
-       the spectrogram projection layer.
-     - Coming soon.
-   * - `tacotron_LJ_mixed.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_mixed.py>`_
-     - Coming soon.
-     - Learns magnitude spectrograms. Trained on 1 gpu for 100,000 steps with ADAM and larc.
-     - Model tries to match the model description in https://arxiv.org/abs/1712.05884.
-       The only difference is that the stop token projection layer is placed after
-       the spectrogram projection layer.
-     - Coming soon.
-
-
-Tacotron 2 model description: https://arxiv.org/abs/1712.05884.
diff --git a/docs/html/_sources/speech-recognition.rst.txt b/docs/html/_sources/speech-recognition.rst.txt
index c5923c636..fd0ef6931 100644
--- a/docs/html/_sources/speech-recognition.rst.txt
+++ b/docs/html/_sources/speech-recognition.rst.txt
@@ -21,12 +21,12 @@ Currently we support following models:
 
    * - :doc:`DeepSpeech2 </speech-recognition/deepspeech2>`
      - 6.71
-     - `ds2_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus_mp.py>`_
+     - `ds2_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/ds2_large_8gpus_mp.py>`_
      - `link <https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX>`_
 
-   * - :doc:`Wavel2Letter </speech-recognition/wave2letter>`
+   * - :doc:`Wavel2Letter+ </speech-recognition/wave2letter>`
      - 6.67
-     - `w2l_plus_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2lplus_large_8gpus_mp.py>`_
+     - `w2l_plus_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/w2lplus_large_8gpus_mp.py>`_
      - `link <https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing>`_
 
 
@@ -36,7 +36,7 @@ For the evaluation we used ``batch_size_per_gpu = 1``
 to eliminate the effect of `cudnn padding issue <https://github.com/NVIDIA/OpenSeq2Seq/issues/69>`_.
 
 For more details about model and training parameters,
-have a look at the `configuration files <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text>`_ and specific model's documentation.
+have a look at the `configuration files <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text>`_ and specific model's documentation.
 
 .. toctree::
    :hidden:
diff --git a/docs/html/_sources/speech-recognition/deepspeech2.rst.txt b/docs/html/_sources/speech-recognition/deepspeech2.rst.txt
index b31d79c41..53845183c 100644
--- a/docs/html/_sources/speech-recognition/deepspeech2.rst.txt
+++ b/docs/html/_sources/speech-recognition/deepspeech2.rst.txt
@@ -80,7 +80,7 @@ Here is a pre-trained model which was trained for 200 epochs in a mixed precisio
 
    * - :doc:`DeepSpeech2 </speech-recognition/deepspeech2>`
      - 6.71
-     - `ds2_large_8gpus_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus_mp.py>`_
+     - `ds2_large_8gpus_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/ds2_large_8gpus_mp.py>`_
      - `link <https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX>`_
 
 
diff --git a/docs/html/_sources/speech-recognition/wave2letter.rst.txt b/docs/html/_sources/speech-recognition/wave2letter.rst.txt
index 0ad7c052f..6d7df92ef 100644
--- a/docs/html/_sources/speech-recognition/wave2letter.rst.txt
+++ b/docs/html/_sources/speech-recognition/wave2letter.rst.txt
@@ -53,7 +53,7 @@ We achieved a WER of 6.58 (the WER in the paper is 6.7) on the librispeech test-
 
 We used Open SLR language model while decoding with beam search using a beam width of 2048.
 
-The checkpoint for the model trained using the configuration `w2l_plus_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2lplus_large_8gpus_mp.py>`_ can be found at `Checkpoint <https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing>`_.
+The checkpoint for the model trained using the configuration `w2l_plus_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/w2lplus_large_8gpus_mp.py>`_ can be found at `Checkpoint <https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing>`_.
 
 Our best model was trained for 200 epochs on 8 GPUs. We use:
 
@@ -70,4 +70,4 @@ Mixed Precision
 
 To use mixed precision (float16) during training we made a few minor changes to the model. Tensorflow by default calls Keras Batch Normalization on 3D input (BxTxC) and cuDNN on 4D input (BxHxWxC). In order to use cuDNN's BN we added an extra dimension to the 3D input to make it a 4D tensor (BxTx1xC). 
 
-The mixed precison model reached the same WER for the same number of steps as float32. The training time decreased by ~1.5x on 8-GPU DGX1 system, and by ~3x on 1-GPU and 4-GPUs when using Horovod.
\ No newline at end of file
+The mixed precison model reached the same WER for the same number of steps as float32. The training time decreased by ~1.5x on 8-GPU DGX1 system, and by ~3x on 1-GPU and 4-GPUs when using Horovod.
diff --git a/docs/html/_sources/speech-synthesis.rst.txt b/docs/html/_sources/speech-synthesis.rst.txt
index e83f98b42..f6752246f 100644
--- a/docs/html/_sources/speech-synthesis.rst.txt
+++ b/docs/html/_sources/speech-synthesis.rst.txt
@@ -17,7 +17,7 @@ Currently we support following models:
      - Config file
      - Checkpoint
    * - :doc:`Tacotron-2 </speech-synthesis/tacotron-2>`
-     - `tacotron_LJ_float.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float.py>`_
+     - `tacotron_LJ_float.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2speech/tacotron_LJ_float.py>`_
      - To be added
 
 The model specification and training parameters can be found in the corresponding config file.
@@ -79,4 +79,4 @@ one audio sample per line and save the audio sample inside your ``log_dir``.
 Change ``dataset_files`` under ``infer_params`` to point to your newly created
 csv. Lastly, run ::
 
-    python run.py --config_file=example_configs/text2speech/tacotron_LJ_float.py --mode=infer --infer_output_file=unused
\ No newline at end of file
+    python run.py --config_file=example_configs/text2speech/tacotron_LJ_float.py --mode=infer --infer_output_file=unused
diff --git a/docs/html/api-docs/data.html b/docs/html/api-docs/data.html
index 5752ed1a1..f6eadfdba 100644
--- a/docs/html/api-docs/data.html
+++ b/docs/html/api-docs/data.html
@@ -251,6 +251,25 @@
 <dd><p>Here all TensorFlow graph construction should happen.</p>
 </dd></dl>
 
+<dl class="method">
+<dt id="data.data_layer.DataLayer.create_feed_dict">
+<code class="descname">create_feed_dict</code><span class="sig-paren">(</span><em>model_in</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/data_layer.html#DataLayer.create_feed_dict"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.data_layer.DataLayer.create_feed_dict" title="Permalink to this definition">¶</a></dt>
+<dd><p>A function that must be defined for data layers that support interactive
+infer. Given input which is an abstract data element to be defined by the
+data layer. The intended use is for the user to build and pass model_in from
+the jupyter notebook. Given model_in, the data layer must preprocess the raw
+data, and create the feed dict that defines the placeholders defined in
+create_interactive_placeholders().</p>
+</dd></dl>
+
+<dl class="method">
+<dt id="data.data_layer.DataLayer.create_interactive_placeholders">
+<code class="descname">create_interactive_placeholders</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/data_layer.html#DataLayer.create_interactive_placeholders"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.data_layer.DataLayer.create_interactive_placeholders" title="Permalink to this definition">¶</a></dt>
+<dd><p>A function that must be defined for data layers that support interactive
+infer. This function is intended to create placeholders that will be passed
+to self._input_tensors that will be passed to the model.</p>
+</dd></dl>
+
 <dl class="staticmethod">
 <dt id="data.data_layer.DataLayer.get_optional_params">
 <em class="property">static </em><code class="descname">get_optional_params</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/data_layer.html#DataLayer.get_optional_params"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.data_layer.DataLayer.get_optional_params" title="Permalink to this definition">¶</a></dt>
diff --git a/docs/html/api-docs/data.speech2text.html b/docs/html/api-docs/data.speech2text.html
index 6c8fba63f..7d463ad4b 100644
--- a/docs/html/api-docs/data.speech2text.html
+++ b/docs/html/api-docs/data.speech2text.html
@@ -220,6 +220,24 @@ <h2>speech2text<a class="headerlink" href="#id1" title="Permalink to this headli
 </div></blockquote>
 </dd></dl>
 
+<dl class="method">
+<dt id="data.speech2text.speech2text.Speech2TextDataLayer._get_audio">
+<code class="descname">_get_audio</code><span class="sig-paren">(</span><em>wav</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/speech2text/speech2text.html#Speech2TextDataLayer._get_audio"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.speech2text.speech2text.Speech2TextDataLayer._get_audio" title="Permalink to this definition">¶</a></dt>
+<dd><p>Parses audio from wav and returns array of audio features.
+:param wav: numpy array containing wav</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Returns:</th><td class="field-body">source audio features as <code class="docutils literal notranslate"><span class="pre">np.array</span></code>, length of source sequence,
+sample id.</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Return type:</th><td class="field-body">tuple</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
 <dl class="method">
 <dt id="data.speech2text.speech2text.Speech2TextDataLayer._parse_audio_element">
 <code class="descname">_parse_audio_element</code><span class="sig-paren">(</span><em>id_and_audio_filename</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/speech2text/speech2text.html#Speech2TextDataLayer._parse_audio_element"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.speech2text.speech2text.Speech2TextDataLayer._parse_audio_element" title="Permalink to this definition">¶</a></dt>
@@ -264,6 +282,33 @@ <h2>speech2text<a class="headerlink" href="#id1" title="Permalink to this headli
 <dd><p>Builds data processing graph using <code class="docutils literal notranslate"><span class="pre">tf.data</span></code> API.</p>
 </dd></dl>
 
+<dl class="method">
+<dt id="data.speech2text.speech2text.Speech2TextDataLayer.create_feed_dict">
+<code class="descname">create_feed_dict</code><span class="sig-paren">(</span><em>model_in</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/speech2text/speech2text.html#Speech2TextDataLayer.create_feed_dict"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.speech2text.speech2text.Speech2TextDataLayer.create_feed_dict" title="Permalink to this definition">¶</a></dt>
+<dd><p>Creates the feed dict for interactive infer</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>model_in</strong> (<em>str</em><em> or </em><em>np.array</em>) – Either a str that contains the file path of the
+wav file, or a numpy array containing 1-d wav file.</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body">Dictionary with values for the placeholders.</td>
+</tr>
+<tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body">feed_dict (dict)</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+<dl class="method">
+<dt id="data.speech2text.speech2text.Speech2TextDataLayer.create_interactive_placeholders">
+<code class="descname">create_interactive_placeholders</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/speech2text/speech2text.html#Speech2TextDataLayer.create_interactive_placeholders"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.speech2text.speech2text.Speech2TextDataLayer.create_interactive_placeholders" title="Permalink to this definition">¶</a></dt>
+<dd><p>A function that must be defined for data layers that support interactive
+infer. This function is intended to create placeholders that will be passed
+to self._input_tensors that will be passed to the model.</p>
+</dd></dl>
+
 <dl class="staticmethod">
 <dt id="data.speech2text.speech2text.Speech2TextDataLayer.get_optional_params">
 <em class="property">static </em><code class="descname">get_optional_params</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/speech2text/speech2text.html#Speech2TextDataLayer.get_optional_params"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.speech2text.speech2text.Speech2TextDataLayer.get_optional_params" title="Permalink to this definition">¶</a></dt>
diff --git a/docs/html/api-docs/data.text2speech.html b/docs/html/api-docs/data.text2speech.html
index fac0c6979..7fc6702b8 100644
--- a/docs/html/api-docs/data.text2speech.html
+++ b/docs/html/api-docs/data.text2speech.html
@@ -200,6 +200,8 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <p>See parent class for arguments description.</p>
 <p>Config parameters:</p>
 <ul class="simple">
+<li><strong>dataset</strong> (str) — The dataset to use. Currently ‘LJ’ for the LJSpeech
+1.1 dataset is supported.</li>
 <li><strong>num_audio_features</strong> (int) — number of audio features to extract.</li>
 <li><strong>output_type</strong> (str) — could be either “magnitude”, or “mel”.</li>
 <li><strong>vocab_file</strong> (str) — path to vocabulary file.</li>
@@ -214,16 +216,31 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <li><strong>feature_normalize_std</strong> (bool) — used for feature normalize.
 Defaults to 1.</li>
 <li><strong>mag_power</strong> (int) — the power to which the magnitude spectrogram is
-scaled to:
+scaled to. Defaults to 1.
 1 for energy spectrogram
 2 for power spectrogram
 Defaults to 2.</li>
 <li><strong>pad_EOS</strong> (bool) — whether to apply EOS tokens to both the text and
 the speech signal. Will pad at least 1 token regardless of pad_to value.
 Defaults to True.</li>
+<li><strong>pad_value</strong> (float) — The value we pad the spectrogram with. Defaults
+to np.log(data_min).</li>
 <li><strong>pad_to</strong> (int) — we pad such that the resulting datapoint is a
 multiple of pad_to.
 Defaults to 8.</li>
+<li><strong>trim</strong> (bool) — Whether to trim silence via librosa or not. Defaults
+to False.</li>
+<li><strong>data_min</strong> (float) — min clip value prior to taking the log. Defaults
+to 1e-5. Please change to 1e-2 if using htk mels.</li>
+<li><strong>duration_min</strong> (int) — Minimum duration in steps for speech signal.
+All signals less than this will be cut from the training set. Defaults to
+0.</li>
+<li><strong>duration_max</strong> (int) — Maximum duration in steps for speech signal.
+All signals greater than this will be cut from the training set. Defaults
+to 4000.</li>
+<li><strong>mel_type</strong> (str): One of [‘slaney’, ‘htk’]. Decides which algorithm to
+use to compute mel specs.
+Defaults to htk.</li>
 </ul>
 </dd></dl>
 
@@ -239,8 +256,7 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 </tr>
 <tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body">text_input text as <cite>np.array</cite> of ids, text_input length,
 target audio features as <cite>np.array</cite>, stop token targets as <cite>np.array</cite>,
-length of target sequence,
-.</td>
+length of target sequence.</td>
 </tr>
 <tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body">tuple</td>
 </tr>
@@ -272,11 +288,37 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <dd><p>Builds data reading graph.</p>
 </dd></dl>
 
+<dl class="method">
+<dt id="data.text2speech.text2speech.Text2SpeechDataLayer.create_feed_dict">
+<code class="descname">create_feed_dict</code><span class="sig-paren">(</span><em>model_in</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/text2speech.html#Text2SpeechDataLayer.create_feed_dict"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.text2speech.Text2SpeechDataLayer.create_feed_dict" title="Permalink to this definition">¶</a></dt>
+<dd><p>Creates the feed dict for interactive infer</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>model_in</strong> (<em>str</em>) – The string to be spoken.</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body">Dictionary with values for the placeholders.</td>
+</tr>
+<tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body">feed_dict (dict)</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+<dl class="method">
+<dt id="data.text2speech.text2speech.Text2SpeechDataLayer.create_interactive_placeholders">
+<code class="descname">create_interactive_placeholders</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/text2speech.html#Text2SpeechDataLayer.create_interactive_placeholders"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.text2speech.Text2SpeechDataLayer.create_interactive_placeholders" title="Permalink to this definition">¶</a></dt>
+<dd><p>A function that must be defined for data layers that support interactive
+infer. This function is intended to create placeholders that will be passed
+to self._input_tensors that will be passed to the model.</p>
+</dd></dl>
+
 <dl class="method">
 <dt id="data.text2speech.text2speech.Text2SpeechDataLayer.get_magnitude_spec">
 <code class="descname">get_magnitude_spec</code><span class="sig-paren">(</span><em>spectrogram</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/text2speech.html#Text2SpeechDataLayer.get_magnitude_spec"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.text2speech.Text2SpeechDataLayer.get_magnitude_spec" title="Permalink to this definition">¶</a></dt>
 <dd><p>Returns an energy magnitude spectrogram. The processing depends on the
-data leyer params.</p>
+data layer params.</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
 <col class="field-body" />
@@ -354,6 +396,21 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 Should be created by <a class="reference internal" href="#data.text2speech.text2speech.Text2SpeechDataLayer.build_graph" title="data.text2speech.text2speech.Text2SpeechDataLayer.build_graph"><code class="xref py py-meth docutils literal notranslate"><span class="pre">self.build_graph()</span></code></a>.</p>
 </dd></dl>
 
+<dl class="attribute">
+<dt id="data.text2speech.text2speech.Text2SpeechDataLayer.n_fft">
+<code class="descname">n_fft</code><a class="headerlink" href="#data.text2speech.text2speech.Text2SpeechDataLayer.n_fft" title="Permalink to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="method">
+<dt id="data.text2speech.text2speech.Text2SpeechDataLayer.parse_text_output">
+<code class="descname">parse_text_output</code><span class="sig-paren">(</span><em>text</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/text2speech.html#Text2SpeechDataLayer.parse_text_output"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.text2speech.Text2SpeechDataLayer.parse_text_output" title="Permalink to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="attribute">
+<dt id="data.text2speech.text2speech.Text2SpeechDataLayer.sampling_rate">
+<code class="descname">sampling_rate</code><a class="headerlink" href="#data.text2speech.text2speech.Text2SpeechDataLayer.sampling_rate" title="Permalink to this definition">¶</a></dt>
+<dd></dd></dl>
+
 <dl class="method">
 <dt id="data.text2speech.text2speech.Text2SpeechDataLayer.split_data">
 <code class="descname">split_data</code><span class="sig-paren">(</span><em>data</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/text2speech.html#Text2SpeechDataLayer.split_data"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.text2speech.Text2SpeechDataLayer.split_data" title="Permalink to this definition">¶</a></dt>
@@ -372,7 +429,7 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 
 <dl class="function">
 <dt id="data.text2speech.speech_utils.get_mel">
-<code class="descclassname">data.text2speech.speech_utils.</code><code class="descname">get_mel</code><span class="sig-paren">(</span><em>log_mag_spec</em>, <em>fs=22050</em>, <em>n_fft=1024</em>, <em>n_mels=80</em>, <em>power=2.0</em>, <em>feature_normalize=False</em>, <em>mean=0</em>, <em>std=1</em>, <em>mel_basis=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/speech_utils.html#get_mel"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.speech_utils.get_mel" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">data.text2speech.speech_utils.</code><code class="descname">get_mel</code><span class="sig-paren">(</span><em>log_mag_spec</em>, <em>fs=22050</em>, <em>n_fft=1024</em>, <em>n_mels=80</em>, <em>power=2.0</em>, <em>feature_normalize=False</em>, <em>mean=0</em>, <em>std=1</em>, <em>mel_basis=None</em>, <em>data_min=1e-05</em>, <em>htk=True</em>, <em>norm=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/speech_utils.html#get_mel"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.speech_utils.get_mel" title="Permalink to this definition">¶</a></dt>
 <dd><p>Method to get mel spectrograms from magnitude spectrograms</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
@@ -389,6 +446,9 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <li><strong>std</strong> (<em>float</em>) – normalization param of mag spec</li>
 <li><strong>mel_basis</strong> (<em>np.array</em>) – optional pre-computed mel basis to save computational
 time if passed. If not passed, it will call librosa to construct one</li>
+<li><strong>data_min</strong> (<em>float</em>) – min clip value prior to taking the log.</li>
+<li><strong>htk</strong> (<em>bool</em>) – whther to compute the mel spec with the htk or slaney algorithm</li>
+<li><strong>norm</strong> – Should be None for htk, and 1 for slaney</li>
 </ul>
 </td>
 </tr>
@@ -404,7 +464,7 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 
 <dl class="function">
 <dt id="data.text2speech.speech_utils.get_speech_features">
-<code class="descclassname">data.text2speech.speech_utils.</code><code class="descname">get_speech_features</code><span class="sig-paren">(</span><em>signal</em>, <em>fs</em>, <em>num_features</em>, <em>features_type='magnitude'</em>, <em>n_window_size=1024</em>, <em>n_window_stride=256</em>, <em>mag_power=2</em>, <em>feature_normalize=False</em>, <em>mean=0.0</em>, <em>std=1.0</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/speech_utils.html#get_speech_features"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.speech_utils.get_speech_features" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">data.text2speech.speech_utils.</code><code class="descname">get_speech_features</code><span class="sig-paren">(</span><em>signal</em>, <em>fs</em>, <em>num_features</em>, <em>features_type='magnitude'</em>, <em>n_fft=1024</em>, <em>hop_length=256</em>, <em>mag_power=2</em>, <em>feature_normalize=False</em>, <em>mean=0.0</em>, <em>std=1.0</em>, <em>data_min=1e-05</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/speech_utils.html#get_speech_features"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.speech_utils.get_speech_features" title="Permalink to this definition">¶</a></dt>
 <dd><p>Helper function to retrieve spectrograms from loaded wav</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
@@ -415,8 +475,8 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <li><strong>fs</strong> (<em>int</em>) – sampling frequency in Hz.</li>
 <li><strong>num_features</strong> (<em>int</em>) – number of speech features in frequency domain.</li>
 <li><strong>features_type</strong> (<em>string</em>) – ‘magnitude’ or ‘mel’.</li>
-<li><strong>window_size</strong> (<em>int</em>) – size of analysis window in samples.</li>
-<li><strong>window_stride</strong> (<em>int</em>) – stride of analysis window in samples.</li>
+<li><strong>n_fft</strong> (<em>int</em>) – size of analysis window in samples.</li>
+<li><strong>hop_length</strong> (<em>int</em>) – stride of analysis window in samples.</li>
 <li><strong>mag_power</strong> (<em>int</em>) – power to raise magnitude spectrograms (prior to dot product
 with mel basis)
 1 for energy spectrograms
@@ -424,15 +484,12 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <li><strong>feature_normalize</strong> (<em>bool</em>) – whether to normalize the data with mean and std</li>
 <li><strong>mean</strong> (<em>float</em>) – if normalize is enabled, the mean to normalize to</li>
 <li><strong>std</strong> (<em>float</em>) – if normalize is enabled, the deviation to normalize to</li>
+<li><strong>data_min</strong> (<em>float</em>) – min clip value prior to taking the log.</li>
 </ul>
 </td>
 </tr>
-<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body"><p class="first"><dl class="docutils">
-<dt>np.array of audio features with shape=[num_time_steps,</dt>
-<dd><p class="first last">num_features].</p>
-</dd>
-</dl>
-</p>
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body"><p class="first">np.array of audio features with shape=[num_time_steps,
+num_features].</p>
 </td>
 </tr>
 <tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body"><p class="first last">np.array</p>
@@ -444,7 +501,7 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 
 <dl class="function">
 <dt id="data.text2speech.speech_utils.get_speech_features_from_file">
-<code class="descclassname">data.text2speech.speech_utils.</code><code class="descname">get_speech_features_from_file</code><span class="sig-paren">(</span><em>filename</em>, <em>num_features</em>, <em>features_type='magnitude'</em>, <em>window_size=1024</em>, <em>window_stride=256</em>, <em>mag_power=2</em>, <em>feature_normalize=False</em>, <em>mean=0.0</em>, <em>std=1.0</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/speech_utils.html#get_speech_features_from_file"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.speech_utils.get_speech_features_from_file" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">data.text2speech.speech_utils.</code><code class="descname">get_speech_features_from_file</code><span class="sig-paren">(</span><em>filename</em>, <em>num_features</em>, <em>features_type='magnitude'</em>, <em>n_fft=1024</em>, <em>hop_length=None</em>, <em>mag_power=2</em>, <em>feature_normalize=False</em>, <em>mean=0.0</em>, <em>std=1.0</em>, <em>trim=False</em>, <em>data_min=1e-05</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/speech_utils.html#get_speech_features_from_file"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.speech_utils.get_speech_features_from_file" title="Permalink to this definition">¶</a></dt>
 <dd><p>Helper function to retrieve spectrograms from wav files</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
@@ -454,8 +511,8 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <li><strong>filename</strong> (<em>string</em>) – WAVE filename.</li>
 <li><strong>num_features</strong> (<em>int</em>) – number of speech features in frequency domain.</li>
 <li><strong>features_type</strong> (<em>string</em>) – ‘magnitude’ or ‘mel’.</li>
-<li><strong>window_size</strong> (<em>int</em>) – size of analysis window in samples.</li>
-<li><strong>window_stride</strong> (<em>int</em>) – stride of analysis window in samples.</li>
+<li><strong>n_fft</strong> (<em>int</em>) – size of analysis window in samples.</li>
+<li><strong>hop_length</strong> (<em>int</em>) – stride of analysis window in samples.</li>
 <li><strong>mag_power</strong> (<em>int</em>) – power to raise magnitude spectrograms (prior to dot product
 with mel basis)
 1 for energy spectrograms
@@ -463,15 +520,13 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <li><strong>feature_normalize</strong> (<em>bool</em>) – whether to normalize the data with mean and std</li>
 <li><strong>mean</strong> (<em>float</em>) – if normalize is enabled, the mean to normalize to</li>
 <li><strong>std</strong> (<em>float</em>) – if normalize is enabled, the deviation to normalize to</li>
+<li><strong>trim</strong> (<em>bool</em>) – Whether to trim silence via librosa or not</li>
+<li><strong>data_min</strong> (<em>float</em>) – min clip value prior to taking the log.</li>
 </ul>
 </td>
 </tr>
-<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body"><p class="first"><dl class="docutils">
-<dt>np.array of audio features with shape=[num_time_steps,</dt>
-<dd><p class="first last">num_features].</p>
-</dd>
-</dl>
-</p>
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body"><p class="first">np.array of audio features with shape=[num_time_steps,
+num_features].</p>
 </td>
 </tr>
 <tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body"><p class="first last">np.array</p>
@@ -483,8 +538,9 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 
 <dl class="function">
 <dt id="data.text2speech.speech_utils.inverse_mel">
-<code class="descclassname">data.text2speech.speech_utils.</code><code class="descname">inverse_mel</code><span class="sig-paren">(</span><em>log_mel_spec</em>, <em>fs=22050</em>, <em>n_fft=1024</em>, <em>n_mels=80</em>, <em>power=2.0</em>, <em>feature_normalize=False</em>, <em>mean=0</em>, <em>std=1</em>, <em>mel_basis=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/speech_utils.html#inverse_mel"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.speech_utils.inverse_mel" title="Permalink to this definition">¶</a></dt>
-<dd><p>Very hacky method to reconstruct mag spec from mel</p>
+<code class="descclassname">data.text2speech.speech_utils.</code><code class="descname">inverse_mel</code><span class="sig-paren">(</span><em>log_mel_spec</em>, <em>fs=22050</em>, <em>n_fft=1024</em>, <em>n_mels=80</em>, <em>power=2.0</em>, <em>feature_normalize=False</em>, <em>mean=0</em>, <em>std=1</em>, <em>mel_basis=None</em>, <em>htk=True</em>, <em>norm=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2speech/speech_utils.html#inverse_mel"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2speech.speech_utils.inverse_mel" title="Permalink to this definition">¶</a></dt>
+<dd><p>Reconstructs magnitude spectrogram from a mel spectrogram by multiplying it
+with the transposed mel basis.</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
 <col class="field-body" />
@@ -501,6 +557,8 @@ <h2>text2speech<a class="headerlink" href="#id1" title="Permalink to this headli
 <li><strong>std</strong> (<em>float</em>) – normalization param of mel spec</li>
 <li><strong>mel_basis</strong> (<em>np.array</em>) – optional pre-computed mel basis to save computational
 time if passed. If not passed, it will call librosa to construct one</li>
+<li><strong>htk</strong> (<em>bool</em>) – whther to compute the mel spec with the htk or slaney algorithm</li>
+<li><strong>norm</strong> – Should be None for htk, and 1 for slaney</li>
 </ul>
 </td>
 </tr>
diff --git a/docs/html/api-docs/data.text2text.html b/docs/html/api-docs/data.text2text.html
index e85814518..5b88fee88 100644
--- a/docs/html/api-docs/data.text2text.html
+++ b/docs/html/api-docs/data.text2text.html
@@ -358,6 +358,32 @@ <h2>text2text<a class="headerlink" href="#id1" title="Permalink to this headline
 <dd><p>Here all TensorFlow graph construction should happen.</p>
 </dd></dl>
 
+<dl class="method">
+<dt id="data.text2text.text2text.ParallelTextDataLayer.create_feed_dict">
+<code class="descname">create_feed_dict</code><span class="sig-paren">(</span><em>model_in</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2text/text2text.html#ParallelTextDataLayer.create_feed_dict"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2text.text2text.ParallelTextDataLayer.create_feed_dict" title="Permalink to this definition">¶</a></dt>
+<dd><p>Creates the feed dict for interactive infer</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>model_in</strong> (<em>str</em>) – the string to be translated. Should be in bpe format.</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body">Dictionary with values for the placeholders.</td>
+</tr>
+<tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body">feed_dict (dict)</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+<dl class="method">
+<dt id="data.text2text.text2text.ParallelTextDataLayer.create_interactive_placeholders">
+<code class="descname">create_interactive_placeholders</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2text/text2text.html#ParallelTextDataLayer.create_interactive_placeholders"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2text.text2text.ParallelTextDataLayer.create_interactive_placeholders" title="Permalink to this definition">¶</a></dt>
+<dd><p>A function that must be defined for data layers that support interactive
+infer. This function is intended to create placeholders that will be passed
+to self._input_tensors that will be passed to the model.</p>
+</dd></dl>
+
 <dl class="staticmethod">
 <dt id="data.text2text.text2text.ParallelTextDataLayer.get_optional_params">
 <em class="property">static </em><code class="descname">get_optional_params</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/data/text2text/text2text.html#ParallelTextDataLayer.get_optional_params"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#data.text2text.text2text.ParallelTextDataLayer.get_optional_params" title="Permalink to this definition">¶</a></dt>
diff --git a/docs/html/api-docs/decoders.html b/docs/html/api-docs/decoders.html
index 2905f30a8..14162e6c2 100644
--- a/docs/html/api-docs/decoders.html
+++ b/docs/html/api-docs/decoders.html
@@ -386,16 +386,14 @@
 output text generation. If False, other config parameters are not used.</li>
 <li><strong>decoder_library_path</strong> (string) — path to the ctc decoder with
 language model library.</li>
-<li><strong>lm_binary_path</strong> (string) — path to the language model file.</li>
-<li><strong>lm_trie_path</strong> (string) — path to the language model trie file.</li>
+<li><strong>lm_path</strong> (string) — path to the language model file.</li>
+<li><strong>trie_path</strong> (string) — path to the prefix trie file.</li>
 <li><strong>alphabet_config_path</strong> (string) — path to the alphabet file.</li>
 <li><strong>beam_width</strong> (int) — beam width for beam search.</li>
-<li><strong>lm_weight</strong> (float) — weight that is assigned to language model
+<li><strong>alpha</strong> (float) — weight that is assigned to language model
 probabilities.</li>
-<li><strong>word_count_weight</strong> (float) — weight that is assigned to the
+<li><strong>beta</strong> (float) — weight that is assigned to the
 word count.</li>
-<li><strong>valid_word_count_weight</strong> (float) — weight that is assigned to the
-valid word count, i.e. words that exist in language model dictionary.</li>
 </ul>
 </dd></dl>
 
@@ -1057,7 +1055,8 @@
 use, should be one of ‘bahdanau’, ‘location’, or None.
 Use of ‘location’-sensitive attention is strongly recommended.</p>
 </li>
-<li><p class="first"><strong>bahdanau_normalize</strong> (bool) —  Defaults to False.</p>
+<li><p class="first"><strong>bahdanau_normalize</strong> (bool) — Whether to enable weight norm on the
+attention parameters. Defaults to False.</p>
 </li>
 <li><p class="first"><strong>decoder_cell_units</strong> (int) — dimension of decoder RNN cells.</p>
 </li>
@@ -1130,12 +1129,16 @@
 <li><p class="first"><strong>postnet_keep_dropout_prob</strong> (float) — keep probability for dropout in
 the postnet conv layers. Default to 0.5.</p>
 </li>
-<li><p class="first"><strong>mask_decoder_sequence</strong> (bool) — Defaults to True</p>
+<li><p class="first"><strong>mask_decoder_sequence</strong> (bool) — Defaults to True.</p>
 </li>
 <li><p class="first"><strong>attention_bias</strong> (bool) — Wether to use a bias term when calculating
 the attention. Only works for “location” attention. Defaults to False.</p>
 </li>
-<li><p class="first"><strong>zoneout_prob</strong> (float) — zoneout probability. Defaults to 0.1</p>
+<li><p class="first"><strong>zoneout_prob</strong> (float) — zoneout probability for rnn layers.
+Defaults to 0.</p>
+</li>
+<li><p class="first"><strong>dropout_prob</strong> (float) — dropout probability for rnn layers.
+Defaults to 0.1</p>
 </li>
 <li><p class="first"><strong>parallel_iterations</strong> (int) — Number of parallel_iterations for
 tf.while loop inside dynamic_decode. Defaults to 32.</p>
@@ -1158,10 +1161,11 @@
 <col class="field-name" />
 <col class="field-body" />
 <tbody valign="top">
-<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>input_dict</strong> (<em>dict</em>) – <p>Python dictionary with inputs to decoder. Must define:</p>
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>input_dict</strong> (<em>dict</em>) – <p>Python dictionary with inputs to decoder. Must define:
+* src_inputs - decoder input Tensor of shape [batch_size, time, dim]</p>
+<blockquote>
+<div>or [time, batch_size, dim]</div></blockquote>
 <ul class="simple">
-<li>src_inputs - decoder input Tensor of shape [batch_size, time, dim]
-or [time, batch_size, dim]</li>
 <li>src_lengths - decoder input lengths Tensor of shape [batch_size]</li>
 <li>tgt_inputs - Only during training. labels Tensor of the
 shape [batch_size, time, num_features] or
@@ -1173,12 +1177,10 @@
 </ul>
 </td>
 </tr>
-<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body"><dl class="docutils">
-<dt>A python dictionary containing:</dt>
-<dd><ul class="first last simple">
-<li><dl class="first docutils">
-<dt>outputs - array containing:</dt>
-<dd><ul class="first last">
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body">A python dictionary containing:<blockquote>
+<div><ul>
+<li>outputs - array containing:<blockquote>
+<div><ul class="simple">
 <li>decoder_output - tensor of shape [batch_size, time,
 num_features] or [time, batch_size, num_features]. Spectrogram
 representation learned by the decoder rnn</li>
@@ -1192,15 +1194,13 @@
 or [time, batch_size, 1]. The stop token predictions</li>
 <li>final_sequence_lengths - tensor of shape [batch_size]</li>
 </ul>
-</dd>
-</dl>
+</div></blockquote>
 </li>
 <li>stop_token_predictions - tensor of shape [batch_size, time, 1]
 or [time, batch_size, 1]. The stop token predictions for use inside
 the loss function.</li>
 </ul>
-</dd>
-</dl>
+</div></blockquote>
 </td>
 </tr>
 <tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body">dict</td>
diff --git a/docs/html/api-docs/encoders.html b/docs/html/api-docs/encoders.html
index d1865d17d..91e55c2a5 100644
--- a/docs/html/api-docs/encoders.html
+++ b/docs/html/api-docs/encoders.html
@@ -1648,7 +1648,7 @@
 <p>See parent class for arguments description.</p>
 <p>Config parameters:</p>
 <ul>
-<li><p class="first"><strong>dropout_keep_prop</strong> (float) — keep probability for dropout.</p>
+<li><p class="first"><strong>dropout_keep_prob</strong> (float) — keep probability for dropout.</p>
 </li>
 <li><p class="first"><strong>src_emb_size</strong> (int) — dimensionality of character embedding.</p>
 </li>
@@ -1710,27 +1710,23 @@
 <tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>input_dict</strong> (<em>dict</em>) – <p>dictionary with inputs.
 Must define:</p>
 <blockquote>
-<div><dl class="docutils">
-<dt>source_tensors - array containing [</dt>
-<dd><ul class="first last simple">
+<div>source_tensors - array containing [<blockquote>
+<div><ul class="simple">
 <li>source_sequence: tensor of shape [batch_size, sequence length]</li>
 <li>src_length: tensor of shape [batch_size]</li>
 </ul>
-</dd>
-</dl>
+</div></blockquote>
 <p>]</p>
 </div></blockquote>
 </td>
 </tr>
-<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body"><dl class="docutils">
-<dt>A python dictionary containing:</dt>
-<dd><ul class="first last simple">
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body">A python dictionary containing:<blockquote>
+<div><ul class="simple">
 <li>outputs - tensor containing the encoded text to be passed to the
 attention layer</li>
 <li>src_length - the length of the encoded text</li>
 </ul>
-</dd>
-</dl>
+</div></blockquote>
 </td>
 </tr>
 <tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body">dict</td>
diff --git a/docs/html/api-docs/losses.html b/docs/html/api-docs/losses.html
index a616089f0..ad56ba14d 100644
--- a/docs/html/api-docs/losses.html
+++ b/docs/html/api-docs/losses.html
@@ -416,6 +416,104 @@
 </div>
 <div class="section" id="module-losses.sequence_loss">
 <span id="sequence-loss"></span><h2>sequence_loss<a class="headerlink" href="#module-losses.sequence_loss" title="Permalink to this headline">¶</a></h2>
+<dl class="class">
+<dt id="losses.sequence_loss.BasicSampledSequenceLoss">
+<em class="property">class </em><code class="descclassname">losses.sequence_loss.</code><code class="descname">BasicSampledSequenceLoss</code><span class="sig-paren">(</span><em>params</em>, <em>model</em>, <em>name='basic_sampled_sequence_loss'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/losses/sequence_loss.html#BasicSampledSequenceLoss"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#losses.sequence_loss.BasicSampledSequenceLoss" title="Permalink to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#losses.loss.Loss" title="losses.loss.Loss"><code class="xref py py-class docutils literal notranslate"><span class="pre">losses.loss.Loss</span></code></a></p>
+<p>Basic sequence-to-sequence loss. This one does not use one-hot encodings</p>
+<dl class="method">
+<dt id="losses.sequence_loss.BasicSampledSequenceLoss.__init__">
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>params</em>, <em>model</em>, <em>name='basic_sampled_sequence_loss'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/losses/sequence_loss.html#BasicSampledSequenceLoss.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#losses.sequence_loss.BasicSampledSequenceLoss.__init__" title="Permalink to this definition">¶</a></dt>
+<dd><p>Constructor.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>params</strong> (<em>dict</em>) – <p>dictionary with loss parameters.
+Should contain the following:
+* tgt_vocab_size: Target vocabulary size
+* batch_size_per_gpu: Size of the per-worker batch
+* offset_target_by_one: (default: True). Keep it true for
+auto-regressive models
+* average_across_timestep: (default: False). If True, will average</p>
+<blockquote>
+<div>loss across timesteps, else it will sum across timesteps</div></blockquote>
+<ul class="simple">
+<li>do_mask: (default: True) whether to mask based on tgt_lengths
+(which is passed as part of loss_input_dict to compute_loss
+and has to be not None then)</li>
+</ul>
+</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+<dl class="method">
+<dt id="losses.sequence_loss.BasicSampledSequenceLoss._compute_loss">
+<code class="descname">_compute_loss</code><span class="sig-paren">(</span><em>input_dict</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/losses/sequence_loss.html#BasicSampledSequenceLoss._compute_loss"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#losses.sequence_loss.BasicSampledSequenceLoss._compute_loss" title="Permalink to this definition">¶</a></dt>
+<dd><p>Computes cross entropy based sequence-to-sequence loss.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>input_dict</strong> (<em>dict</em>) – <dl class="docutils">
+<dt>inputs to compute loss::</dt>
+<dd><dl class="first docutils">
+<dt>{</dt>
+<dd>“logits”: logits tensor of shape [batch_size, T, dim]
+“target_sequence”: tensor of shape [batch_size, T]
+“tgt_lengths”: tensor of shape [batch_size] or None</dd>
+</dl>
+<p class="last">}</p>
+</dd>
+</dl>
+</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body">Singleton loss tensor</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+<dl class="staticmethod">
+<dt id="losses.sequence_loss.BasicSampledSequenceLoss.get_optional_params">
+<em class="property">static </em><code class="descname">get_optional_params</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/losses/sequence_loss.html#BasicSampledSequenceLoss.get_optional_params"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#losses.sequence_loss.BasicSampledSequenceLoss.get_optional_params" title="Permalink to this definition">¶</a></dt>
+<dd><p>Static method with description of optional parameters.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Returns:</th><td class="field-body">Dictionary containing all the parameters that <strong>can</strong> be
+included into the <code class="docutils literal notranslate"><span class="pre">params</span></code> parameter of the
+class <a class="reference internal" href="#losses.sequence_loss.BasicSampledSequenceLoss.__init__" title="losses.sequence_loss.BasicSampledSequenceLoss.__init__"><code class="xref py py-meth docutils literal notranslate"><span class="pre">__init__()</span></code></a> method.</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Return type:</th><td class="field-body">dict</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+<dl class="staticmethod">
+<dt id="losses.sequence_loss.BasicSampledSequenceLoss.get_required_params">
+<em class="property">static </em><code class="descname">get_required_params</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/losses/sequence_loss.html#BasicSampledSequenceLoss.get_required_params"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#losses.sequence_loss.BasicSampledSequenceLoss.get_required_params" title="Permalink to this definition">¶</a></dt>
+<dd><p>Static method with description of required parameters.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Returns:</th><td class="field-body">Dictionary containing all the parameters that <strong>have to</strong> be
+included into the <code class="docutils literal notranslate"><span class="pre">params</span></code> parameter of the
+class <a class="reference internal" href="#losses.sequence_loss.BasicSampledSequenceLoss.__init__" title="losses.sequence_loss.BasicSampledSequenceLoss.__init__"><code class="xref py py-meth docutils literal notranslate"><span class="pre">__init__()</span></code></a> method.</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Return type:</th><td class="field-body">dict</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+</dd></dl>
+
 <dl class="class">
 <dt id="losses.sequence_loss.BasicSequenceLoss">
 <em class="property">class </em><code class="descclassname">losses.sequence_loss.</code><code class="descname">BasicSequenceLoss</code><span class="sig-paren">(</span><em>params</em>, <em>model</em>, <em>name='basic_sequence_loss'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/losses/sequence_loss.html#BasicSequenceLoss"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#losses.sequence_loss.BasicSequenceLoss" title="Permalink to this definition">¶</a></dt>
@@ -663,11 +761,10 @@
 <col class="field-body" />
 <tbody valign="top">
 <tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>input_dict</strong> (<em>dict</em>) – <p>inputs to compute loss. Contains:</p>
-<dl class="docutils">
-<dt>”decoder_output”: dicionary containing:</dt>
-<dd><dl class="first docutils">
-<dt>”outputs”: array containing [</dt>
-<dd><ul class="first last simple">
+<ul>
+<li>”decoder_output”: dicionary containing:<blockquote>
+<div>”outputs”: array containing [<blockquote>
+<div><ul class="simple">
 <li>decoder_predictions: spectrogram predicted by the decoder
 rnn of shape [batch, time, feats]</li>
 <li>post_net_predictions: spectrogram after adding the residual
@@ -675,18 +772,19 @@
 <li>stop_token_predictions: stop_token predictions of shape
 [batch, time, 1]</li>
 </ul>
-</dd>
-</dl>
-<p class="last">]</p>
-</dd>
-<dt>”target_tensors”: array containing [</dt>
-<dd><ul class="first last simple">
+</div></blockquote>
+<p>]</p>
+</div></blockquote>
+</li>
+<li>”target_tensors”: array containing [<blockquote>
+<div><ul class="simple">
 <li>spec: the true spectrogram of shape [batch, time, feats]</li>
 <li>stop_token: the stop_token of shape [batch, time]</li>
 </ul>
-</dd>
-</dl>
+</div></blockquote>
 <p>]</p>
+</li>
+</ul>
 </td>
 </tr>
 <tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body">Singleton loss tensor</td>
diff --git a/docs/html/api-docs/models.html b/docs/html/api-docs/models.html
index 8146556a3..785583e85 100644
--- a/docs/html/api-docs/models.html
+++ b/docs/html/api-docs/models.html
@@ -311,7 +311,7 @@
 <dl class="method">
 <dt id="models.model.Model._build_forward_pass_graph">
 <code class="descname">_build_forward_pass_graph</code><span class="sig-paren">(</span><em>input_tensors</em>, <em>gpu_id=0</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/model.html#Model._build_forward_pass_graph"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.model.Model._build_forward_pass_graph" title="Permalink to this definition">¶</a></dt>
-<dd><p>This method should create the graph of the forward pass of the model.</p>
+<dd><p>Abstract method. Should create the graph of the forward pass of the model.</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
 <col class="field-body" />
@@ -362,6 +362,12 @@
 </table>
 </dd></dl>
 
+<dl class="method">
+<dt id="models.model.Model.build_forward_pass_graph">
+<code class="descname">build_forward_pass_graph</code><span class="sig-paren">(</span><em>input_tensors</em>, <em>gpu_id=0</em>, <em>checkpoint=None</em>, <em>use_trt=False</em>, <em>precision='FP32'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/model.html#Model.build_forward_pass_graph"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.model.Model.build_forward_pass_graph" title="Permalink to this definition">¶</a></dt>
+<dd><p>Wrapper around _build_forward_pass_graph with option of using TF-TRT</p>
+</dd></dl>
+
 <dl class="method">
 <dt id="models.model.Model.clip_last_batch">
 <code class="descname">clip_last_batch</code><span class="sig-paren">(</span><em>last_batch</em>, <em>true_size</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/model.html#Model.clip_last_batch"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.model.Model.clip_last_batch" title="Permalink to this definition">¶</a></dt>
@@ -391,7 +397,7 @@
 
 <dl class="method">
 <dt id="models.model.Model.compile">
-<code class="descname">compile</code><span class="sig-paren">(</span><em>force_var_reuse=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/model.html#Model.compile"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.model.Model.compile" title="Permalink to this definition">¶</a></dt>
+<code class="descname">compile</code><span class="sig-paren">(</span><em>force_var_reuse=False</em>, <em>checkpoint=None</em>, <em>use_trt=False</em>, <em>precision='FP32'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/model.html#Model.compile"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.model.Model.compile" title="Permalink to this definition">¶</a></dt>
 <dd><p>TensorFlow graph is built here.</p>
 </dd></dl>
 
@@ -1572,7 +1578,7 @@
 
 <dl class="function">
 <dt id="models.text2speech.griffin_lim">
-<code class="descclassname">models.text2speech.</code><code class="descname">griffin_lim</code><span class="sig-paren">(</span><em>magnitudes</em>, <em>n_iters=50</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/text2speech.html#griffin_lim"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.text2speech.griffin_lim" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">models.text2speech.</code><code class="descname">griffin_lim</code><span class="sig-paren">(</span><em>magnitudes</em>, <em>n_iters=50</em>, <em>n_fft=1024</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/text2speech.html#griffin_lim"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.text2speech.griffin_lim" title="Permalink to this definition">¶</a></dt>
 <dd><p>Griffin-Lim algorithm to convert magnitude spectrograms to audio signals</p>
 </dd></dl>
 
@@ -1613,7 +1619,7 @@
 
 <dl class="function">
 <dt id="models.text2speech.save_audio">
-<code class="descclassname">models.text2speech.</code><code class="descname">save_audio</code><span class="sig-paren">(</span><em>magnitudes</em>, <em>logdir</em>, <em>step</em>, <em>mode='train'</em>, <em>number=0</em>, <em>save_to_tensorboard=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/text2speech.html#save_audio"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.text2speech.save_audio" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">models.text2speech.</code><code class="descname">save_audio</code><span class="sig-paren">(</span><em>magnitudes</em>, <em>logdir</em>, <em>step</em>, <em>sampling_rate</em>, <em>n_fft=1024</em>, <em>mode='train'</em>, <em>number=0</em>, <em>save_format='tensorboard'</em>, <em>power=1.5</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/models/text2speech.html#save_audio"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#models.text2speech.save_audio" title="Permalink to this definition">¶</a></dt>
 <dd><p>Helper function to create a wav file to be logged to disk or a tf.Summary to
 be logged to tensorboard.</p>
 <table class="docutils field-list" frame="void" rules="none">
@@ -1625,12 +1631,15 @@
 energy spectrogram.</li>
 <li><strong>logdir</strong> (<em>str</em>) – dir to save image file is save_to_tensorboard is disabled.</li>
 <li><strong>step</strong> (<em>int</em>) – current training step</li>
+<li><strong>sampling_rate</strong> (<em>int</em>) – samplng rate in Hz of the audio to be saved.</li>
+<li><strong>n_fft</strong> (<em>int</em>) – number of filters for fft and ifft.</li>
 <li><strong>number</strong> (<em>int</em>) – Current sample number (used if evaluating more than 1 sample</li>
 <li><strong>mode</strong> (<em>str</em>) – Optional string to append to file name eg. train, eval, infer
 from a batch)</li>
-<li><strong>save_to_tensorboard</strong> (<em>bool</em>) – If False, the created file is saved to the
-logdir as a wav file. If True, the function returns a tf.Summary object
-containing the wav file and will be logged to the current tensorboard file.</li>
+<li><strong>save_format</strong> – save_audio can either return the np.array containing the
+generated sound, log the wav file to the disk, or return a tensorboard
+summary object. Each method can be enabled by passing save_format as
+“np.array”, “tensorboard”, or “disk” respectively.</li>
 </ul>
 </td>
 </tr>
diff --git a/docs/html/api-docs/parts.cnns.html b/docs/html/api-docs/parts.cnns.html
index c78702045..54f052a31 100644
--- a/docs/html/api-docs/parts.cnns.html
+++ b/docs/html/api-docs/parts.cnns.html
@@ -188,7 +188,7 @@
 <span id="conv-blocks"></span><h2>conv_blocks<a class="headerlink" href="#module-parts.cnns.conv_blocks" title="Permalink to this headline">¶</a></h2>
 <dl class="function">
 <dt id="parts.cnns.conv_blocks.conv_actv">
-<code class="descclassname">parts.cnns.conv_blocks.</code><code class="descname">conv_actv</code><span class="sig-paren">(</span><em>layer_type</em>, <em>name</em>, <em>inputs</em>, <em>filters</em>, <em>kernel_size</em>, <em>activation_fn</em>, <em>strides</em>, <em>padding</em>, <em>regularizer</em>, <em>training</em>, <em>data_format</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/cnns/conv_blocks.html#conv_actv"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.cnns.conv_blocks.conv_actv" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">parts.cnns.conv_blocks.</code><code class="descname">conv_actv</code><span class="sig-paren">(</span><em>layer_type</em>, <em>name</em>, <em>inputs</em>, <em>filters</em>, <em>kernel_size</em>, <em>activation_fn</em>, <em>strides</em>, <em>padding</em>, <em>regularizer</em>, <em>training</em>, <em>data_format</em>, <em>dilation=1</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/cnns/conv_blocks.html#conv_actv"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.cnns.conv_blocks.conv_actv" title="Permalink to this definition">¶</a></dt>
 <dd><p>Helper function that applies convolution and activation.
 :param layer_type: the following types are supported</p>
 <blockquote>
@@ -197,9 +197,26 @@
 
 <dl class="function">
 <dt id="parts.cnns.conv_blocks.conv_bn_actv">
-<code class="descclassname">parts.cnns.conv_blocks.</code><code class="descname">conv_bn_actv</code><span class="sig-paren">(</span><em>layer_type</em>, <em>name</em>, <em>inputs</em>, <em>filters</em>, <em>kernel_size</em>, <em>activation_fn</em>, <em>strides</em>, <em>padding</em>, <em>regularizer</em>, <em>training</em>, <em>data_format</em>, <em>bn_momentum</em>, <em>bn_epsilon</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/cnns/conv_blocks.html#conv_bn_actv"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.cnns.conv_blocks.conv_bn_actv" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">parts.cnns.conv_blocks.</code><code class="descname">conv_bn_actv</code><span class="sig-paren">(</span><em>layer_type</em>, <em>name</em>, <em>inputs</em>, <em>filters</em>, <em>kernel_size</em>, <em>activation_fn</em>, <em>strides</em>, <em>padding</em>, <em>regularizer</em>, <em>training</em>, <em>data_format</em>, <em>bn_momentum</em>, <em>bn_epsilon</em>, <em>dilation=1</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/cnns/conv_blocks.html#conv_bn_actv"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.cnns.conv_blocks.conv_bn_actv" title="Permalink to this definition">¶</a></dt>
 <dd><p>Helper function that applies convolution, batch norm and activation.
-Accepts inputs in ‘channels_last’ format only.
+:param layer_type: the following types are supported</p>
+<blockquote>
+<div>‘conv1d’, ‘conv2d’</div></blockquote>
+</dd></dl>
+
+<dl class="function">
+<dt id="parts.cnns.conv_blocks.conv_in_actv">
+<code class="descclassname">parts.cnns.conv_blocks.</code><code class="descname">conv_in_actv</code><span class="sig-paren">(</span><em>layer_type</em>, <em>name</em>, <em>inputs</em>, <em>filters</em>, <em>kernel_size</em>, <em>activation_fn</em>, <em>strides</em>, <em>padding</em>, <em>regularizer</em>, <em>training</em>, <em>data_format</em>, <em>dilation=1</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/cnns/conv_blocks.html#conv_in_actv"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.cnns.conv_blocks.conv_in_actv" title="Permalink to this definition">¶</a></dt>
+<dd><p>Helper function that applies convolution, instance norm and activation.
+:param layer_type: the following types are supported</p>
+<blockquote>
+<div>‘conv1d’, ‘conv2d’</div></blockquote>
+</dd></dl>
+
+<dl class="function">
+<dt id="parts.cnns.conv_blocks.conv_ln_actv">
+<code class="descclassname">parts.cnns.conv_blocks.</code><code class="descname">conv_ln_actv</code><span class="sig-paren">(</span><em>layer_type</em>, <em>name</em>, <em>inputs</em>, <em>filters</em>, <em>kernel_size</em>, <em>activation_fn</em>, <em>strides</em>, <em>padding</em>, <em>regularizer</em>, <em>training</em>, <em>data_format</em>, <em>dilation=1</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/cnns/conv_blocks.html#conv_ln_actv"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.cnns.conv_blocks.conv_ln_actv" title="Permalink to this definition">¶</a></dt>
+<dd><p>Helper function that applies convolution, layer norm and activation.
 :param layer_type: the following types are supported</p>
 <blockquote>
 <div>‘conv1d’, ‘conv2d’</div></blockquote>
diff --git a/docs/html/api-docs/parts.convs2s.html b/docs/html/api-docs/parts.convs2s.html
index 22276b9be..9060504ce 100644
--- a/docs/html/api-docs/parts.convs2s.html
+++ b/docs/html/api-docs/parts.convs2s.html
@@ -192,12 +192,12 @@
 Inspired from <a class="reference external" href="https://github.com/tobyyouup/conv_seq2seq">https://github.com/tobyyouup/conv_seq2seq</a></p>
 <dl class="class">
 <dt id="parts.convs2s.attention_wn_layer.AttentionLayerNormalized">
-<em class="property">class </em><code class="descclassname">parts.convs2s.attention_wn_layer.</code><code class="descname">AttentionLayerNormalized</code><span class="sig-paren">(</span><em>in_dim</em>, <em>embed_size</em>, <em>layer_id</em>, <em>add_res</em>, <em>mode</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/attention_wn_layer.html#AttentionLayerNormalized"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.attention_wn_layer.AttentionLayerNormalized" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">parts.convs2s.attention_wn_layer.</code><code class="descname">AttentionLayerNormalized</code><span class="sig-paren">(</span><em>in_dim</em>, <em>embed_size</em>, <em>layer_id</em>, <em>add_res</em>, <em>mode</em>, <em>scaling_factor=0.7071067811865476</em>, <em>normalization_type='weight_norm'</em>, <em>regularizer=None</em>, <em>init_var=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/attention_wn_layer.html#AttentionLayerNormalized"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.attention_wn_layer.AttentionLayerNormalized" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">tensorflow.python.layers.base.Layer</span></code></p>
 <p>Attention layer for convs2s with weight normalization</p>
 <dl class="method">
 <dt id="parts.convs2s.attention_wn_layer.AttentionLayerNormalized.__init__">
-<code class="descname">__init__</code><span class="sig-paren">(</span><em>in_dim</em>, <em>embed_size</em>, <em>layer_id</em>, <em>add_res</em>, <em>mode</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/attention_wn_layer.html#AttentionLayerNormalized.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.attention_wn_layer.AttentionLayerNormalized.__init__" title="Permalink to this definition">¶</a></dt>
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>in_dim</em>, <em>embed_size</em>, <em>layer_id</em>, <em>add_res</em>, <em>mode</em>, <em>scaling_factor=0.7071067811865476</em>, <em>normalization_type='weight_norm'</em>, <em>regularizer=None</em>, <em>init_var=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/attention_wn_layer.html#AttentionLayerNormalized.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.attention_wn_layer.AttentionLayerNormalized.__init__" title="Permalink to this definition">¶</a></dt>
 <dd><p>initializes the attention layer.
 It uses weight normalization for linear projections
 (Salimans &amp; Kingma, 2016)  w = g * v/2-norm(v)</p>
@@ -255,12 +255,12 @@
 Inspired from <a class="reference external" href="https://github.com/tobyyouup/conv_seq2seq">https://github.com/tobyyouup/conv_seq2seq</a></p>
 <dl class="class">
 <dt id="parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized">
-<em class="property">class </em><code class="descclassname">parts.convs2s.conv_wn_layer.</code><code class="descname">Conv1DNetworkNormalized</code><span class="sig-paren">(</span><em>in_dim</em>, <em>out_dim</em>, <em>kernel_width</em>, <em>mode</em>, <em>layer_id</em>, <em>hidden_dropout</em>, <em>conv_padding</em>, <em>decode_padding</em>, <em>activation=&lt;function gated_linear_units&gt;</em>, <em>normalization_type='weight_norm'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/conv_wn_layer.html#Conv1DNetworkNormalized"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">parts.convs2s.conv_wn_layer.</code><code class="descname">Conv1DNetworkNormalized</code><span class="sig-paren">(</span><em>in_dim</em>, <em>out_dim</em>, <em>kernel_width</em>, <em>mode</em>, <em>layer_id</em>, <em>hidden_dropout</em>, <em>conv_padding</em>, <em>decode_padding</em>, <em>activation=&lt;function gated_linear_units&gt;</em>, <em>normalization_type='weight_norm'</em>, <em>regularizer=None</em>, <em>init_var=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/conv_wn_layer.html#Conv1DNetworkNormalized"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">tensorflow.python.layers.base.Layer</span></code></p>
 <p>1D convolutional layer with weight normalization</p>
 <dl class="method">
 <dt id="parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized.__init__">
-<code class="descname">__init__</code><span class="sig-paren">(</span><em>in_dim</em>, <em>out_dim</em>, <em>kernel_width</em>, <em>mode</em>, <em>layer_id</em>, <em>hidden_dropout</em>, <em>conv_padding</em>, <em>decode_padding</em>, <em>activation=&lt;function gated_linear_units&gt;</em>, <em>normalization_type='weight_norm'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/conv_wn_layer.html#Conv1DNetworkNormalized.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized.__init__" title="Permalink to this definition">¶</a></dt>
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>in_dim</em>, <em>out_dim</em>, <em>kernel_width</em>, <em>mode</em>, <em>layer_id</em>, <em>hidden_dropout</em>, <em>conv_padding</em>, <em>decode_padding</em>, <em>activation=&lt;function gated_linear_units&gt;</em>, <em>normalization_type='weight_norm'</em>, <em>regularizer=None</em>, <em>init_var=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/conv_wn_layer.html#Conv1DNetworkNormalized.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized.__init__" title="Permalink to this definition">¶</a></dt>
 <dd><p>initializes the 1D convolution layer.
 It uses weight normalization (Salimans &amp; Kingma, 2016)  w = g * v/2-norm(v)</p>
 <table class="docutils field-list" frame="void" rules="none">
@@ -282,7 +282,9 @@
 <li><strong>activation</strong> – the activation function applies after the convolution</li>
 <li><strong>normalization_type</strong> – str specifies the normalization used for the layer.
 “weight_norm” for weight normalization or
-“batch_norm” for batch normalization</li>
+“batch_norm” for batch normalization or
+“layer_norm” for layer normalization</li>
+<li><strong>regularizer</strong> – the regularizer for the batch normalization</li>
 </ul>
 </td>
 </tr>
@@ -315,12 +317,12 @@
 Inspired from <a class="reference external" href="https://github.com/tobyyouup/conv_seq2seq">https://github.com/tobyyouup/conv_seq2seq</a></p>
 <dl class="class">
 <dt id="parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized">
-<em class="property">class </em><code class="descclassname">parts.convs2s.ffn_wn_layer.</code><code class="descname">FeedFowardNetworkNormalized</code><span class="sig-paren">(</span><em>in_dim</em>, <em>out_dim</em>, <em>dropout</em>, <em>var_scope_name</em>, <em>mode</em>, <em>normalization_type='weight_norm'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/ffn_wn_layer.html#FeedFowardNetworkNormalized"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">parts.convs2s.ffn_wn_layer.</code><code class="descname">FeedFowardNetworkNormalized</code><span class="sig-paren">(</span><em>in_dim</em>, <em>out_dim</em>, <em>dropout</em>, <em>var_scope_name</em>, <em>mode</em>, <em>normalization_type='weight_norm'</em>, <em>regularizer=None</em>, <em>init_var=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/ffn_wn_layer.html#FeedFowardNetworkNormalized"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">tensorflow.python.layers.base.Layer</span></code></p>
 <p>Fully connected feedforward network with weight normalization</p>
 <dl class="method">
 <dt id="parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized.__init__">
-<code class="descname">__init__</code><span class="sig-paren">(</span><em>in_dim</em>, <em>out_dim</em>, <em>dropout</em>, <em>var_scope_name</em>, <em>mode</em>, <em>normalization_type='weight_norm'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/ffn_wn_layer.html#FeedFowardNetworkNormalized.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized.__init__" title="Permalink to this definition">¶</a></dt>
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>in_dim</em>, <em>out_dim</em>, <em>dropout</em>, <em>var_scope_name</em>, <em>mode</em>, <em>normalization_type='weight_norm'</em>, <em>regularizer=None</em>, <em>init_var=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/convs2s/ffn_wn_layer.html#FeedFowardNetworkNormalized.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized.__init__" title="Permalink to this definition">¶</a></dt>
 <dd><p>initializes the linear layer.
 This layer projects from in_dim-dimenstional space to out_dim-dimentional space.
 It uses weight normalization (Salimans &amp; Kingma, 2016)  w = g * v/2-norm(v)</p>
diff --git a/docs/html/api-docs/parts.rnns.html b/docs/html/api-docs/parts.rnns.html
index 7dc1e8cd4..7998d41ac 100644
--- a/docs/html/api-docs/parts.rnns.html
+++ b/docs/html/api-docs/parts.rnns.html
@@ -1591,7 +1591,7 @@
 <span id="utils"></span><h2>utils<a class="headerlink" href="#module-parts.rnns.utils" title="Permalink to this headline">¶</a></h2>
 <dl class="function">
 <dt id="parts.rnns.utils.single_cell">
-<code class="descclassname">parts.rnns.utils.</code><code class="descname">single_cell</code><span class="sig-paren">(</span><em>cell_class</em>, <em>cell_params</em>, <em>dp_input_keep_prob=1.0</em>, <em>dp_output_keep_prob=1.0</em>, <em>zoneout_prob=0.0</em>, <em>training=True</em>, <em>residual_connections=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/rnns/utils.html#single_cell"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.rnns.utils.single_cell" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">parts.rnns.utils.</code><code class="descname">single_cell</code><span class="sig-paren">(</span><em>cell_class</em>, <em>cell_params</em>, <em>dp_input_keep_prob=1.0</em>, <em>dp_output_keep_prob=1.0</em>, <em>recurrent_keep_prob=1.0</em>, <em>input_weight_keep_prob=1.0</em>, <em>recurrent_weight_keep_prob=1.0</em>, <em>weight_variational=False</em>, <em>dropout_seed=None</em>, <em>zoneout_prob=0.0</em>, <em>training=True</em>, <em>residual_connections=False</em>, <em>awd_initializer=False</em>, <em>variational_recurrent=False</em>, <em>dtype=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/rnns/utils.html#single_cell"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.rnns.utils.single_cell" title="Permalink to this definition">¶</a></dt>
 <dd><p>Creates an instance of the rnn cell.
 Such cell describes one step one layer and can include residual connection
 and/or dropout</p>
diff --git a/docs/html/api-docs/parts.tacotron.html b/docs/html/api-docs/parts.tacotron.html
index 91a8485cb..9baee20cb 100644
--- a/docs/html/api-docs/parts.tacotron.html
+++ b/docs/html/api-docs/parts.tacotron.html
@@ -197,12 +197,12 @@
 
 <dl class="class">
 <dt id="parts.tacotron.tacotron_decoder.TacotronDecoder">
-<em class="property">class </em><code class="descclassname">parts.tacotron.tacotron_decoder.</code><code class="descname">TacotronDecoder</code><span class="sig-paren">(</span><em>decoder_cell</em>, <em>helper</em>, <em>initial_decoder_state</em>, <em>spec_layer</em>, <em>stop_token_layer</em>, <em>prenet=None</em>, <em>dtype=tf.float32</em>, <em>train=True</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/tacotron/tacotron_decoder.html#TacotronDecoder"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.tacotron.tacotron_decoder.TacotronDecoder" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">parts.tacotron.tacotron_decoder.</code><code class="descname">TacotronDecoder</code><span class="sig-paren">(</span><em>decoder_cell</em>, <em>helper</em>, <em>initial_decoder_state</em>, <em>attention_type</em>, <em>spec_layer</em>, <em>stop_token_layer</em>, <em>prenet=None</em>, <em>dtype=tf.float32</em>, <em>train=True</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/tacotron/tacotron_decoder.html#TacotronDecoder"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.tacotron.tacotron_decoder.TacotronDecoder" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">tensorflow.contrib.seq2seq.python.ops.decoder.Decoder</span></code></p>
 <p>Basic sampling decoder.</p>
 <dl class="method">
 <dt id="parts.tacotron.tacotron_decoder.TacotronDecoder.__init__">
-<code class="descname">__init__</code><span class="sig-paren">(</span><em>decoder_cell</em>, <em>helper</em>, <em>initial_decoder_state</em>, <em>spec_layer</em>, <em>stop_token_layer</em>, <em>prenet=None</em>, <em>dtype=tf.float32</em>, <em>train=True</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/tacotron/tacotron_decoder.html#TacotronDecoder.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.tacotron.tacotron_decoder.TacotronDecoder.__init__" title="Permalink to this definition">¶</a></dt>
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>decoder_cell</em>, <em>helper</em>, <em>initial_decoder_state</em>, <em>attention_type</em>, <em>spec_layer</em>, <em>stop_token_layer</em>, <em>prenet=None</em>, <em>dtype=tf.float32</em>, <em>train=True</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/tacotron/tacotron_decoder.html#TacotronDecoder.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.tacotron.tacotron_decoder.TacotronDecoder.__init__" title="Permalink to this definition">¶</a></dt>
 <dd><p>Initialize TacotronDecoder.</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
@@ -213,6 +213,7 @@
 <li><strong>helper</strong> – A <cite>Helper</cite> instance.</li>
 <li><strong>initial_decoder_state</strong> – A (possibly nested tuple of…) tensors and
 TensorArrays. The initial state of the RNNCell.</li>
+<li><strong>attention_type</strong> – The type of attention used</li>
 <li><strong>stop_token_layer</strong> – An instance of <cite>tf.layers.Layer</cite>, i.e.,
 <cite>tf.layers.Dense</cite>. Stop token layer to apply to the RNN output to
 predict when to stop the decoder</li>
@@ -365,13 +366,13 @@
 
 <dl class="class">
 <dt id="parts.tacotron.tacotron_helper.TacotronTrainingHelper">
-<em class="property">class </em><code class="descclassname">parts.tacotron.tacotron_helper.</code><code class="descname">TacotronTrainingHelper</code><span class="sig-paren">(</span><em>inputs</em>, <em>sequence_length</em>, <em>prenet=None</em>, <em>sampling_prob=0.0</em>, <em>time_major=False</em>, <em>sample_ids_shape=None</em>, <em>sample_ids_dtype=None</em>, <em>model_dtype=tf.float32</em>, <em>mask_decoder_sequence=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/tacotron/tacotron_helper.html#TacotronTrainingHelper"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.tacotron.tacotron_helper.TacotronTrainingHelper" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">parts.tacotron.tacotron_helper.</code><code class="descname">TacotronTrainingHelper</code><span class="sig-paren">(</span><em>inputs</em>, <em>sequence_length</em>, <em>prenet=None</em>, <em>time_major=False</em>, <em>sample_ids_shape=None</em>, <em>sample_ids_dtype=None</em>, <em>model_dtype=tf.float32</em>, <em>mask_decoder_sequence=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/tacotron/tacotron_helper.html#TacotronTrainingHelper"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.tacotron.tacotron_helper.TacotronTrainingHelper" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">tensorflow.contrib.seq2seq.python.ops.helper.Helper</span></code></p>
 <p>Helper funciton for training. Can be used for teacher forcing or scheduled
 sampling</p>
 <dl class="method">
 <dt id="parts.tacotron.tacotron_helper.TacotronTrainingHelper.__init__">
-<code class="descname">__init__</code><span class="sig-paren">(</span><em>inputs</em>, <em>sequence_length</em>, <em>prenet=None</em>, <em>sampling_prob=0.0</em>, <em>time_major=False</em>, <em>sample_ids_shape=None</em>, <em>sample_ids_dtype=None</em>, <em>model_dtype=tf.float32</em>, <em>mask_decoder_sequence=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/tacotron/tacotron_helper.html#TacotronTrainingHelper.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.tacotron.tacotron_helper.TacotronTrainingHelper.__init__" title="Permalink to this definition">¶</a></dt>
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>inputs</em>, <em>sequence_length</em>, <em>prenet=None</em>, <em>time_major=False</em>, <em>sample_ids_shape=None</em>, <em>sample_ids_dtype=None</em>, <em>model_dtype=tf.float32</em>, <em>mask_decoder_sequence=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/tacotron/tacotron_helper.html#TacotronTrainingHelper.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.tacotron.tacotron_helper.TacotronTrainingHelper.__init__" title="Permalink to this definition">¶</a></dt>
 <dd><p>Initializer.</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
diff --git a/docs/html/api-docs/parts.transformer.html b/docs/html/api-docs/parts.transformer.html
index 1cb878392..30c4e7c7e 100644
--- a/docs/html/api-docs/parts.transformer.html
+++ b/docs/html/api-docs/parts.transformer.html
@@ -729,7 +729,7 @@
 <p>Implementation of embedding layer with shared weights.</p>
 <dl class="class">
 <dt id="parts.transformer.embedding_layer.EmbeddingSharedWeights">
-<em class="property">class </em><code class="descclassname">parts.transformer.embedding_layer.</code><code class="descname">EmbeddingSharedWeights</code><span class="sig-paren">(</span><em>vocab_size</em>, <em>hidden_size</em>, <em>pad_vocab_to_eight=False</em>, <em>init_var=None</em>, <em>embed_scale=True</em>, <em>pad_sym=0</em>, <em>mask_paddings=True</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/transformer/embedding_layer.html#EmbeddingSharedWeights"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.transformer.embedding_layer.EmbeddingSharedWeights" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">parts.transformer.embedding_layer.</code><code class="descname">EmbeddingSharedWeights</code><span class="sig-paren">(</span><em>vocab_size</em>, <em>hidden_size</em>, <em>pad_vocab_to_eight=False</em>, <em>init_var=None</em>, <em>embed_scale=True</em>, <em>pad_sym=0</em>, <em>mask_paddings=True</em>, <em>regularizer=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/parts/transformer/embedding_layer.html#EmbeddingSharedWeights"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#parts.transformer.embedding_layer.EmbeddingSharedWeights" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">tensorflow.python.layers.base.Layer</span></code></p>
 <p>Calculates input embeddings and pre-softmax linear with shared weights.</p>
 <dl class="method">
diff --git a/docs/html/api-docs/utils.html b/docs/html/api-docs/utils.html
index 712248d27..906fc19b8 100644
--- a/docs/html/api-docs/utils.html
+++ b/docs/html/api-docs/utils.html
@@ -185,12 +185,12 @@
 
 <dl class="function">
 <dt id="utils.funcs.infer">
-<code class="descclassname">utils.funcs.</code><code class="descname">infer</code><span class="sig-paren">(</span><em>model</em>, <em>checkpoint</em>, <em>output_file</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/funcs.html#infer"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.funcs.infer" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">utils.funcs.</code><code class="descname">infer</code><span class="sig-paren">(</span><em>model</em>, <em>checkpoint</em>, <em>output_file</em>, <em>use_trt=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/funcs.html#infer"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.funcs.infer" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="function">
 <dt id="utils.funcs.restore_and_get_results">
-<code class="descclassname">utils.funcs.</code><code class="descname">restore_and_get_results</code><span class="sig-paren">(</span><em>model</em>, <em>checkpoint</em>, <em>mode</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/funcs.html#restore_and_get_results"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.funcs.restore_and_get_results" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">utils.funcs.</code><code class="descname">restore_and_get_results</code><span class="sig-paren">(</span><em>model</em>, <em>checkpoint</em>, <em>mode</em>, <em>use_trt=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/funcs.html#restore_and_get_results"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.funcs.restore_and_get_results" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="function">
@@ -267,7 +267,7 @@
 
 <dl class="class">
 <dt id="utils.hooks.PrintLossAndTimeHook">
-<em class="property">class </em><code class="descclassname">utils.hooks.</code><code class="descname">PrintLossAndTimeHook</code><span class="sig-paren">(</span><em>every_steps</em>, <em>model</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/hooks.html#PrintLossAndTimeHook"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.hooks.PrintLossAndTimeHook" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">utils.hooks.</code><code class="descname">PrintLossAndTimeHook</code><span class="sig-paren">(</span><em>every_steps</em>, <em>model</em>, <em>print_ppl=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/hooks.html#PrintLossAndTimeHook"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.hooks.PrintLossAndTimeHook" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">tensorflow.python.training.session_run_hook.SessionRunHook</span></code></p>
 <p>Session hook that prints training samples and prediction from time to time</p>
 <dl class="method">
@@ -399,7 +399,7 @@
 
 <dl class="class">
 <dt id="utils.hooks.RunEvaluationHook">
-<em class="property">class </em><code class="descclassname">utils.hooks.</code><code class="descname">RunEvaluationHook</code><span class="sig-paren">(</span><em>every_steps</em>, <em>model</em>, <em>last_step=-1</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/hooks.html#RunEvaluationHook"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.hooks.RunEvaluationHook" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">utils.hooks.</code><code class="descname">RunEvaluationHook</code><span class="sig-paren">(</span><em>every_steps</em>, <em>model</em>, <em>last_step=-1</em>, <em>print_ppl=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/hooks.html#RunEvaluationHook"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.hooks.RunEvaluationHook" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">tensorflow.python.training.session_run_hook.SessionRunHook</span></code></p>
 <p>Session hook that runs evaluation on a validation set</p>
 <dl class="method">
@@ -492,6 +492,36 @@ <h2>utils<a class="headerlink" href="#id1" title="Permalink to this headline">¶
 <code class="descclassname">utils.utils.</code><code class="descname">cast_types</code><span class="sig-paren">(</span><em>input_dict</em>, <em>dtype</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#cast_types"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.cast_types" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
+<dl class="function">
+<dt id="utils.utils.check_logdir">
+<code class="descclassname">utils.utils.</code><code class="descname">check_logdir</code><span class="sig-paren">(</span><em>args</em>, <em>base_config</em>, <em>restore_best_checkpoint=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#check_logdir"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.check_logdir" title="Permalink to this definition">¶</a></dt>
+<dd><p>A helper function that ensures the logdir is setup correctly</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><ul class="first simple">
+<li><strong>args</strong> (<em>dict</em>) – Dictionary as returned from get_base_config()</li>
+<li><strong>base_config</strong> (<em>dict</em>) – Dictionary as returned from get_base_config()</li>
+<li><strong>restore_best_checkpoint</strong> (<em>bool</em>) – If True, will look for ckpt_dir + /best_models</li>
+</ul>
+</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body"><p class="first"><dl class="docutils">
+<dt>Either None if continue-learning is not set and training, or</dt>
+<dd><p class="first last">the name of the checkpoint used to restore the model</p>
+</dd>
+</dl>
+</p>
+</td>
+</tr>
+<tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body"><p class="first last">checkpoint</p>
+</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
 <dl class="function">
 <dt id="utils.utils.check_params">
 <code class="descclassname">utils.utils.</code><code class="descname">check_params</code><span class="sig-paren">(</span><em>config</em>, <em>required_dict</em>, <em>optional_dict</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#check_params"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.check_params" title="Permalink to this definition">¶</a></dt>
@@ -532,6 +562,62 @@ <h2>utils<a class="headerlink" href="#id1" title="Permalink to this headline">¶
 </table>
 </dd></dl>
 
+<dl class="function">
+<dt id="utils.utils.create_logdir">
+<code class="descclassname">utils.utils.</code><code class="descname">create_logdir</code><span class="sig-paren">(</span><em>args</em>, <em>base_config</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#create_logdir"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.create_logdir" title="Permalink to this definition">¶</a></dt>
+<dd><p>A helper function that ensures the logdir and log files are setup corretly.
+Only called in –enable_logs is set.</p>
+<blockquote>
+<div><dl class="docutils">
+<dt>Args:</dt>
+<dd>args (dict): Dictionary as returned from get_base_config()
+base_config (dict): Dictionary as returned from get_base_config()</dd>
+</dl>
+</div></blockquote>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Returns:</th><td class="field-body">Some objects that need to be cleaned up in run.py</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+<dl class="function">
+<dt id="utils.utils.create_model">
+<code class="descclassname">utils.utils.</code><code class="descname">create_model</code><span class="sig-paren">(</span><em>args</em>, <em>base_config</em>, <em>config_module</em>, <em>base_model</em>, <em>hvd</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#create_model"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.create_model" title="Permalink to this definition">¶</a></dt>
+<dd><p>A helpful function that creates the train, eval, and infer models as
+needed.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><ul class="first simple">
+<li><strong>args</strong> (<em>dict</em>) – Dictionary as returned from get_base_config()</li>
+<li><strong>base_config</strong> (<em>dict</em>) – Dictionary as returned from get_base_config()</li>
+<li><strong>config_module</strong> – config_module as returned from get_base_config()</li>
+<li><strong>base_model</strong> (<em>OpenSeq2Seq model</em>) – Dictionary as returned from
+get_base_config()</li>
+<li><strong>hvd</strong> – Either None if Horovod is not enabled, or the Horovod library</li>
+</ul>
+</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Returns:</th><td class="field-body"><p class="first"><dl class="docutils">
+<dt>A compiled model. For the ‘train_eval’ mode, a tuple containing the</dt>
+<dd><p class="first last">(train_model, eval_model) is returned.</p>
+</dd>
+</dl>
+</p>
+</td>
+</tr>
+<tr class="field-odd field"><th class="field-name">Return type:</th><td class="field-body"><p class="first last">model</p>
+</td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
 <dl class="function">
 <dt id="utils.utils.deco_print">
 <code class="descclassname">utils.utils.</code><code class="descname">deco_print</code><span class="sig-paren">(</span><em>line</em>, <em>offset=0</em>, <em>start='*** '</em>, <em>end='\n'</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#deco_print"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.deco_print" title="Permalink to this definition">¶</a></dt>
@@ -547,6 +633,31 @@ <h2>utils<a class="headerlink" href="#id1" title="Permalink to this headline">¶
 <code class="descclassname">utils.utils.</code><code class="descname">get_available_gpus</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#get_available_gpus"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.get_available_gpus" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
+<dl class="function">
+<dt id="utils.utils.get_base_config">
+<code class="descclassname">utils.utils.</code><code class="descname">get_base_config</code><span class="sig-paren">(</span><em>args</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#get_base_config"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.get_base_config" title="Permalink to this definition">¶</a></dt>
+<dd><p>This function parses the command line arguments, reads the config file, and
+gets the base_model from the config.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>args</strong> (<em>str</em>) – The command line arugments</td>
+</tr>
+</tbody>
+</table>
+<dl class="docutils">
+<dt>Returns</dt>
+<dd><p class="first">args (dict): The arguments parsed into a dictionary
+base_config (dict): The config read from the file and ammended with the</p>
+<blockquote>
+<div>command line arguments</div></blockquote>
+<p class="last">base_model (OpenSeq2Seq model): The model specified in the config file
+config_module (dict): The raw config file processed by runpy</p>
+</dd>
+</dl>
+</dd></dl>
+
 <dl class="function">
 <dt id="utils.utils.get_git_diff">
 <code class="descclassname">utils.utils.</code><code class="descname">get_git_diff</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#get_git_diff"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.get_git_diff" title="Permalink to this definition">¶</a></dt>
@@ -557,6 +668,11 @@ <h2>utils<a class="headerlink" href="#id1" title="Permalink to this headline">¶
 <code class="descclassname">utils.utils.</code><code class="descname">get_git_hash</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#get_git_hash"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.get_git_hash" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
+<dl class="function">
+<dt id="utils.utils.get_interactive_infer_results">
+<code class="descclassname">utils.utils.</code><code class="descname">get_interactive_infer_results</code><span class="sig-paren">(</span><em>model</em>, <em>sess</em>, <em>model_in</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#get_interactive_infer_results"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.get_interactive_infer_results" title="Permalink to this definition">¶</a></dt>
+<dd></dd></dl>
+
 <dl class="function">
 <dt id="utils.utils.get_results_for_epoch">
 <code class="descclassname">utils.utils.</code><code class="descname">get_results_for_epoch</code><span class="sig-paren">(</span><em>model</em>, <em>sess</em>, <em>compute_loss</em>, <em>mode</em>, <em>verbose=False</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#get_results_for_epoch"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.get_results_for_epoch" title="Permalink to this definition">¶</a></dt>
@@ -564,7 +680,7 @@ <h2>utils<a class="headerlink" href="#id1" title="Permalink to this headline">¶
 
 <dl class="function">
 <dt id="utils.utils.iterate_data">
-<code class="descclassname">utils.utils.</code><code class="descname">iterate_data</code><span class="sig-paren">(</span><em>model</em>, <em>sess</em>, <em>compute_loss</em>, <em>mode</em>, <em>verbose</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#iterate_data"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.iterate_data" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">utils.utils.</code><code class="descname">iterate_data</code><span class="sig-paren">(</span><em>model</em>, <em>sess</em>, <em>compute_loss</em>, <em>mode</em>, <em>verbose</em>, <em>num_steps=None</em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/utils/utils.html#iterate_data"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#utils.utils.iterate_data" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="function">
diff --git a/docs/html/genindex.html b/docs/html/genindex.html
index ed197356a..f102be9c7 100644
--- a/docs/html/genindex.html
+++ b/docs/html/genindex.html
@@ -232,6 +232,8 @@ <h2 id="_">_</h2>
         <li><a href="api-docs/losses.html#losses.ctc_loss.CTCLoss.__init__">(losses.ctc_loss.CTCLoss method)</a>
 </li>
         <li><a href="api-docs/losses.html#losses.loss.Loss.__init__">(losses.loss.Loss method)</a>
+</li>
+        <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss.__init__">(losses.sequence_loss.BasicSampledSequenceLoss method)</a>
 </li>
         <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSequenceLoss.__init__">(losses.sequence_loss.BasicSequenceLoss method)</a>
 </li>
@@ -312,6 +314,8 @@ <h2 id="_">_</h2>
 
       <ul>
         <li><a href="api-docs/losses.html#losses.loss.Loss._compute_loss">(losses.loss.Loss method)</a>
+</li>
+        <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss._compute_loss">(losses.sequence_loss.BasicSampledSequenceLoss method)</a>
 </li>
         <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSequenceLoss._compute_loss">(losses.sequence_loss.BasicSequenceLoss method)</a>
 </li>
@@ -329,11 +333,11 @@ <h2 id="_">_</h2>
       <li><a href="api-docs/models.html#models.encoder_decoder.EncoderDecoderModel._create_decoder">_create_decoder() (models.encoder_decoder.EncoderDecoderModel method)</a>
 </li>
       <li><a href="api-docs/models.html#models.encoder_decoder.EncoderDecoderModel._create_encoder">_create_encoder() (models.encoder_decoder.EncoderDecoderModel method)</a>
-</li>
-      <li><a href="api-docs/parts.transformer.html#parts.transformer.beam_search.SequenceBeamSearch._create_initial_state">_create_initial_state() (parts.transformer.beam_search.SequenceBeamSearch method)</a>
 </li>
   </ul></td>
   <td style="width: 33%; vertical-align: top;"><ul>
+      <li><a href="api-docs/parts.transformer.html#parts.transformer.beam_search.SequenceBeamSearch._create_initial_state">_create_initial_state() (parts.transformer.beam_search.SequenceBeamSearch method)</a>
+</li>
       <li><a href="api-docs/models.html#models.encoder_decoder.EncoderDecoderModel._create_loss">_create_loss() (models.encoder_decoder.EncoderDecoderModel method)</a>
 </li>
       <li><a href="api-docs/data.text2text.html#data.text2text.t2t._create_min_max_boundaries">_create_min_max_boundaries() (in module data.text2text.t2t)</a>
@@ -389,6 +393,8 @@ <h2 id="_">_</h2>
       <li><a href="api-docs/data.text2text.html#data.text2text.tokenizer._generate_subtokens">_generate_subtokens() (in module data.text2text.tokenizer)</a>
 </li>
       <li><a href="api-docs/data.text2text.html#data.text2text.tokenizer._generate_subtokens_with_target_vocab_size">_generate_subtokens_with_target_vocab_size() (in module data.text2text.tokenizer)</a>
+</li>
+      <li><a href="api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer._get_audio">_get_audio() (data.speech2text.speech2text.Speech2TextDataLayer method)</a>
 </li>
       <li><a href="api-docs/data.text2text.html#data.text2text.t2t._get_example_length">_get_example_length() (in module data.text2text.t2t)</a>
 </li>
@@ -539,6 +545,8 @@ <h2 id="B">B</h2>
       <li><a href="api-docs/parts.rnns.html#parts.rnns.attention_wrapper.BahdanauMonotonicAttention">BahdanauMonotonicAttention (class in parts.rnns.attention_wrapper)</a>
 </li>
       <li><a href="api-docs/parts.tacotron.html#parts.tacotron.tacotron_decoder.BasicDecoderOutput">BasicDecoderOutput (class in parts.tacotron.tacotron_decoder)</a>
+</li>
+      <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss">BasicSampledSequenceLoss (class in losses.sequence_loss)</a>
 </li>
       <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSequenceLoss">BasicSequenceLoss (class in losses.sequence_loss)</a>
 </li>
@@ -600,6 +608,8 @@ <h2 id="B">B</h2>
         <li><a href="api-docs/parts.transformer.html#parts.transformer.embedding_layer.EmbeddingSharedWeights.build">(parts.transformer.embedding_layer.EmbeddingSharedWeights method)</a>
 </li>
       </ul></li>
+      <li><a href="api-docs/models.html#models.model.Model.build_forward_pass_graph">build_forward_pass_graph() (models.model.Model method)</a>
+</li>
       <li><a href="api-docs/data.html#data.data_layer.DataLayer.build_graph">build_graph() (data.data_layer.DataLayer method)</a>
 
       <ul>
@@ -659,6 +669,8 @@ <h2 id="C">C</h2>
       <li><a href="api-docs/utils.html#utils.utils.cast_types">cast_types() (in module utils.utils)</a>
 </li>
       <li><a href="api-docs/optimizers.html#optimizers.automatic_loss_scaler.AutomaticLossScaler.check_grads">check_grads() (optimizers.automatic_loss_scaler.AutomaticLossScaler static method)</a>
+</li>
+      <li><a href="api-docs/utils.html#utils.utils.check_logdir">check_logdir() (in module utils.utils)</a>
 </li>
       <li><a href="api-docs/utils.html#utils.utils.check_params">check_params() (in module utils.utils)</a>
 </li>
@@ -670,8 +682,6 @@ <h2 id="C">C</h2>
         <li><a href="api-docs/models.html#models.model.Model.clip_last_batch">(models.model.Model method)</a>
 </li>
       </ul></li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api-docs/utils.html#utils.utils.clip_sparse">clip_sparse() (in module utils.utils)</a>
 </li>
       <li><a href="api-docs/parts.rnns.html#parts.rnns.attention_wrapper.AttentionWrapperState.clone">clone() (parts.rnns.attention_wrapper.AttentionWrapperState method)</a>
@@ -682,6 +692,8 @@ <h2 id="C">C</h2>
 </li>
       <li><a href="api-docs/parts.transformer.html#parts.transformer.attention_layer.Attention.combine_heads">combine_heads() (parts.transformer.attention_layer.Attention method)</a>
 </li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api-docs/models.html#models.model.Model.compile">compile() (models.model.Model method)</a>
 </li>
       <li><a href="api-docs/optimizers.html#optimizers.mp_wrapper.MixedPrecisionOptimizerWrapper.compute_gradients">compute_gradients() (optimizers.mp_wrapper.MixedPrecisionOptimizerWrapper method)</a>
@@ -695,10 +707,38 @@ <h2 id="C">C</h2>
       <li><a href="api-docs/parts.cnns.html#parts.cnns.conv_blocks.conv_actv">conv_actv() (in module parts.cnns.conv_blocks)</a>
 </li>
       <li><a href="api-docs/parts.cnns.html#parts.cnns.conv_blocks.conv_bn_actv">conv_bn_actv() (in module parts.cnns.conv_blocks)</a>
+</li>
+      <li><a href="api-docs/parts.cnns.html#parts.cnns.conv_blocks.conv_in_actv">conv_in_actv() (in module parts.cnns.conv_blocks)</a>
+</li>
+      <li><a href="api-docs/parts.cnns.html#parts.cnns.conv_blocks.conv_ln_actv">conv_ln_actv() (in module parts.cnns.conv_blocks)</a>
 </li>
       <li><a href="api-docs/decoders.html#decoders.convs2s_decoder.ConvS2SDecoder">ConvS2SDecoder (class in decoders.convs2s_decoder)</a>
 </li>
       <li><a href="api-docs/encoders.html#encoders.convs2s_encoder.ConvS2SEncoder">ConvS2SEncoder (class in encoders.convs2s_encoder)</a>
+</li>
+      <li><a href="api-docs/data.html#data.data_layer.DataLayer.create_feed_dict">create_feed_dict() (data.data_layer.DataLayer method)</a>
+
+      <ul>
+        <li><a href="api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer.create_feed_dict">(data.speech2text.speech2text.Speech2TextDataLayer method)</a>
+</li>
+        <li><a href="api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.create_feed_dict">(data.text2speech.text2speech.Text2SpeechDataLayer method)</a>
+</li>
+        <li><a href="api-docs/data.text2text.html#data.text2text.text2text.ParallelTextDataLayer.create_feed_dict">(data.text2text.text2text.ParallelTextDataLayer method)</a>
+</li>
+      </ul></li>
+      <li><a href="api-docs/data.html#data.data_layer.DataLayer.create_interactive_placeholders">create_interactive_placeholders() (data.data_layer.DataLayer method)</a>
+
+      <ul>
+        <li><a href="api-docs/data.speech2text.html#data.speech2text.speech2text.Speech2TextDataLayer.create_interactive_placeholders">(data.speech2text.speech2text.Speech2TextDataLayer method)</a>
+</li>
+        <li><a href="api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.create_interactive_placeholders">(data.text2speech.text2speech.Text2SpeechDataLayer method)</a>
+</li>
+        <li><a href="api-docs/data.text2text.html#data.text2text.text2text.ParallelTextDataLayer.create_interactive_placeholders">(data.text2text.text2text.ParallelTextDataLayer method)</a>
+</li>
+      </ul></li>
+      <li><a href="api-docs/utils.html#utils.utils.create_logdir">create_logdir() (in module utils.utils)</a>
+</li>
+      <li><a href="api-docs/utils.html#utils.utils.create_model">create_model() (in module utils.utils)</a>
 </li>
       <li><a href="api-docs/losses.html#losses.cross_entropy_loss.CrossEntropyLoss">CrossEntropyLoss (class in losses.cross_entropy_loss)</a>
 </li>
@@ -929,6 +969,8 @@ <h2 id="G">G</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api-docs/utils.html#utils.utils.get_available_gpus">get_available_gpus() (in module utils.utils)</a>
+</li>
+      <li><a href="api-docs/utils.html#utils.utils.get_base_config">get_base_config() (in module utils.utils)</a>
 </li>
       <li><a href="api-docs/models.html#models.model.Model.get_data_layer">get_data_layer() (models.model.Model method)</a>
 </li>
@@ -937,6 +979,8 @@ <h2 id="G">G</h2>
       <li><a href="api-docs/utils.html#utils.utils.get_git_diff">get_git_diff() (in module utils.utils)</a>
 </li>
       <li><a href="api-docs/utils.html#utils.utils.get_git_hash">get_git_hash() (in module utils.utils)</a>
+</li>
+      <li><a href="api-docs/utils.html#utils.utils.get_interactive_infer_results">get_interactive_infer_results() (in module utils.utils)</a>
 </li>
       <li><a href="api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.get_magnitude_spec">get_magnitude_spec() (data.text2speech.text2speech.Text2SpeechDataLayer method)</a>
 </li>
@@ -1002,6 +1046,8 @@ <h2 id="G">G</h2>
         <li><a href="api-docs/losses.html#losses.ctc_loss.CTCLoss.get_optional_params">(losses.ctc_loss.CTCLoss static method)</a>
 </li>
         <li><a href="api-docs/losses.html#losses.loss.Loss.get_optional_params">(losses.loss.Loss static method)</a>
+</li>
+        <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss.get_optional_params">(losses.sequence_loss.BasicSampledSequenceLoss static method)</a>
 </li>
         <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSequenceLoss.get_optional_params">(losses.sequence_loss.BasicSequenceLoss static method)</a>
 </li>
@@ -1026,6 +1072,8 @@ <h2 id="G">G</h2>
 </li>
       <li><a href="api-docs/optimizers.html#optimizers.optimizers.get_regularization_loss">get_regularization_loss() (in module optimizers.optimizers)</a>
 </li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api-docs/data.html#data.data_layer.DataLayer.get_required_params">get_required_params() (data.data_layer.DataLayer static method)</a>
 
       <ul>
@@ -1080,6 +1128,8 @@ <h2 id="G">G</h2>
         <li><a href="api-docs/encoders.html#encoders.w2l_encoder.Wave2LetterEncoder.get_required_params">(encoders.w2l_encoder.Wave2LetterEncoder static method)</a>
 </li>
         <li><a href="api-docs/losses.html#losses.loss.Loss.get_required_params">(losses.loss.Loss static method)</a>
+</li>
+        <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSampledSequenceLoss.get_required_params">(losses.sequence_loss.BasicSampledSequenceLoss static method)</a>
 </li>
         <li><a href="api-docs/losses.html#losses.sequence_loss.BasicSequenceLoss.get_required_params">(losses.sequence_loss.BasicSequenceLoss static method)</a>
 </li>
@@ -1092,8 +1142,6 @@ <h2 id="G">G</h2>
         <li><a href="api-docs/models.html#models.text2speech.Text2Speech.get_required_params">(models.text2speech.Text2Speech static method)</a>
 </li>
       </ul></li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api-docs/utils.html#utils.utils.get_results_for_epoch">get_results_for_epoch() (in module utils.utils)</a>
 </li>
       <li><a href="api-docs/data.html#data.data_layer.DataLayer.get_size_in_samples">get_size_in_samples() (data.data_layer.DataLayer method)</a>
@@ -1340,6 +1388,8 @@ <h2 id="M">M</h2>
 <h2 id="N">N</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
+      <li><a href="api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.n_fft">n_fft (data.text2speech.text2speech.Text2SpeechDataLayer attribute)</a>
+</li>
       <li><a href="api-docs/decoders.html#decoders.decoder.Decoder.name">name (decoders.decoder.Decoder attribute)</a>
 
       <ul>
@@ -1349,11 +1399,11 @@ <h2 id="N">N</h2>
 </li>
       </ul></li>
       <li><a href="api-docs/utils.html#utils.utils.nest_dict">nest_dict() (in module utils.utils)</a>
-</li>
-      <li><a href="api-docs/utils.html#utils.utils.nested_update">nested_update() (in module utils.utils)</a>
 </li>
   </ul></td>
   <td style="width: 33%; vertical-align: top;"><ul>
+      <li><a href="api-docs/utils.html#utils.utils.nested_update">nested_update() (in module utils.utils)</a>
+</li>
       <li><a href="api-docs/parts.tacotron.html#parts.tacotron.tacotron_helper.TacotronHelper.next_inputs">next_inputs() (parts.tacotron.tacotron_helper.TacotronHelper method)</a>
 
       <ul>
@@ -1446,6 +1496,8 @@ <h2 id="P">P</h2>
         <li><a href="api-docs/data.image2label.html#data.image2label.imagenet_preprocessing.parse_record">(in module data.image2label.imagenet_preprocessing)</a>
 </li>
       </ul></li>
+      <li><a href="api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.parse_text_output">parse_text_output() (data.text2speech.text2speech.Text2SpeechDataLayer method)</a>
+</li>
       <li><a href="api-docs/parts.html#module-parts">parts (module)</a>
 </li>
       <li><a href="api-docs/parts.cnns.html#module-parts.cnns">parts.cnns (module)</a>
@@ -1578,6 +1630,8 @@ <h2 id="S">S</h2>
         <li><a href="api-docs/parts.tacotron.html#parts.tacotron.tacotron_helper.TacotronTrainingHelper.sample_ids_shape">(parts.tacotron.tacotron_helper.TacotronTrainingHelper attribute)</a>
 </li>
       </ul></li>
+      <li><a href="api-docs/data.text2speech.html#data.text2speech.text2speech.Text2SpeechDataLayer.sampling_rate">sampling_rate (data.text2speech.text2speech.Text2SpeechDataLayer attribute)</a>
+</li>
       <li><a href="api-docs/models.html#models.text2speech.save_audio">save_audio() (in module models.text2speech)</a>
 </li>
       <li><a href="api-docs/parts.transformer.html#parts.transformer.beam_search.SequenceBeamSearch.search">search() (parts.transformer.beam_search.SequenceBeamSearch method)</a>
diff --git a/docs/html/machine-translation.html b/docs/html/machine-translation.html
index 89d3d4f48..67cf6c5b6 100644
--- a/docs/html/machine-translation.html
+++ b/docs/html/machine-translation.html
@@ -195,17 +195,17 @@ <h2>Models<a class="headerlink" href="#models" title="Permalink to this headline
 <tbody valign="top">
 <tr class="row-even"><td><a class="reference internal" href="machine-translation/transformer.html"><span class="doc">Transformer</span></a></td>
 <td>26.4</td>
-<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/transformer-big.py">transformer-big.py</a></td>
+<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/transformer-base.py">transformer-base.py</a></td>
 <td>TBD</td>
 </tr>
 <tr class="row-odd"><td><a class="reference internal" href="machine-translation/convs2s.html"><span class="doc">ConvS2S</span></a></td>
 <td>25.0</td>
-<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-convs2s.py">en-de-convs2s.py</a></td>
+<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-convs2s-8-gpu.py">en-de-convs2s-8-gpu.py</a></td>
 <td>TBD</td>
 </tr>
 <tr class="row-even"><td><a class="reference internal" href="machine-translation/gnmt.html"><span class="doc">GNMT</span></a></td>
 <td>23.0</td>
-<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py">en-de-gnmt-like-4GPUs.py</a></td>
+<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py">en-de-gnmt-like-4GPUs.py</a></td>
 <td>TBD</td>
 </tr>
 </tbody>
diff --git a/docs/html/machine-translation/gnmt.html b/docs/html/machine-translation/gnmt.html
index 01a17d1b8..c7e7ee993 100644
--- a/docs/html/machine-translation/gnmt.html
+++ b/docs/html/machine-translation/gnmt.html
@@ -181,13 +181,13 @@ <h2>Model<a class="headerlink" href="#model" title="Permalink to this headline">
 <dl class="docutils">
 <dt>We have 2 models based on RNNs:</dt>
 <dd><ul class="first last simple">
-<li>small NMT (config <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-nmt-small.py">en-de-nmt-small.py</a> ) model:<ul>
+<li>small NMT (config <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-nmt-small.py">en-de-nmt-small.py</a> ) model:<ul>
 <li>the embedding size for source and target is 512</li>
 <li>2 birectional LSTM layers in encoder, and 2 LSTM layers in decoder  with state 512</li>
 <li>the attention mechanism with size 512</li>
 </ul>
 </li>
-<li>GNMT-like model based on <a class="reference external" href="https://ai.google/research/pubs/pub45610">Google NMT</a>  (config <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py">en-de-gnmt-like-4GPUs.py</a> ):<ul>
+<li>GNMT-like model based on <a class="reference external" href="https://ai.google/research/pubs/pub45610">Google NMT</a>  (config <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py">en-de-gnmt-like-4GPUs.py</a> ):<ul>
 <li>the embedding size for source and target is 1024</li>
 <li>8 LSTM layers in encoder, and 8 LSTM layers in decoder with state 1024</li>
 <li>residual connections in encoders and decoders</li>
diff --git a/docs/html/models-and-recipes.html b/docs/html/models-and-recipes.html
deleted file mode 100644
index aec510aa2..000000000
--- a/docs/html/models-and-recipes.html
+++ /dev/null
@@ -1,431 +0,0 @@
-
-
-<!DOCTYPE html>
-<!--[if IE 8]><html class="no-js lt-ie9" lang="en" > <![endif]-->
-<!--[if gt IE 8]><!--> <html class="no-js" lang="en" > <!--<![endif]-->
-<head>
-  <meta charset="utf-8">
-  
-  <meta name="viewport" content="width=device-width, initial-scale=1.0">
-  
-  <title>Models and recipes &mdash; OpenSeq2Seq 0.2 documentation</title>
-  
-
-  
-  
-    <link rel="shortcut icon" href="_static/favicon.ico"/>
-  
-  
-  
-
-  
-
-  
-  
-    
-
-  
-
-  
-    <link rel="stylesheet" href="_static/css/theme.css" type="text/css" />
-  <link rel="stylesheet" href="_static/pygments.css" type="text/css" />
-  <link rel="stylesheet" href="_static/theme_override.css" type="text/css" />
-  <link rel="stylesheet" href="_static/theme_override.css" type="text/css" />
-    <link rel="index" title="Index" href="genindex.html" />
-    <link rel="search" title="Search" href="search.html" /> 
-
-  
-  <script src="_static/js/modernizr.min.js"></script>
-
-</head>
-
-<body class="wy-body-for-nav">
-
-   
-  <div class="wy-grid-for-nav">
-
-    
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search">
-          
-
-          
-            <a href="index.html" class="icon icon-home"> OpenSeq2Seq
-          
-
-          
-            
-            <img src="_static/logo.png" class="logo" alt="Logo"/>
-          
-          </a>
-
-          
-
-          
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-
-          
-        </div>
-
-        <div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="main navigation">
-          
-            
-            
-              
-            
-            
-              <ul>
-<li class="toctree-l1"><a class="reference internal" href="index.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="installation.html">Installation instructions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="machine-translation.html">Machine Translation</a></li>
-<li class="toctree-l1"><a class="reference internal" href="speech-recognition.html">Speech Recognition</a></li>
-<li class="toctree-l1"><a class="reference internal" href="speech-synthesis.html">Speech Synthesis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="distr-training.html">Distributed training</a></li>
-<li class="toctree-l1"><a class="reference internal" href="mixed-precision.html">Mixed precision training</a></li>
-<li class="toctree-l1"><a class="reference internal" href="in-depth-tutorials.html">In-depth tutorials</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interactive-infer-demos.html">Interactive Infer Mode</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api-docs/modules.html">API documentation</a></li>
-</ul>
-
-            
-          
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap">
-
-      
-      <nav class="wy-nav-top" aria-label="top navigation">
-        
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="index.html">OpenSeq2Seq</a>
-        
-      </nav>
-
-
-      <div class="wy-nav-content">
-        
-        <div class="rst-content">
-        
-          
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-<div role="navigation" aria-label="breadcrumbs navigation">
-
-  <ul class="wy-breadcrumbs">
-    
-      <li><a href="index.html">Docs</a> &raquo;</li>
-        
-      <li>Models and recipes</li>
-    
-    
-      <li class="wy-breadcrumbs-aside">
-        
-            
-            <a href="_sources/models-and-recipes.rst.txt" rel="nofollow"> View page source</a>
-          
-        
-      </li>
-    
-  </ul>
-
-  
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-            
-  <div class="section" id="models-and-recipes">
-<span id="id1"></span><h1>Models and recipes<a class="headerlink" href="#models-and-recipes" title="Permalink to this headline">¶</a></h1>
-<div class="admonition note">
-<p class="first admonition-title">Note</p>
-<p class="last">Currently OpenSeq2Seq has model implementations for machine translation and
-automatic speech recognition.
-All models work both in float32 and mixed precision.
-We recommend you use <a class="reference internal" href="mixed-precision.html#mixed-precision"><span class="std std-ref">mixed precision training</span></a>
-when training on Volta GPUs.</p>
-</div>
-<p>To train models you can use the following commands (don’t forget to substitute
-valid config_file path there and number of GPUs if using Horovod).</p>
-<p>With Horovod (highly recommended when using multiple GPUs):</p>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">mpiexec</span> <span class="o">--</span><span class="n">allow</span><span class="o">-</span><span class="n">run</span><span class="o">-</span><span class="k">as</span><span class="o">-</span><span class="n">root</span> <span class="o">-</span><span class="n">np</span> <span class="o">&lt;</span><span class="n">num_gpus</span><span class="o">&gt;</span> <span class="n">python</span> <span class="n">run</span><span class="o">.</span><span class="n">py</span> <span class="o">--</span><span class="n">config_file</span><span class="o">=...</span> <span class="o">--</span><span class="n">mode</span><span class="o">=</span><span class="n">train_eval</span> <span class="o">--</span><span class="n">use_horovod</span><span class="o">=</span><span class="kc">True</span> <span class="o">--</span><span class="n">enable_logs</span>
-</pre></div>
-</div>
-<p>Without Horovod:</p>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">python</span> <span class="n">run</span><span class="o">.</span><span class="n">py</span> <span class="o">--</span><span class="n">config_file</span><span class="o">=...</span> <span class="o">--</span><span class="n">mode</span><span class="o">=</span><span class="n">train_eval</span> <span class="o">--</span><span class="n">enable_logs</span>
-</pre></div>
-</div>
-<p>The description of implemented models is available in the next sections:</p>
-<div class="section" id="machine-translation">
-<h2>Machine translation<a class="headerlink" href="#machine-translation" title="Permalink to this headline">¶</a></h2>
-<p>The table below contains description and results of
-machine translation models available in OpenSeq2Seq.
-Currently, we have GNMT-based model, Transformer-based models and
-ConvS2S-based models.</p>
-<p>We measure BLEU score on newstest2014.tok.de file using <code class="docutils literal notranslate"><span class="pre">multi-bleu.perl</span></code> script from Mosses.
-For more details about model descriptions and training setup,
-have a look at the <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de">configuration files</a>.</p>
-<table border="1" class="colwidths-given docutils">
-<colgroup>
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-</colgroup>
-<thead valign="bottom">
-<tr class="row-odd"><th class="head">Config file</th>
-<th class="head">BLEU</th>
-<th class="head">Training setup and additional comments</th>
-<th class="head">Short description of the model</th>
-<th class="head">Checkpoint</th>
-</tr>
-</thead>
-<tbody valign="top">
-<tr class="row-even"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-nmt-small.py">en-de-nmt-small.py</a></td>
-<td>20.23</td>
-<td>This model should train on a single GPU such as 1080Ti. It is trained using Adam optimizer.</td>
-<td>RNN-based. Bi-directional encoder with 2 layers and. GNMT-like decoder with 2 layers and attention. Uses LSTM cells of size 512.</td>
-<td><a class="reference external" href="https://drive.google.com/file/d/1Ty9hiOQx4V28jJmIbj7FWUyw7LVA39SF/view?usp=sharing">link</a></td>
-</tr>
-<tr class="row-odd"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py">en-de-gnmt-like-4GPUs.py</a></td>
-<td>23.89</td>
-<td>This model was trained on 4 GPUs with Adam optimizer and learning rate decay.</td>
-<td>RNN-based. This is GNMT-like model which tries to match the one described in <a class="reference external" href="https://arxiv.org/abs/1609.08144">https://arxiv.org/abs/1609.08144</a> as close as possible.</td>
-<td><a class="reference external" href="https://drive.google.com/file/d/1HVc4S8-wv1-AZK1JeWgn6YNITSFAMes_/view?usp=sharing">link</a></td>
-</tr>
-<tr class="row-even"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/transformer-big.py">transformer-big.py</a></td>
-<td>26.17</td>
-<td>This model was trained on 4 GPUs with Adam optimizer and learning rate decay.</td>
-<td>Transformer “big” model. This model does not have any RNN layers</td>
-<td><a class="reference external" href="https://drive.google.com/file/d/151R6iCCtehRLpnH3nBmhEi_nhNO2mXW8/view?usp=sharing">link</a></td>
-</tr>
-<tr class="row-odd"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-convs2s.py">en-de-convs2s.py</a></td>
-<td>xx.xx</td>
-<td>This model was trained on 4 GPUs with Adam optimizer, learning rate decay and warm-up.</td>
-<td>This is an implementation of the ConvS2S model proposed in <a class="reference external" href="https://arxiv.org/abs/1705.03122">https://arxiv.org/abs/1705.03122</a>.</td>
-<td>Coming soon.</td>
-</tr>
-</tbody>
-</table>
-<p>GNMT model description: <a class="reference external" href="https://arxiv.org/abs/1609.08144">https://arxiv.org/abs/1609.08144</a>.</p>
-<p>Transformer model description: <a class="reference external" href="https://arxiv.org/abs/1706.03762">https://arxiv.org/abs/1706.03762</a>.</p>
-<p>ConvS2S model description: <a class="reference external" href="https://arxiv.org/abs/1705.03122">https://arxiv.org/abs/1705.03122</a>.</p>
-</div>
-<div class="section" id="speech-recognition">
-<h2>Speech recognition<a class="headerlink" href="#speech-recognition" title="Permalink to this headline">¶</a></h2>
-<p>The table below contains description and results of
-speech recognition models available in OpenSeq2Seq.
-Currently, we have DeepSpeech2-based models and Wav2Letter-based models.</p>
-<p>WER is the word error rate obtained on a dev-clean subset of LibriSpeech using
-greedy decoder (<code class="docutils literal notranslate"><span class="pre">decoder_params/use_language_model</span> <span class="pre">=</span> <span class="pre">False</span></code>).
-For the final evaluation we used <code class="docutils literal notranslate"><span class="pre">batch_size_per_gpu</span> <span class="pre">=</span> <span class="pre">1</span></code>
-to eliminate the effect of <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/issues/69">cudnn padding issue</a>.
-For more details about model descriptions and training setup,
-have a look at the <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text">configuration files</a>.</p>
-<table border="1" class="colwidths-given docutils">
-<colgroup>
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-</colgroup>
-<thead valign="bottom">
-<tr class="row-odd"><th class="head">Config file</th>
-<th class="head">WER</th>
-<th class="head">Training setup and additional comments</th>
-<th class="head">Short description of the model</th>
-<th class="head">Checkpoint</th>
-</tr>
-</thead>
-<tbody valign="top">
-<tr class="row-even"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2l_large_8gpus_mp.py">w2l_large_8gpus_mp.py</a></td>
-<td>7.19%</td>
-<td>This model was trained for 200 epochs using SGD with Momentum and LARC on
-the full LibriSpeech in three days on eight GPUs using mixed precision.</td>
-<td>The model has 17 convolutional layers (256–1024 units, 11–29 kernel size).
-We use batch norm between all layers.</td>
-<td><a class="reference external" href="https://drive.google.com/file/d/140edZXuzehCCaOxgEixJEesvo97EB5i1/view?usp=sharing">link</a></td>
-</tr>
-<tr class="row-odd"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus.py">ds2_large_8gpus.py</a></td>
-<td>9.28%</td>
-<td>This model was trained for 50 epochs using SGD with Momentum and LARC on
-the full LibriSpeech in a few days using Horovod on eight GPUs.</td>
-<td>This model has 2 convolutional layers and 5 bidirectional
-GRU layers with 800 units.</td>
-<td><a class="reference external" href="https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX">link</a></td>
-</tr>
-<tr class="row-even"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_medium_4gpus.py">ds2_medium_4gpus.py</a></td>
-<td>22.60%</td>
-<td>This model was trained for 50 epochs using Adam on the full
-LibriSpeech in a few days using Horovod on four GPUs.</td>
-<td>This model has 3 convolutional layers and 3 unidirectional
-GRU layers with 1024 units.</td>
-<td><a class="reference external" href="https://drive.google.com/file/d/1XpnyZzMaO38RE4dSOJZkcaJ3T8B0lxKe/view?usp=sharing">link</a></td>
-</tr>
-<tr class="row-odd"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_small_1gpu.py">ds2_small_1gpu.py</a></td>
-<td>39.08%</td>
-<td>This model was trained for 12 epochs using Adam on a “clean” subset of
-LibriSpeech in less than a day using a single GPU.</td>
-<td>This model has 2 convolutional layers and 2 bidirectional
-GRU layers with 512 units.</td>
-<td><a class="reference external" href="https://drive.google.com/file/d/1-OEvxyg7rCogZhejen7pNuKkgvuwCdbk/view?usp=sharing">link</a></td>
-</tr>
-</tbody>
-</table>
-<p>Deep Speech 2 model description: <a class="reference external" href="https://arxiv.org/abs/1512.02595">https://arxiv.org/abs/1512.02595</a>.</p>
-<p>Wav2Letter model description: <a class="reference external" href="https://arxiv.org/abs/1609.03193">https://arxiv.org/abs/1609.03193</a>, <a class="reference external" href="https://arxiv.org/abs/1712.09444">https://arxiv.org/abs/1712.09444</a>.</p>
-</div>
-<div class="section" id="text-to-speech">
-<h2>Text To Speech<a class="headerlink" href="#text-to-speech" title="Permalink to this headline">¶</a></h2>
-<p>The table below contains description and results of
-text-to-speech models available in OpenSeq2Seq.
-Currently, we have a Tacotron2-based model.</p>
-<table border="1" class="colwidths-given docutils">
-<colgroup>
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-<col width="20%" />
-</colgroup>
-<thead valign="bottom">
-<tr class="row-odd"><th class="head">Config file</th>
-<th class="head">Samples</th>
-<th class="head">Training setup and additional comments</th>
-<th class="head">Short description of the model</th>
-<th class="head">Checkpoint</th>
-</tr>
-</thead>
-<tbody valign="top">
-<tr class="row-even"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float.py">tacotron_LJ_float.py</a></td>
-<td>Coming soon.</td>
-<td>Learns magnitude spectrograms. Trained on 1 gpu for 100,000 steps with ADAM.</td>
-<td>Model tries to match the model description in <a class="reference external" href="https://arxiv.org/abs/1712.05884">https://arxiv.org/abs/1712.05884</a>.
-The only difference is that the stop token projection layer is placed after
-the spectrogram projection layer.</td>
-<td>Coming soon.</td>
-</tr>
-<tr class="row-odd"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float_8gpu.py">tacotron_LJ_float_8gpu.py</a></td>
-<td>Coming soon.</td>
-<td>Learns magnitude spectrograms. Trained on 8 gpus for 30,000 steps with ADAM and larc.</td>
-<td>Model tries to match the model description in <a class="reference external" href="https://arxiv.org/abs/1712.05884">https://arxiv.org/abs/1712.05884</a>.
-The only difference is that the stop token projection layer is placed after
-the spectrogram projection layer.</td>
-<td>Coming soon.</td>
-</tr>
-<tr class="row-even"><td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_mixed.py">tacotron_LJ_mixed.py</a></td>
-<td>Coming soon.</td>
-<td>Learns magnitude spectrograms. Trained on 1 gpu for 100,000 steps with ADAM and larc.</td>
-<td>Model tries to match the model description in <a class="reference external" href="https://arxiv.org/abs/1712.05884">https://arxiv.org/abs/1712.05884</a>.
-The only difference is that the stop token projection layer is placed after
-the spectrogram projection layer.</td>
-<td>Coming soon.</td>
-</tr>
-</tbody>
-</table>
-<p>Tacotron 2 model description: <a class="reference external" href="https://arxiv.org/abs/1712.05884">https://arxiv.org/abs/1712.05884</a>.</p>
-</div>
-</div>
-
-
-           </div>
-           
-          </div>
-          <footer>
-  
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>
-        &copy; Copyright 2018, NVIDIA.
-
-    </p>
-  </div>
-  Built with <a href="http://sphinx-doc.org/">Sphinx</a> using a <a href="https://github.com/rtfd/sphinx_rtd_theme">theme</a> provided by <a href="https://readthedocs.org">Read the Docs</a>. 
-
-</footer>
-
-        </div>
-      </div>
-
-    </section>
-
-  </div>
-  
-
-
-  
-
-    <script type="text/javascript">
-        var DOCUMENTATION_OPTIONS = {
-            URL_ROOT:'./',
-            VERSION:'0.2',
-            LANGUAGE:'None',
-            COLLAPSE_INDEX:false,
-            FILE_SUFFIX:'.html',
-            HAS_SOURCE:  true,
-            SOURCELINK_SUFFIX: '.txt'
-        };
-    </script>
-      <script type="text/javascript" src="_static/jquery.js"></script>
-      <script type="text/javascript" src="_static/underscore.js"></script>
-      <script type="text/javascript" src="_static/doctools.js"></script>
-      <script type="text/javascript" src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.1/MathJax.js?config=TeX-AMS-MML_HTMLorMML"></script>
-
-  
-
-  
-  
-    <script type="text/javascript" src="_static/js/theme.js"></script>
-  
-
-  <script type="text/javascript">
-      jQuery(function () {
-          
-          SphinxRtdTheme.Navigation.enableSticky();
-          
-      });
-  </script>  
-  <style>
-    /* Sidebar header (and topbar for mobile) */
-    .wy-side-nav-search, .wy-nav-top {
-      background: #64d81c;
-    }
-    .wy-side-nav-search > div.version {
-      color: #ffffff;
-    }
-    .wy-side-nav-search > img {
-      max-width: 150px;
-    }
-    .wy-side-nav-search > a {
-      font-size: 23px;
-    }
-  </style>
-
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/html/objects.inv b/docs/html/objects.inv
index 564223c1f8d340133017087d193a18dc161eabf1..748ca8de46bc631aa2a08f11bf8eac721b9304d2 100644
GIT binary patch
delta 6313
zcmV;a7*^-@Fz+#tet%nYq&Swx-~A~vqW5hgscAoL%v+W1s;+34?X7f8Z|n=91Z5^u
z+!_gA`qQs2K#Ge%NJlyI&|PUjzrT>qk&XmNF`{TwzW*aD;yT5fzi&{PY~vy#A7XYU
zIMFQqMV{OK*JgVq4)XtnDSF41eahgL{k(4(QHluJ{5pl0O@AANVUi~_3`IsTJr%JH
zWnU+093CrFp4>oDg%QQ!0pmD~lZb-QlAPiSMKpQAVVR-`pNcfb6>)<fF%657CPj|Y
zutXKg1dvcflgJHQ;Xmu7VnqOpCCOjBFhYW|GR2O!pX6mtLyB`!$dW{qR>{7m*oww$
zh!&MI=v-o^n13WgM|_>4Jx*u5QMqc`Gt~?HB7>XcfGPv`9|^1^8@jc#jEyIOh_3ZB
z5K(h4be3D;qwZQp9_%c`YKmZ1aZyplK8voba9I@*CL|PBfogr_zjI8z`0xns&5g%O
zm+|CjUH{HJt?SdD$BJHEdP2^VSC5rQnX))EZlh`E5`Sdy@a)7%egy4_NAw^>q{NXp
zN^teU4l#@5w!w7|bsllA0KK6gjBrjX=4nw?lpbYb*4oBcsDvnw!$X?*l*=&6WuqIC
zdQU~<UgSbKFRBcs$zMpw`pbgsW$>GDX?C)pg-11MC+B{~lMG=+#~P@n#X>YpF(TBT
z;IOOqq<=EeQClc6=f%<Kn&LM)(@-c^O*a(k1%8piPX2yozYXGuk&G4JWV!%KiTACj
zj+5d7TGCX7T8LAev3B*ss;rsINmL~zy<7&&;zA&?6*D`qiWaj!KpC)!h5@D52E>5U
z<}opl=!&oyO3^4X1`;z0j@M{~HBC|i+bv0EfPd;EZ@!v#jU-2A{j;6&`g}_plLrpW
z$?Hnmm}iObP!(BtNKy<f*2cBit-Sc5Yk7L6YL%;|t5&_h&|IvUL5#bbpS|mm!ZMmy
zVTMy5*fqunBVlNK7Gg>Mf_Wg~p{O9M)`M}Yzj=duEgN5haC&u?C;2AfG?bEcunC)i
ze}9LxS)2<bwj$1jRkVn6fifW4S#)HUT*sKVThV1S*T&X>(raUDKxy;X8c1|SYz?Jo
z6k7v{<>BE#FQU}6fb3LQ)RYyf|GE=KBIcr56LFE7G#aWbXe~^cb=S=F@ZvQ42M7~{
zdqi1S(@Y5)1bn*i{7h`x?Tq<yhTg(`QGe$#suCDD3ly0X32=(@BRxStdGpgwio;RU
z0>#ZVG03g=ChsADte#@=_(9r07l=FO7Sz_eUr(${N>iK~&J3@}=QMgveC4FGHnf5e
zvyG~pw5@|1XH~1X##wb`NaLipHkxr0GY@18by#;BB}m9T7eCouz&Q2@8{9qIhJTNr
z!<*k8zuw$=%ztqAxC_7D`c!!Q@yu`K(~q0q@1A`MJ$=0Od@H_->c_+HpbF1?xPK_B
z3|GKi(G=N3Pc$jxyM5M*`fQ#jMLo5a(^^oCB{yZ(qf{VaRSOGt^}a{8HsML4@l>D{
zn>2rgNlZdogtY5Az@?-P(@-^iD1XVfl6;VH?u#s{xIcby_1|;JM{EE|#W>~2O1&+9
z=RwL)0Gf(Pgi0*2aMWh}D@JW~^pgjf@CCxlImfSOQ%{qH7pm6cd5efcl$Iy7XZO&K
zdVu+Uie|tLUlV!?DXMr!_EJP>9}=S{L#C3v@Oi_N<S~8&E-EocAv10E2!GBLoFg%`
zWZACsq-}O!&;&8Ck37pMKEitF{MheJAo-(?1W=(VYfhIH0EYfok>pK*h`ftJ0;AWt
zb8ETuB!4m<l23Dm6O<L7TVt-qD_>YwoucY}HZK!72+Gc(STW(`c%p^~(d}2dTWHRX
zZ=*dC75NLfCe2ID6%Z!4VSj(`u6MU*>Nq~^L08b^#4CBv_C+eJDlLu)CE+30#3<H6
z&70mO&p9x9?U>0)Xw5juT8MeV%q*lH>u7mxZY)i0kbG&}u>uq!-v7Rrn7FfMgL`uh
z5C+b6r^qnIIwWV!jZcrH%{e*BKsZYu=ITj@D0FS~6-4m4PSbbh%6~bID2{KQZ!8_j
zglX?xMszs4G?s%gR=pf}Wq7O!*Vby8e2Ef&PBIK$>I&3H$@lQ!rLWR2;bKEQm>RG0
z+_~LU8NnxvvK>ZMbo&1A(B$_IHm3hbDbCvu^46HoI=a0bt<|wKsFgBsmemvXQ8#{T
zL`#=XbC7xq9#kM|`+q;9jsY7FilTy6MSkr%P9A}Rr;2~Yxz-+a9D5to5>d=wM>_Ip
z4dqK?7`A-xubcQ>8w!uP&+QS*E_|5?S;AwstB;##SbDet8qU8B#elr~{P@+`zsIQF
z(_KreG@=5|ix~>K%#RsL0GgD!pf|Ic5?ncNCZERYV%YZV$bUk+6A|k<n?C>$!Og?N
zU9LCkKFol!(7dkatu!DzffWX0C?Gq6Zc)Uk2LW@WW~$b;qWhS3#@DvOXK9cXwJZcw
zVe>+yib9<2=ffK}eE-4mT7j5cyPAlC2yQVhoA0$PO=O;C-!?39=U#EK$HG~(fe?&E
zt3rH?72!0sXn%itnBq0$mTZA>w9PgLmc}?pZf|`f(9)x!H7rZh9ddv$a3()RhOzM>
zdG^uJ3eN1Kp%t8kM?*8D3KPB})IKeupVk3l4-&|4eE5g!7XCXx@qesCngOezG{re)
zK#6_%)dTa|oyo&E{%QzZE(b*SJo3i*It~xXoA9hSo_~2o#~2DkbL;{7l;Ari513kZ
z2XidIcCR`Q0_<H_VFaI&n6;Ua%-i>F+`^|y@3KAaDri+%tQD~DJT0Uw`?B>)>}nC<
zzgjictL6L{nYlJh_q$%(bsS}<=r*+KX?}V5_I#iG#Ne(s2L^JvSqV4?n3eHl_=}nz
z41QJ<)PK+yl`dr9VN~BfJa{v6iNAocH$s;&`9|#DVEBsih0VWFzL*mzdVsF*BljI|
z87TlcgrOEh#APN0=YD2-o;=W8+=COEiG%u~xulybo}U{#jvPmz^8;wh@#8Yl-e*nN
zmOg5LhVv0aF&LjvpU=8l%NV6T>b12PBPwL^n|}+!RKe?Y>RR*)BKQNn;Ol!#sdbUh
z)9f8|iEHVc3s^YIFc5OGh_oOCYv#M;xse4lhog%98}gk$it;_=2Vp3|4L@`zkK8xd
zktwNE6-OictTbtZo97!_-8Sul!5UMdA}d)Ze7+}Z)Jl_F!p1l!;=5HMmO0Z+G;1)n
zRevO;*Vav!$gWb9<V%ka4G6aNd1e40U~Hk!ThR(F@@60CEv8<0jHgLYSpHe_h^?EC
z9w7LHND}SDI%4szIkVPq&4_kZZOXQ`HbVgzQ(PhDZl_aXfHmx;YW>yeWh&EmEvhjG
z9~$qnqM#?;gpnH(qE=_%K((t^@KMY2YJbqR{e<Ee$HO=isNN0WKt<RN+O4~+9-tfX
zuWiKi6bECRfockG8O`4}(ycin&y5PIIoyn!=08$cg=k+oYF<YF#xI&Ibd|aex6sbG
zfaOclhoX8#RV+S3m|N`7MX6c-RxNlRe046w2VZah4sfMVCL>)3v{D|>=#_1sqkqzh
zuERlzS8vnS&8{4&kyzZPeZFZKZD@Oa-=a*L6AeOs*_78=SnU6WBTB-Ol?0)<TxHBU
zI(|WE-E0Wp3_B#b+`6ivYQN%J$<5IFp6|Vy<dlEdwa$&Rwq0Lar{bSrb+@1-vupl)
z0FY+BM+7k^l?a~2C{4;R<r6*P4S!sF4r>jX)$Xj)Tlt0xaP@~tR+1lZ#baG-6t@7r
zlG^!wWNQqlA;EM@BclAyT3NW*8s*-T4T<y+#(Xx@I$Nigcx_jwCKtwJEiQbtt#aEe
zxHs-CXzp7EgY?{%k7Z3<7;Ln3Dyrh8aH^Gs=~Dv&uN1=fQNU#(ThKM6#eeOp=Q~c#
z9;RzLQ4Ip9_tMd=8hjnhweer%+I0jv?E02KM{;s#6`JA~)@Yw7PPFTr8c;~P*A{R8
z`Qx(agetNUxVYowyhmuZ%39+Q8ibwA>R_%myU4Y(SsfOpPu9`bdxVbU<Pj?LSS1Hm
zmSLJ?_68i3X(9HMjc8RI+kZl{WQmof#a5y=5ZfL`**=2*THCu!BnRqQrpWdlIsk!q
zr;h31nFFMy-wY`3J|ln;N~1dE^MCsk*S0o#emjhhb627GfF|QBc57z6&*w+RuAD+O
zEi&G!iD}G`u-nqjfja<$kL^)D%fIVHMt(Kau!RS^A5Tw@-=FVp!+($WUmkbbKov|d
zI`MB@S*sV%b`@ZH=kxyWtuAA3=!K@qveNm4qMya#0Bs9BthYkytN19M`{MWwy+N0b
zO7&JaJrTFENvp6d(j-c-QzNHf0{m9;>3*c$O~5=$&G*=81%N6O9O2i5jVGcaXN^Zr
zA)rP24tBHZd(7gXEq^pC!`BLxrCUF9rUc)3H9S=~N(jrzV|&dXXOXquV+;@2|5+LH
zW<S9>C015$uGT(s2h(FeyJaX@y(;x$QL!))iSjcP6ZU&nzG<;X>FkOb#(8U~T@i9V
z3|NjD)kQtKXTxsb_9qaoEC^)*a1mkoMCEKsZd^84t|M$mWPgKfsxcdJYGg6;Xq4x(
zsrdPsq+*$l*`-}pW8`lXQSI7HL*x=`pM&BOSX^q2lMAuU7Q4JeSMtr-ZeiE(HCLWI
z0W*Vc31qR8<O6Fl#P~Lz>|Z9doJ1BL_=3x^;4O8K5|#m18$Fy@vG3R02TWg!>L)}!
z7~vsmz)Z-o?0*jjNJmg<!Do!)&jo)P4_Nx93J?`wtYujT)k1ev>H86JN^#M-2-y;L
zcK2^MI-xuv*-W)n6K%FJH(=#>%rg;R&3<+ap~dG~urHapQG_$q$flk63B_5+A5Yb#
z?u8Y1l_hU+VVkUG@2+wQ6AD<w%Xe$k&e%IE>{>RwrGE-^5T!*9mHAKT6r&u~^V^5G
zW1)Sl75G-<1ugO<@^k}ZKJ=a37m*mH?r=^LzC$VSo#^@CcTyMm5jyuhrk5Q1G9e8d
z`W{X!bjr}%{LpU&FKct$->U<JP0#^{QJs~Qe1pmYdPoV)Tmmuy2tMEMp1<8ROF*x!
z>jA>8Mt_Ge>u!7q0_d}cNcRr<=vsXO5PWf|z5&9m`bIE5|Cr>w<oUDYV^!282-w;#
zh9CgD7$O1eBG0IkS+MkCNwo9Gq)usKZ6bP{qq%S}|6f>PlEgJin@wyinnJz|)gGfP
zBx3uy`ETdUicy19Ho2SI=f^I;W4K!puaJ>%p?_q!I%4@Tf=Ea%BTLFOp%<0C^nG6X
z4yBSyGi0vSzFFn@mbf1zmk?@th3<0&zoiGz2bqiMU-JW#pcRUKlCXHqLuMEWIpNs*
zeLadY^x6<xPi5#7K69_Rz@5+}#pln<Ec#aB8m9_Cv$lpyusX$Y>mMhH*3so84Zyu8
zxqt3)ro@J6k~4#`w2hism(v3V0SHKvADNZT?L)MXk-v%@7qwH|+#rJglm9x*vrm&C
zOhH3-GKO~bi@CCEuhEoWce-0i!yo{+WlB#lZ7=&OCir&!kLB>*nQhd1xvLllgYHsh
zL7KbHiWm({>>>rY6rq_boN!tKd!R&id4K+`Q*d^WNiwi|Olx>>j%gui*O*qx@mn+L
zMtsT;vErS7g)oT;u$M2&krVPK_go=n2>H>U@AMV?`p`hjzb_30J^R!^&9`q2<UIP=
zq>_JM)5|*f-1$R*+1~DanXbcAt~fujTYPcN2^^R_Y8@%8L@$nM-35wl&jymL!hf6Z
z&AchenN(joJDeUo)<_QzRV&J@51g4Q(4bur^*meUUNZB1zL+B`qrArIje!-@w4z)+
zujx{j--`m06<=fH*O2vMFZklB?G)|hg!xX<&AsA3FCf@Vhc1q*K-9b#YbfTPf5-0x
z*6q&R;N$(*f8K>RA8&rUTk3=Xbbsz2zl2ZUA3yCbptZaEAFnDmKfZ@wA8zmd*Q?6s
zuMb~$zun!2pYK0@*<D6zck}rD?owJ_Y6-uUD3AF{IP!2aOwdm++lU-e(aB4RSif9}
zy}}XE6RysWjlIxmQU3HLk>dPF<^JM)tcI3fq_a^GLx?a<2!&_Yx%X=B7Jv30gmca!
zEHuv+X7^V`hLRWbzR*H2;j$Jjm)->ESM>@&!FVI^RN<$B&?os(D;x4IKTa|fz}?Q4
zzys3(IOull+nrE_<3Dh6JW&FE0~#H$8aI>!s(wSY^FvohJ^le1upM;B@ds({l|KWA
zs)EI5((8&tKA{#X$;wAGtbc7z59c?+!+nBa`pmOZiMkDB;i+CST<{Mnie@iRyR6UD
zn-m(>l|0H-Y?Jj?ESt)%LKr6P7XMnAuEK;C6%Ki1Di>%Vb*f*RV1`8bZ0f3Xr=s|2
zQC1>Z@Tn?L%y%XGA{M{+C#n*(Pciw8ot<nL^jVl?Ej+QXrJ@66zJJ?H@(|uB>lT%>
zRoLTWvL5-w7k=YwTYb#q=On{6#W}@jZn&ypvc&H0z|9trXI)xyyDef}Qc8N)Qc_W_
zCDdoxl+O1$zw1^^v?-nuz@dD`EQbP`f~_kd%kD+~|GqdLHNm@HtVtCd(wdys=Cn=x
zS|z%9*_p(ss?fXGF@KX*GrjQ)p}+m)+Qee*!L&HWNoAe<yv*&|<l|ixYzXt4jn1Vm
z(iBHDOb+T2>1!eFUOu*EDARX)f~-u=V_mr>sYT*;t|U$(o8&wyLN6#udDq%4RBr*<
zBe{ItAvszSjw}v|lf%Iw`3aGeWpY;fxIz*CQdzEAYZWY>d4El6@iktzT>eT<!n4FT
z$wCxaBxm*<k~+&+;DlL5sv@(sk_?fbVUBW}!pK<+ZmY}F;y9G+NLr+);w6%ptZtp#
z;~PTbf5`otw*BRJS<ls7|MBVTh8?f@k|(0m?9zV_RmUOhuO5P*5a~DkS3f~--zaTj
zbzdU^QVtAw>VMV?TAsSRz2GSa20V4)dM!^~&|C1715>>D+?`iVKC=cnlT!v{nt_!K
z(l_m2SECKoClmK}SKqXMT@CgloJ^{0Rk)GAuLg@cPbO2=d)~<3S3~2|rRxlH&McMH
z8mBOWMfx`9zpwhU3zMnOYxZr#&#Q?A;bszc>&0#OuYarQ#h2#NE6X!&nm?{4-p!vu
zbg%Ajs);OgFY)UEz1OEU?O#{=shK&}U;<~O9JuN?V3U+{)3y;muVgR1ZDPJ&3zy{E
z7?<?4r8O<scspgu`HcD&za@n7AN`fcZ<-FDqcG+6q1I1_%}{hoa=aBePlYXh7_6ej
z7ew1#?|-ghjLW9s=`-ZPZN*&on2QOp56ZPI=9V35whg(8S(d9UZQg@Z%cg%umd!0c
zCLV~!oA!)E$b(@I)MaY|^^20~EI-L-4H(YjLGHSPjT_7P$sE77O+i0Zmz91x-Y@A>
zevtE%TXt^C+t;m}*q+M8^rfS`iJnfJ(x^0_cz-NPG%x3m`11HPyxrDv3Eo^cf;Y#f
z;bP&{C9>Ggc8KK%ua1~ib&TKomDL`VX}<EGS3GVclsP@KHoh>yq7Mxc$a-f7x6Q#V
zr+mSbd+uf@k8u^@$;~zDoefUOytV1cOnT+E#sp@G3ycqlR5SVDr)6H69d5p#8-Wq3
zEq^!-sx79?H(8#W=W}_EShU~6O`Mi2zPH5ox!B6=T^-FTud6XuJ`dlXuf~n9Dn35j
znvOia>5fl;K8WE>j#8HQs*Y$~;d%B%f>ur*-*m^XOgoJQMSVxJ`N2<Z+EZ;~mhdlo
z_?<6wVX~0h<I@G!`e&ED&NUxPobT|T*MICkb{(twRMubr^7HYwn3OB|X<k_DHyJaO
zoDV3>Fw8hx^^7iKy^F@VTmVkya*P~gxd#oE5rZkNce+X6D-)%9HY_G;!i0?yCR`~)
z`>hz-v-;19K{-ucqL{oq$$s-EQG7eRS*&t<dax*~N%TZ>q2_ktw7yN7iM<w>y?+p`
z3(ySup(XBAw>9dfbWP?W{7mGH>eMBgxO?H!rm0tg?<PSwtfskUznS`;sNl)U<68o3
z%XUwIUT*uR8Ux@5H|OiSKvP^D_Ce=tPN04nO6$@5A@nG|Dc`s4i6(3EQGkqevT}R<
z_h0|pARBx(rg=fDKOB&6a>=Mbo_~KrM|?FNCa8rrKC6u@=EocJ(9y`GH!hjDUiAoC
zyf;(H^BR+B*4)l3dcoHzbGyD9%wH)5{@@4h#eu)IX!4%Z6DA3nfOY43`P;QeM~ME-
z(OKm1+R2b?l&Bq(Z?9+B=gS&wJN9p@F&tXj%z#x|^n`_K>nrRR>X6+p)*@d<6)`I3
f!Ch;4!~14#sNDIm{hSSRC*D6%+tB|9-VhqGcaU&{

delta 6191
zcmV+~7|`eMG4?Q!et$`G<2aVb@A?#qsJV5B+2zwj-!g6I66Lf#DQD-zTo@1uNo;c~
z0`yX!ez0%>7my(EsP02m$|UjogTQ+a3rQeE6m9eOe<WF0#(4YpEy|-^m<8lR$j*3Y
zn#8}!bG!fA?l$5e|DPYDcU;(~^lsSCyP6Tih>-2?V~EMLo`3I0X+(WrWCYW57TQn_
zWfX`0sX+PJ4RpfP&vF`NDT@6Z6(}JbNGPIF;D#;mpJi0w5Ex6Mzc4F9pP(d<F>$;7
zD9uaiQ=F2l5GX`x5gkg3t!NY%h-QT|s4X#5Oq8G#zKYQS#}g*5Ts3a)>ILf}z3b?R
z3Im@S2rMKU`hSYEjEyIOh%WUr5K(h4be3D-qwZQp9_%c`YKmZ1aY0suYZhHz;JnBJ
zOo%V80@eD)f2WwP;==>@YHmDKx{N1}>#pz2<GO45^H6bBmmZN@$*YG-B#&9=F08w#
z&Lzm;e(S_hdID{U2XxOzB*%d`N^tSQ4l#@5w!w9eWq%rQuK>Lv&kt})3+8D-k>xAO
zge=;ISg80Y4gF&rttppal**v%lk&iBP>2ZSG%FGmM}Hw9yIvM#D}&#JOS6+1%~n*C
zcG9*pE6EU6bSyws5erd2#)#1M1p7_(N-84_wS^LMUL2gSD1M_8fkL@zJW!|?tc&#a
z^7j+_ZGX^@7|2-hO~&9*O458#8Ah3pW1O&9cVSf)dQuV;QBE(H0kggukeE$(4N!V%
zj}1`Tywe6Gx}e_%rD)W30}?apy)Du5OB%%lHf~C$hsqQ8<;uxPbYj*&*=j7$x3n>N
z;D`||3u$93OZdkkOZ;OLV`#Cu<AvSIiyyj@r++7^R=H}tYSjx2&BdDOg}Ax-$-5pX
z%%gb~COBRLyTtflBn*wuLM%#OFmIJtC@RRRUBS53-#p-6$>3|y-&>sJQNBrk4@$|p
z=LMUAe}}YLrw>R>1RZo@)mpMaJ)g9=jONmgCZP1vjwYbAc}EjSbU{ZGO3|pJ2_$CJ
z(SMxLni-Kd*G$A`ahm-Dgz@|XqO4J>W}FO~YhCB6B?bj+m|3IAj4wfN{vj*V5ET&&
zoHg^T)&)4m>4}~ppxj^TIX5_JoT0Fqg#x+t&fFjbkkwNtW;dk`G~FoY+=AMA^Xrkt
z&^X4i;l$H|e2$}+w2n?X){T_2s#W{stbe+&X>!tA+A6t;nKwv=I;<56A|zy<vS)S|
zF!nycdbjsC{=;Yg`s>5D>)RFc@7+G^{cksGDm?sr;<xhY=k*`APiqQ2e!N-vR@N@6
zpZ9-&Dm?Kq%#jUkaRD5m$H*%L=uw%q<Fi(D&G0-bx>B?p*MbU`+>}|1Qh@X}YJZrw
zFAp8EwF!?BjpsM4*rfW)k3!<p%%@G$0WKwVn1-skhLU_2U=1=(*CLB5?sltP{kJXo
zfQ_rD=)Rv=sn^Bt+;{H_KvOXZP>v-Qj#>>1#bBlko_Qw|zCd_6r}(us^*EY&jbSOC
zM?~zSI6tEUyN56e*5I#GG(EQe8h_EVPf@`evX?AC2cH;CcbiJ`!sme}N<;hxTvTG{
zE;DWRT)`BaGVg!k*6){TREHfHG(il!MxN!&7hx@Qdg`_&ko-YI0;o`xHK)r807L&P
zi_)q<MBYUqfziv<Ia<y=o*eBD$wySe3G#wZIWbq`l`pKTj8XAEnU|3qcz=20P^_46
zbUIT*glP5)-7QpShqqCm2(t8rT#@Qk!U726U9-RUSNofmI_w{IpbKbnK9amAhb$IW
z6=$c2691TL`Y6^y)%%q>&p9x9>6pn$XvsLqT8Mc<-N-D$I$B<x8%tB`C7&C2EC2<F
zx4-W>Chn}s&b>JY2m@!kV}E2AW9^fZ>c+=M(&n5LB_N!+&*Ai>W8k|6eFfotF5~!}
zxpImFio@%tYfDEmVcL6_5gpDhjpbmBRWAo#87tO=YqXjtU!ugHq6CANx&mFJ<U4rq
z(pTx1aIwA~OpO<5>Kr#!hW81hWRFo1oPXTkSNZ+L#`GU4#cBN+%zqN|Sw^?Fqoq2Q
z2DMNI&ayhfYt+rUHKL`<r#VQyg%wmFYWqK<jsb%QML|Z3EWL6aCl5g0W5K_jT569v
zj=c?Pi74c6>74kqhVp$M3_B|+f1p-Rd@k(@54lhE5z8igo(NgOL$<4rn`l^ixB(i@
zzYWEJyt{q;>g?Y`RDb8`uBBBPQ32=03<X{0#|$L^P0CzwHM1HMTsUtgpT_F?u=Ux2
zg*GPw)^b*V03f{U`}^BeZ`56w0c9q<F6S*YAUlBt24g578-iwiudxRKQ>1FD*0rL$
zn0m(7w!$ZAkQFsA1XN+uLZk?MoE)aRH*WaugX5(FA-Qrj5q|~Y-C&$oAE8>B$TZD9
zHq3FSUU9L<!dbL|5R65uLVS!B;5fF3KOIc=>T^rBz&P4wodZi_>?OCiz5!_N(a;i>
zrRnxLKo~faA0xxqc%MA^XlMav^3l)&&dj5s2~vRxUx(!oXTh^|2eAY3<fkwEYg`Ne
z?V<QT)?Jz&D}SRj#wlh%iGBHf1?H7IlXv6zt08c?>=E7b$b<7$=pUmu;aOog@rsTy
z6o}^70(2?f4@~YcwQLTiSb%Y_Xa@oIF03%TPf^HXW+3zSqZzmGsnXlzfSU?hR2EAG
z>>E!DDa*EOxe~itbnsuTg7sp#b&Skh8>abPuI)OGvVT)_8(MWVzubR+x{IDMxa&=U
zfn07<0?q*@WmYo$S<Mv;eo_<E&}Wq{WZ-^K-rV1>X66!q0b{R(E@SeQ*uTN>73B+?
zf2DjeCs6bNUEycCc7MxA0mvZ?wIF(2W>RqOXQsE32bzno;Dl!4pnhmB>E?><b7RMm
z;{en?fPc0eKh6{Feb$6+>7xc{I3F<-gYgOV`K+t83{mQ%UR#SXqCytGxgbmxyk5nw
zMXw;dU+4v2-C;_ti+q}9@1S#BOXr-y!dZrakdsBk86j9R-zCotETB3Z6zpH0ueYD&
z?>;{WL-DTpp<8+6uEGvXNu{bd8rWy0O6y%eU4Pr^)@f%9)|e7xNzNMK_MWU!3r%tk
z8{(9R?^cOe{Yy8|tijk;k&s?mH%%hDN>P%}Jw7xb*w$yu06@UlLYKE73eEB+ALz}d
zo_UO?Nl#e*S$M?O;iCiaJ|PkX`|8kAi=9E)+3_sY+OX!xFy>~W;%<ap6}2hiBc^?l
zWq<Unn@4a%Le%O69H@5n3TxEzv>J46KcX<iVZZwURPP3Gpdzfta@LWo184?<OM{r6
z;$VyuP)*^@qxownx}_-Oxj{iyhpX=N^t<be5cRt#)jP`H`9-6Ju2PrbX5x$sSiU>U
z#;mWX2*um!Q)}S4C{;`Oss+CWUmYT^!GG7=zXMz;l+g~516nB$X!OF^=cu%x>2Ofu
z)mz27$pr;960@7;PKTDk?t)i$HOe%cXb|#)m$Xd$?C>ufP~zvTBnZX%B4gIk@e7Je
z<{luhW0cBmS}Lmc<F19=1ic^lMtD(5`S(7{+&HP@`qDZT|9Fd=1tpnX`0oHf!hd{+
z2x3kuF^HqwkNI$2yhmxzVa{8vS!R{q%9K@rtND(yqV$Lh-ZiyG@d|5q8+XEh);mlq
zG9b#YWtHV;tx@g`PoGGSe#qyfth04~3757^YI0#r*5blP>ngX+f_p5kK~ry}8>Hv9
ze9BAW!eE1&b5>+8nNzLIOoAB@cz>l3z8XHxGZ{gbkY=~~oNnhd+v_c9^E3#c#zsfC
z3ivvhYw(}t+BF0^?D9yUBRM&=3XSm#3)*LjBkd}c1{6|lgeBrXf9MgMQ9%|0XE#He
z_6W^BKubJAgRrw%9n95cXSsGZtHZ*y$vXOSkI<2vJVJ$@is;D7(vPFW-hY6-JkG>+
zhXF0JQ(b75EU`YY*yYX!V%x$fn*i`%OIw$b<UlRU7}?%Kdms?+)G-}Avxl_wn;ym8
zX9O@naZtv5y6zC;($+@XcYOHBc@c^aXcE5evSyOHJwGsZ<rFGumhh-1W*vRPZc8_1
z?Ev&X)<^lI{Js$x_*GxS7Ju&Te?C4w{CK*(@ju>udDv?^s$hb_nSZIsqFy-JRDkKV
z=hwftG7q_-XPS^@rSk~|&)M+^Z3`XjYK7EQS)+LFveS3;23<NTb+y9jh`5zaT=;nw
zM?r+0f}Dc!@LSGj=aF_zc=Ie(U)9D104k4gfL|jvo(Qs(1&@?MK!3CN9qeY+w^7AG
zTWFH|uLa6;w|1tbc;9(7JQg^J2+PSsea){{WU2QU!#(zYR>nN+M>wU#%F4~v>L=u2
zdhBPjm>{cHrCuy57N$p{{Pe|y{ehKloE=a+x$c2+-YRNSgq#lpmZL^>X~yPJt{b@i
z353ftLRkkm3$T1f(|?+h8<!21%K+OE*&v&0%to9VSd2Uxr0HZTetsgUSZrZ(fsVx(
z`5OgPyTVQ%ImbGrwm7+9)#Q!IOLX^EooyDt^j}lu*$yz%YnF-?JMP^xpA;j=a5RFC
zXgP_@JOKrlW8I_JK}uK#Ty1o4Vr8@6Z|*UD&5CD;dN9I6)PI1PkYm{&kC2X_(!9?Y
zho3Y41Rb#SO%)(2z*x(&4vLw8U+5#XIHkDgR3Fq5*1G$59Gp=akz}IUijkOY%=K6~
zp3+40U?xA$gwW!%8F($3seZaM)ySru_z}g4&mRDlx$cz^ca=GBabcUR`t7cA2@~>I
zpOWutr=1gbR)5&nY<No*XfKGf6e{zd&^bgYDyO$uaK}RXSS|29OEa3KQLxet4EfM^
za+d{S9Jt3RiTF;Az;~kOgWpM+r6=gzcbKc>cr6psz@hKq%(_kqdYc~lE#M_}j=Osr
zfUpTVVm~O8ypZoGSwN35p@~a}OaQ#kcl)RB*VR(FOMmOShj6RWKFqoq?}Gr^>^{=H
zfj+rbp8$AYT&k~!aI3xnjL+~zDKB~cwDweFWex(iwu?Rpz%Keo0J}&N>SPuyy;wS`
z9hsCdjjT;Xk8?B^4(9*!3rwQ0L~*s*heasl%k>;EN_--=>6-qS%&ZtSNM$pysr^vw
z@;ijP6@T#p8Tp<^f{PQDultLH<TA2ylkiK*Uiv;SeTP!XB@CHs)$cB?d`sL9qDu%>
ztwQrbz`CUe&<2@{>0hJ+lb{6(o{68mram)_h@5e_`h7i!GF&wfTTf-^6h3pWxxk&!
zD8}svTo!FBaqXuHK(*L}OJ{YA<JLZo60Lieqkl92_a5cC_cJBdkE4_sjHPXq%(|Q&
zFbIH0qV&Y9bZWnrnT-6Er8p~{`pp%>`#<@w!#w*q3BnXKWG7>&mxGupyZRbU`8B7T
zr6mkH;I>TZ38wL~t73w$7sQzF-aE66qL;ghac9t7%B+*-uCt(z1}1iq0-WoinJb)e
zoPPs*phPx#{@N%wJIE***geKIR&b7SA!yeaS4r_(HR(pylp!dYd43C{;71_=_VQUd
zaz^XPJr#%<LV8-yce)De`cO}6eP8McuIy7iwY7b#C%2-HjVi70YkFBHpKD*WpKR^g
z%XAH%az*>ZZuZ4BC$MMosCA&Q5IsAlb$=Jgk^>t^vI?)h=vqxl&ZMrTv&Zpq#Tx10
zp=w2$^?@@}1?tsHgtoI)?j<wL=c^mCGD=IV-WXUhjVsFK<f<lR{=Fz5S@FFye)U-^
z_JS|2T2IklPMGhgTiq-E^8$j^bm;833Pf!cWA(+{^B?$~z`9+_^*-Kx`{%8H{eSWL
z>+M`444`xO@Wp@p@$hMX0j>S*|E#KV{qu+a?f&NWe^*uc{O$hR{_E|H|M~9Ym;Gg=
z_SX+TZZD;^N-g2H9Hk*&YepWfh6(!VWgC%WEE;(!5$YENu~#@Ddd5Zj*mxB>&GP59
zBx0PNsN9E{kJZrpi*z<BVhG{K5r3iZ>@r=wnwyobd)+x_5!N+NW@h&n^$aD?>wKYw
zV7kj%wA?rvpk37~0CmPIfyV+rW`sV<&qmphcm8pbp#W}n00bVG_P}1Vv)TTP3LO5z
z(dkSH_zh@uz-ru34ygJK)!K)yj(Yq9GGIGski!qs+$(<q4pjxS&!m?XhktxRE!Jw4
zk7!tIj*smd;r<~)Fl}b5G_&)(8+DZoXZ(YTtlBftF6$HZCWZQSC696y+hm<J!N#(y
z5c)}*<+T>3D=?v1fqmXHl}jLyGS+|nKS82=Hg!?DbCx|@l$A*4eJU~(^4*)hh~*{z
ziHZmvVobiWv!j7QpM^=*%zqOLTPiwI=DXD-58;inZrL_lg#$iC%aM<KX*Irj)W<Y@
ziV|#7oMVjYhKmv=OYH8B+-w1P)}^%<&kcxmNh#@FOG!n!mQa^vQ#wD&^tM@((583>
z0EhA!vK$I%47RL<ESnek|GVsT(sbVSVpS^d7?<R{G^cgq*CNu*%YRNJMn!?%#m<7X
zm}reB2;FV^mL?Xf`?V{<E=@k%c)*4*y{qC>>MV|NK>g^bt|Gn=!h4Hy-As$b^=v~J
z1vbffzXH9WDCUh*vzWRC<iy(HFghL`lAjSdTPCl%M&j$SW&!nu9OgZR*yRXOWRX11
zPChA<gf;Y-Wu(Xw+kZMq5P9}fl-g89%KD79x;!loeYvurMS3b;dI-tlXi^{F5*q$P
zZosqaF3`#%ZFBv{$8TG9yyQ!Ch#=pj{~)T4L)c#(1V16tZ~3oog3iW2+QjO{Gy<d?
z=<(FW__aKB!E?b=4)l2HQs!Eoy2P{KDF?=Q)46Nc(QR41oPWt7E*WQFW#i**{nuu&
zG4g2Q&aTPZ`marIL%GqU%3gC@`Fqn_=65uivI6i{{@(PBPnWJS%qg=}*6$m`^p<Vg
zwtsKBqv6ri?J90t@pCh>fZ0UCW_`0Q|Fs!kENCjdvYgPi`eQTlF8KtadDVPdjAWsC
z>0A%!yzaBD|9{%(rxK=Ey$Oe{a$wU9V55{av~9)D4J(slblO#2oKA#`(p`vidfw5J
z4fG=vv*dgRc!%F2LivyG+SJzqwG}8#xqYbh(_j-6oTC))M9yPjiywNcKJf*-_E-B&
zh;d#8o-RWk+!f4qPpO!&`Jh}|V{X`?Y9onF$g*7QXn*zImRdI5GqP-M_%ZPSFWlB=
zBtjnaJD?_8BdFh$RIU6dp9L_ShP~W12P-$0^Jyu5twTXKRg;x&I^HhnQ+|;1X*+gq
z$K&fxPQ;GoV*JuU-b70$PH9xCPZDM&s+Y+Je0h8vUhhjd2d}Ohz^miqaIqBU99ir~
z+Q;&Pn|~8#RUP8DZe`U+WtwmN=Z5zi31v>ttc`z2KkGxi1hU@Q!CiH5$0=Vh<(|9U
z%VS(ccye`(dS|^;GH-QyGLc@nts#L~;tb;hBE>{L_-UD!YR{7&Z4els>Vngt>SEe{
zm*u&AYRhxLqTLp5<g{e*-3E3~*-mC}b26*Erhmp*`P_eh+6;rQDn2}0n~prbZH|wC
zKCq!2E>aY;yccCa%K}fcM-tR>^7ytnzA<eyW)$@e&GsihwXILp!7SomqVPMPX~JY7
z*T=^TtoF|)dyQ*8<T%~qKd;z->^fHUv8=!D<?Zphn3OB|X<k_DHyJXNocAcqFw8hR
z^?!^mW1WkJxtsxx=5mPaWw`_Ol@Ws}u5-Fd-zgKNdbX@jRCN=!N;hF6Oc@1y(X5?#
z^1<pq$$I59dWmB4@+AAspPcXw(k8LW?didytVYoz;X=*r$Z35{o9KJZFgsnerh{hC
z4$X1Lnyo=Ir3;y}@RrDf>ewZke)r6!Rez{gI^R_Szh6yLVZWNH9jV~a%HxZ~@A7(;
z_)c!Srz!*B2e<9@O-EB)?RP<KHb+pu^`-S_5sh~!4SDB0%DY3;;n^yuvPodax7G0q
zBpxoRpf;Q1sNY61Fis!ohUM?O`b3j2KEp0MWJ$ie`up$yZBSZ#(x`gxsXJ<sFMmkM
z&Wk+%h)#Gj9L=bOHax5C{!9;xrlErYRA=}!a=q%fG<)~uHpbH$qiL4h&MSJsS22qY
zU2mPfQVRUy2kyjyztw2+p3*ZW5gCCs=Q{b@*GC74?#<CjWdGXHp5q`<J$10Vnq;?^
zRoHrpqOL~2Z)p?bYH86U7OJf;zbIR%eRj84e;ZW9pqzVmt>yLao4KKK=lw80*&82u
NtwRm<{|^A1=fYtFPmllr

diff --git a/docs/html/searchindex.js b/docs/html/searchindex.js
index ede573462..8763e5a48 100644
--- a/docs/html/searchindex.js
+++ b/docs/html/searchindex.js
@@ -1 +1 @@
-Search.setIndex({docnames:["api-docs/data","api-docs/data.image2label","api-docs/data.speech2text","api-docs/data.text2speech","api-docs/data.text2text","api-docs/decoders","api-docs/encoders","api-docs/losses","api-docs/models","api-docs/modules","api-docs/optimizers","api-docs/parts","api-docs/parts.cnns","api-docs/parts.convs2s","api-docs/parts.rnns","api-docs/parts.tacotron","api-docs/parts.transformer","api-docs/utils","distr-training","extending","extending/adding-new-data-layer","extending/adding-new-decoder","extending/adding-new-encoder","extending/adding-new-loss","getting-started","getting-started/asr","getting-started/nmt","getting-started/tts","in-depth-tutorials","in-depth-tutorials/internal-structure","in-depth-tutorials/using-existing-models","index","installation","installation-instructions","interactive-infer-demos","machine-translation","machine-translation/convs2s","machine-translation/get_started_nmt","machine-translation/gnmt","machine-translation/transformer","mixed-precision","models-and-recipes","speech-recognition","speech-recognition/deepspeech2","speech-recognition/get_started_toy_model","speech-recognition/wave2letter","speech-synthesis","speech-synthesis/get_started_tts","speech-synthesis/tacotron-2"],envversion:53,filenames:["api-docs/data.rst","api-docs/data.image2label.rst","api-docs/data.speech2text.rst","api-docs/data.text2speech.rst","api-docs/data.text2text.rst","api-docs/decoders.rst","api-docs/encoders.rst","api-docs/losses.rst","api-docs/models.rst","api-docs/modules.rst","api-docs/optimizers.rst","api-docs/parts.rst","api-docs/parts.cnns.rst","api-docs/parts.convs2s.rst","api-docs/parts.rnns.rst","api-docs/parts.tacotron.rst","api-docs/parts.transformer.rst","api-docs/utils.rst","distr-training.rst","extending.rst","extending/adding-new-data-layer.rst","extending/adding-new-decoder.rst","extending/adding-new-encoder.rst","extending/adding-new-loss.rst","getting-started.rst","getting-started/asr.rst","getting-started/nmt.rst","getting-started/tts.rst","in-depth-tutorials.rst","in-depth-tutorials/internal-structure.rst","in-depth-tutorials/using-existing-models.rst","index.rst","installation.rst","installation-instructions.rst","interactive-infer-demos.rst","machine-translation.rst","machine-translation/convs2s.rst","machine-translation/get_started_nmt.rst","machine-translation/gnmt.rst","machine-translation/transformer.rst","mixed-precision.rst","models-and-recipes.rst","speech-recognition.rst","speech-recognition/deepspeech2.rst","speech-recognition/get_started_toy_model.rst","speech-recognition/wave2letter.rst","speech-synthesis.rst","speech-synthesis/get_started_tts.rst","speech-synthesis/tacotron-2.rst"],objects:{"":{data:[0,0,0,"-"],decoders:[5,0,0,"-"],encoders:[6,0,0,"-"],losses:[7,0,0,"-"],models:[8,0,0,"-"],optimizers:[10,0,0,"-"],parts:[11,0,0,"-"],utils:[17,0,0,"-"]},"data.data_layer":{DataLayer:[0,1,1,""]},"data.data_layer.DataLayer":{__init__:[0,2,1,""],build_graph:[0,2,1,""],get_optional_params:[0,3,1,""],get_required_params:[0,3,1,""],get_size_in_samples:[0,2,1,""],input_tensors:[0,4,1,""],iterator:[0,4,1,""],params:[0,4,1,""]},"data.image2label":{image2label:[1,0,0,"-"],imagenet_preprocessing:[1,0,0,"-"]},"data.image2label.image2label":{CifarDataLayer:[1,1,1,""],ImagenetDataLayer:[1,1,1,""]},"data.image2label.image2label.CifarDataLayer":{build_graph:[1,2,1,""],get_optional_params:[1,3,1,""],get_required_params:[1,3,1,""],get_size_in_samples:[1,2,1,""],input_tensors:[1,4,1,""],iterator:[1,4,1,""],parse_record:[1,2,1,""],preprocess_image:[1,2,1,""]},"data.image2label.image2label.ImagenetDataLayer":{build_graph:[1,2,1,""],get_optional_params:[1,3,1,""],get_required_params:[1,3,1,""],get_size_in_samples:[1,2,1,""],input_tensors:[1,4,1,""],iterator:[1,4,1,""],split_data:[1,2,1,""]},"data.image2label.imagenet_preprocessing":{_aspect_preserving_resize:[1,5,1,""],_central_crop:[1,5,1,""],_decode_crop_and_flip:[1,5,1,""],_mean_image_subtraction_and_normalization:[1,5,1,""],_parse_example_proto:[1,5,1,""],_resize_image:[1,5,1,""],_smallest_size_at_least:[1,5,1,""],parse_record:[1,5,1,""],preprocess_image:[1,5,1,""]},"data.speech2text":{speech2text:[2,0,0,"-"],speech_utils:[2,0,0,"-"]},"data.speech2text.speech2text":{Speech2TextDataLayer:[2,1,1,""]},"data.speech2text.speech2text.Speech2TextDataLayer":{__init__:[2,2,1,""],_parse_audio_element:[2,2,1,""],_parse_audio_transcript_element:[2,2,1,""],build_graph:[2,2,1,""],get_optional_params:[2,3,1,""],get_required_params:[2,3,1,""],get_size_in_samples:[2,2,1,""],input_tensors:[2,4,1,""],iterator:[2,4,1,""],split_data:[2,2,1,""]},"data.speech2text.speech_utils":{augment_audio_signal:[2,5,1,""],get_speech_features:[2,5,1,""],get_speech_features_from_file:[2,5,1,""],normalize_signal:[2,5,1,""]},"data.text2speech":{speech_utils:[3,0,0,"-"],text2speech:[3,0,0,"-"]},"data.text2speech.speech_utils":{denormalize:[3,5,1,""],get_mel:[3,5,1,""],get_speech_features:[3,5,1,""],get_speech_features_from_file:[3,5,1,""],inverse_mel:[3,5,1,""],normalize:[3,5,1,""]},"data.text2speech.text2speech":{Text2SpeechDataLayer:[3,1,1,""]},"data.text2speech.text2speech.Text2SpeechDataLayer":{__init__:[3,2,1,""],_parse_audio_transcript_element:[3,2,1,""],_parse_transcript_element:[3,2,1,""],build_graph:[3,2,1,""],get_magnitude_spec:[3,2,1,""],get_optional_params:[3,3,1,""],get_required_params:[3,3,1,""],get_size_in_samples:[3,2,1,""],input_tensors:[3,4,1,""],iterator:[3,4,1,""],split_data:[3,2,1,""]},"data.text2text":{t2t:[4,0,0,"-"],text2text:[4,0,0,"-"],tokenizer:[4,0,0,"-"]},"data.text2text.t2t":{_batch_examples:[4,5,1,""],_create_min_max_boundaries:[4,5,1,""],_filter_max_length:[4,5,1,""],_get_example_length:[4,5,1,""],_load_records:[4,5,1,""],_parse_example:[4,5,1,""],_read_and_batch_from_files:[4,5,1,""]},"data.text2text.text2text":{ParallelTextDataLayer:[4,1,1,""],SpecialTextTokens:[4,1,1,""],TransformerDataLayer:[4,1,1,""]},"data.text2text.text2text.ParallelTextDataLayer":{build_graph:[4,2,1,""],get_optional_params:[4,3,1,""],get_required_params:[4,3,1,""],get_size_in_samples:[4,2,1,""],input_tensors:[4,4,1,""],iterator:[4,4,1,""]},"data.text2text.text2text.SpecialTextTokens":{END_OF_CHOICE:[4,4,1,""],EOS_ID:[4,4,1,""],OUT_OF_BUCKET:[4,4,1,""],PAD_ID:[4,4,1,""],S_ID:[4,4,1,""],UNK_ID:[4,4,1,""]},"data.text2text.text2text.TransformerDataLayer":{build_graph:[4,2,1,""],get_optional_params:[4,3,1,""],get_required_params:[4,3,1,""],input_tensors:[4,4,1,""],iterator:[4,4,1,""]},"data.text2text.tokenizer":{Subtokenizer:[4,1,1,""],_count_and_gen_subtokens:[4,5,1,""],_count_tokens:[4,5,1,""],_escape_token:[4,5,1,""],_filter_and_bucket_subtokens:[4,5,1,""],_gen_new_subtoken_list:[4,5,1,""],_generate_alphabet_dict:[4,5,1,""],_generate_subtokens:[4,5,1,""],_generate_subtokens_with_target_vocab_size:[4,5,1,""],_list_to_index_dict:[4,5,1,""],_load_vocab_file:[4,5,1,""],_native_to_unicode:[4,5,1,""],_save_vocab_file:[4,5,1,""],_split_string_to_tokens:[4,5,1,""],_split_token_to_subtokens:[4,5,1,""],_unicode_to_native:[4,5,1,""],join_tokens_to_string:[4,5,1,""],unescape_token:[4,5,1,""]},"data.text2text.tokenizer.Subtokenizer":{__init__:[4,2,1,""],_subtoken_ids_to_tokens:[4,2,1,""],_token_to_subtoken_ids:[4,2,1,""],decode:[4,2,1,""],encode:[4,2,1,""],init_from_files:[4,3,1,""]},"data.utils":{load_pre_existing_vocabulary:[0,5,1,""],pad_vocab_to_eight:[0,5,1,""]},"decoders.convs2s_decoder":{ConvS2SDecoder:[5,1,1,""]},"decoders.convs2s_decoder.ConvS2SDecoder":{_get_symbols_to_logits_fn:[5,2,1,""],decode_pass:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""],predict:[5,2,1,""]},"decoders.decoder":{Decoder:[5,1,1,""]},"decoders.decoder.Decoder":{__init__:[5,2,1,""],_cast_types:[5,2,1,""],_decode:[5,2,1,""],decode:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""],mode:[5,4,1,""],name:[5,4,1,""],params:[5,4,1,""]},"decoders.fc_decoders":{FullyConnectedCTCDecoder:[5,1,1,""],FullyConnectedDecoder:[5,1,1,""],FullyConnectedTimeDecoder:[5,1,1,""]},"decoders.fc_decoders.FullyConnectedCTCDecoder":{__init__:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""]},"decoders.fc_decoders.FullyConnectedDecoder":{__init__:[5,2,1,""],_decode:[5,2,1,""],get_required_params:[5,3,1,""]},"decoders.fc_decoders.FullyConnectedTimeDecoder":{__init__:[5,2,1,""],_decode:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""]},"decoders.rnn_decoders":{BeamSearchRNNDecoderWithAttention:[5,1,1,""],RNNDecoderWithAttention:[5,1,1,""]},"decoders.rnn_decoders.BeamSearchRNNDecoderWithAttention":{__init__:[5,2,1,""],_decode:[5,2,1,""],get_optional_params:[5,3,1,""]},"decoders.rnn_decoders.RNNDecoderWithAttention":{__init__:[5,2,1,""],_build_attention:[5,2,1,""],_decode:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""]},"decoders.tacotron2_decoder":{Prenet:[5,1,1,""],Tacotron2Decoder:[5,1,1,""]},"decoders.tacotron2_decoder.Prenet":{__init__:[5,2,1,""],add_regularization:[5,2,1,""],output_size:[5,4,1,""]},"decoders.tacotron2_decoder.Tacotron2Decoder":{__init__:[5,2,1,""],_build_attention:[5,2,1,""],_decode:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""]},"decoders.transformer_decoder":{TransformerDecoder:[5,1,1,""]},"decoders.transformer_decoder.TransformerDecoder":{_get_symbols_to_logits_fn:[5,2,1,""],decode_pass:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""],predict:[5,2,1,""]},"encoders.cnn_encoder":{CNNEncoder:[6,1,1,""],build_layer:[6,5,1,""]},"encoders.cnn_encoder.CNNEncoder":{__init__:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"encoders.convs2s_encoder":{ConvS2SEncoder:[6,1,1,""]},"encoders.convs2s_encoder.ConvS2SEncoder":{get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.ds2_encoder":{DeepSpeech2Encoder:[6,1,1,""],rnn_cell:[6,5,1,""],row_conv:[6,5,1,""]},"encoders.ds2_encoder.DeepSpeech2Encoder":{__init__:[6,2,1,""],_encode:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"encoders.encoder":{Encoder:[6,1,1,""]},"encoders.encoder.Encoder":{__init__:[6,2,1,""],_cast_types:[6,2,1,""],_encode:[6,2,1,""],encode:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],mode:[6,4,1,""],name:[6,4,1,""],params:[6,4,1,""]},"encoders.resnet_blocks":{batch_norm:[6,5,1,""],block_layer:[6,5,1,""],bottleneck_block_v1:[6,5,1,""],bottleneck_block_v2:[6,5,1,""],building_block_v1:[6,5,1,""],building_block_v2:[6,5,1,""],conv2d_fixed_padding:[6,5,1,""],fixed_padding:[6,5,1,""]},"encoders.resnet_encoder":{ResNetEncoder:[6,1,1,""]},"encoders.resnet_encoder.ResNetEncoder":{get_optional_params:[6,3,1,""]},"encoders.rnn_encoders":{BidirectionalRNNEncoderWithEmbedding:[6,1,1,""],GNMTLikeEncoderWithEmbedding:[6,1,1,""],GNMTLikeEncoderWithEmbedding_cuDNN:[6,1,1,""],UnidirectionalRNNEncoderWithEmbedding:[6,1,1,""]},"encoders.rnn_encoders.BidirectionalRNNEncoderWithEmbedding":{__init__:[6,2,1,""],_encode:[6,2,1,""],enc_emb_w:[6,4,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.rnn_encoders.GNMTLikeEncoderWithEmbedding":{__init__:[6,2,1,""],enc_emb_w:[6,4,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.rnn_encoders.GNMTLikeEncoderWithEmbedding_cuDNN":{__init__:[6,2,1,""],enc_emb_w:[6,4,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.rnn_encoders.UnidirectionalRNNEncoderWithEmbedding":{__init__:[6,2,1,""],_encode:[6,2,1,""],enc_emb_w:[6,4,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.tacotron2_encoder":{Tacotron2Encoder:[6,1,1,""]},"encoders.tacotron2_encoder.Tacotron2Encoder":{__init__:[6,2,1,""],_encode:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"encoders.transformer_encoder":{TransformerEncoder:[6,1,1,""]},"encoders.transformer_encoder.TransformerEncoder":{get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"encoders.w2l_encoder":{Wave2LetterEncoder:[6,1,1,""]},"encoders.w2l_encoder.Wave2LetterEncoder":{__init__:[6,2,1,""],_encode:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"losses.cross_entropy_loss":{CrossEntropyLoss:[7,1,1,""]},"losses.ctc_loss":{CTCLoss:[7,1,1,""],dense_to_sparse:[7,5,1,""]},"losses.ctc_loss.CTCLoss":{__init__:[7,2,1,""],_compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""]},"losses.loss":{Loss:[7,1,1,""]},"losses.loss.Loss":{__init__:[7,2,1,""],_cast_types:[7,2,1,""],_compute_loss:[7,2,1,""],compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""],get_required_params:[7,3,1,""],name:[7,4,1,""],params:[7,4,1,""]},"losses.sequence_loss":{BasicSequenceLoss:[7,1,1,""],CrossEntropyWithSmoothing:[7,1,1,""],PaddedCrossEntropyLossWithSmoothing:[7,1,1,""]},"losses.sequence_loss.BasicSequenceLoss":{__init__:[7,2,1,""],_compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""],get_required_params:[7,3,1,""]},"losses.sequence_loss.CrossEntropyWithSmoothing":{__init__:[7,2,1,""],_compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""],get_required_params:[7,3,1,""]},"losses.sequence_loss.PaddedCrossEntropyLossWithSmoothing":{get_optional_params:[7,3,1,""]},"losses.tacotron_loss":{TacotronLoss:[7,1,1,""]},"losses.tacotron_loss.TacotronLoss":{_compute_loss:[7,2,1,""],get_optional_params:[7,2,1,""]},"models.encoder_decoder":{EncoderDecoderModel:[8,1,1,""]},"models.encoder_decoder.EncoderDecoderModel":{__init__:[8,2,1,""],_build_forward_pass_graph:[8,2,1,""],_create_decoder:[8,2,1,""],_create_encoder:[8,2,1,""],_create_loss:[8,2,1,""],decoder:[8,4,1,""],encoder:[8,4,1,""],get_optional_params:[8,3,1,""],get_required_params:[8,3,1,""],loss_computator:[8,4,1,""]},"models.image2label":{Image2Label:[8,1,1,""]},"models.image2label.Image2Label":{_get_num_objects_per_step:[8,2,1,""],evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],maybe_print_logs:[8,2,1,""]},"models.model":{Model:[8,1,1,""]},"models.model.Model":{__init__:[8,2,1,""],_build_forward_pass_graph:[8,2,1,""],_get_num_objects_per_step:[8,2,1,""],clip_last_batch:[8,2,1,""],compile:[8,2,1,""],evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],finalize_inference:[8,2,1,""],get_data_layer:[8,2,1,""],get_num_objects_per_step:[8,2,1,""],get_optional_params:[8,3,1,""],get_output_tensors:[8,2,1,""],get_required_params:[8,3,1,""],get_tf_dtype:[8,2,1,""],hvd:[8,4,1,""],infer:[8,2,1,""],last_step:[8,4,1,""],maybe_print_logs:[8,2,1,""],mode:[8,4,1,""],num_gpus:[8,4,1,""],on_horovod:[8,4,1,""],params:[8,4,1,""],steps_in_epoch:[8,4,1,""]},"models.speech2text":{Speech2Text:[8,1,1,""],levenshtein:[8,5,1,""],sparse_tensor_to_chars:[8,5,1,""]},"models.speech2text.Speech2Text":{_get_num_objects_per_step:[8,2,1,""],evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],finalize_inference:[8,2,1,""],infer:[8,2,1,""],maybe_print_logs:[8,2,1,""]},"models.text2speech":{Text2Speech:[8,1,1,""],griffin_lim:[8,5,1,""],plot_spectrograms:[8,5,1,""],save_audio:[8,5,1,""]},"models.text2speech.Text2Speech":{evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],finalize_inference:[8,2,1,""],get_required_params:[8,3,1,""],infer:[8,2,1,""],maybe_print_logs:[8,2,1,""]},"models.text2text":{Text2Text:[8,1,1,""],calculate_bleu:[8,5,1,""],transform_for_bleu:[8,5,1,""]},"models.text2text.Text2Text":{_get_num_objects_per_step:[8,2,1,""],evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],finalize_inference:[8,2,1,""],infer:[8,2,1,""],maybe_print_logs:[8,2,1,""]},"optimizers.automatic_loss_scaler":{AutomaticLossScaler:[10,1,1,""],BackoffScaler:[10,1,1,""],LogMaxScaler:[10,1,1,""]},"optimizers.automatic_loss_scaler.AutomaticLossScaler":{SUPPORTED_ALGOS:[10,4,1,""],check_grads:[10,3,1,""],loss_scale:[10,4,1,""],update_op:[10,2,1,""]},"optimizers.automatic_loss_scaler.BackoffScaler":{loss_scale:[10,4,1,""],update_op:[10,2,1,""]},"optimizers.automatic_loss_scaler.LogMaxScaler":{loss_scale:[10,4,1,""],update_op:[10,2,1,""]},"optimizers.lr_policies":{exp_decay:[10,5,1,""],fixed_lr:[10,5,1,""],piecewise_constant:[10,5,1,""],poly_decay:[10,5,1,""],transformer_policy:[10,5,1,""]},"optimizers.mp_wrapper":{MixedPrecisionOptimizerWrapper:[10,1,1,""],mp_regularizer_wrapper:[10,5,1,""]},"optimizers.mp_wrapper.MixedPrecisionOptimizerWrapper":{apply_gradients:[10,2,1,""],compute_gradients:[10,2,1,""]},"optimizers.optimizers":{_clip_by_global_norm:[10,5,1,""],_clip_gradients_by_norm:[10,5,1,""],get_regularization_loss:[10,5,1,""],optimize_loss:[10,5,1,""],post_process_gradients:[10,5,1,""],reduce_gradients:[10,5,1,""]},"parts.cnns":{conv_blocks:[12,0,0,"-"]},"parts.cnns.conv_blocks":{conv_actv:[12,5,1,""],conv_bn_actv:[12,5,1,""]},"parts.convs2s":{attention_wn_layer:[13,0,0,"-"],conv_wn_layer:[13,0,0,"-"],ffn_wn_layer:[13,0,0,"-"]},"parts.convs2s.attention_wn_layer":{AttentionLayerNormalized:[13,1,1,""]},"parts.convs2s.attention_wn_layer.AttentionLayerNormalized":{__init__:[13,2,1,""],call:[13,2,1,""]},"parts.convs2s.conv_wn_layer":{Conv1DNetworkNormalized:[13,1,1,""]},"parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized":{__init__:[13,2,1,""],call:[13,2,1,""]},"parts.convs2s.ffn_wn_layer":{FeedFowardNetworkNormalized:[13,1,1,""]},"parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized":{__init__:[13,2,1,""],call:[13,2,1,""]},"parts.rnns":{attention_wrapper:[14,0,0,"-"],flstm:[14,0,0,"-"],glstm:[14,0,0,"-"],gnmt:[14,0,0,"-"],rnn_beam_search_decoder:[14,0,0,"-"],slstm:[14,0,0,"-"],utils:[14,0,0,"-"],zoneout:[14,0,0,"-"]},"parts.rnns.attention_wrapper":{AttentionMechanism:[14,1,1,""],AttentionWrapper:[14,1,1,""],AttentionWrapperState:[14,1,1,""],BahdanauAttention:[14,1,1,""],BahdanauMonotonicAttention:[14,1,1,""],LocationSensitiveAttention:[14,1,1,""],LuongAttention:[14,1,1,""],LuongMonotonicAttention:[14,1,1,""],hardmax:[14,5,1,""],monotonic_attention:[14,5,1,""],safe_cumprod:[14,5,1,""]},"parts.rnns.attention_wrapper.AttentionMechanism":{alignments_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.rnns.attention_wrapper.AttentionWrapper":{__init__:[14,2,1,""],_item_or_tuple:[14,2,1,""],call:[14,2,1,""],output_size:[14,4,1,""],state_size:[14,4,1,""],zero_state:[14,2,1,""]},"parts.rnns.attention_wrapper.AttentionWrapperState":{clone:[14,2,1,""]},"parts.rnns.attention_wrapper.BahdanauAttention":{__init__:[14,2,1,""]},"parts.rnns.attention_wrapper.BahdanauMonotonicAttention":{__init__:[14,2,1,""]},"parts.rnns.attention_wrapper.LocationSensitiveAttention":{__init__:[14,2,1,""]},"parts.rnns.attention_wrapper.LuongAttention":{__init__:[14,2,1,""]},"parts.rnns.attention_wrapper.LuongMonotonicAttention":{__init__:[14,2,1,""]},"parts.rnns.flstm":{FLSTMCell:[14,1,1,""]},"parts.rnns.flstm.FLSTMCell":{__init__:[14,2,1,""],call:[14,2,1,""],output_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.rnns.glstm":{GLSTMCell:[14,1,1,""]},"parts.rnns.glstm.GLSTMCell":{__init__:[14,2,1,""],_get_input_for_group:[14,2,1,""],call:[14,2,1,""],output_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.rnns.gnmt":{GNMTAttentionMultiCell:[14,1,1,""],gnmt_residual_fn:[14,5,1,""]},"parts.rnns.gnmt.GNMTAttentionMultiCell":{__init__:[14,2,1,""]},"parts.rnns.rnn_beam_search_decoder":{BeamSearchDecoder:[14,1,1,""],BeamSearchDecoderOutput:[14,1,1,""],BeamSearchDecoderState:[14,1,1,""],FinalBeamSearchDecoderOutput:[14,1,1,""],tile_batch:[14,5,1,""]},"parts.rnns.rnn_beam_search_decoder.BeamSearchDecoder":{__init__:[14,2,1,""],_maybe_merge_batch_beams:[14,2,1,""],_maybe_split_batch_beams:[14,2,1,""],_merge_batch_beams:[14,2,1,""],_split_batch_beams:[14,2,1,""],batch_size:[14,4,1,""],finalize:[14,2,1,""],initialize:[14,2,1,""],output_dtype:[14,4,1,""],output_size:[14,4,1,""],step:[14,2,1,""],tracks_own_finished:[14,4,1,""]},"parts.rnns.slstm":{BasicSLSTMCell:[14,1,1,""],_linear:[14,5,1,""]},"parts.rnns.slstm.BasicSLSTMCell":{__init__:[14,2,1,""],call:[14,2,1,""],output_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.rnns.utils":{single_cell:[14,5,1,""]},"parts.rnns.zoneout":{ZoneoutWrapper:[14,1,1,""]},"parts.rnns.zoneout.ZoneoutWrapper":{output_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.tacotron":{tacotron_decoder:[15,0,0,"-"],tacotron_helper:[15,0,0,"-"]},"parts.tacotron.tacotron_decoder":{BasicDecoderOutput:[15,1,1,""],TacotronDecoder:[15,1,1,""]},"parts.tacotron.tacotron_decoder.TacotronDecoder":{__init__:[15,2,1,""],batch_size:[15,4,1,""],initialize:[15,2,1,""],output_dtype:[15,4,1,""],output_size:[15,4,1,""],step:[15,2,1,""]},"parts.tacotron.tacotron_helper":{TacotronHelper:[15,1,1,""],TacotronTrainingHelper:[15,1,1,""]},"parts.tacotron.tacotron_helper.TacotronHelper":{__init__:[15,2,1,""],batch_size:[15,4,1,""],initialize:[15,2,1,""],next_inputs:[15,2,1,""],sample:[15,2,1,""],sample_ids_dtype:[15,4,1,""],sample_ids_shape:[15,4,1,""]},"parts.tacotron.tacotron_helper.TacotronTrainingHelper":{__init__:[15,2,1,""],batch_size:[15,4,1,""],initialize:[15,2,1,""],next_inputs:[15,2,1,""],sample:[15,2,1,""],sample_ids_dtype:[15,4,1,""],sample_ids_shape:[15,4,1,""]},"parts.transformer":{attention_layer:[16,0,0,"-"],beam_search:[16,0,0,"-"],common:[16,0,0,"-"],embedding_layer:[16,0,0,"-"],ffn_layer:[16,0,0,"-"],utils:[16,0,0,"-"]},"parts.transformer.attention_layer":{Attention:[16,1,1,""],SelfAttention:[16,1,1,""]},"parts.transformer.attention_layer.Attention":{call:[16,2,1,""],combine_heads:[16,2,1,""],split_heads:[16,2,1,""]},"parts.transformer.attention_layer.SelfAttention":{call:[16,2,1,""]},"parts.transformer.beam_search":{SequenceBeamSearch:[16,1,1,""],_StateKeys:[16,1,1,""],_expand_to_beam_size:[16,5,1,""],_flatten_beam_dim:[16,5,1,""],_gather_beams:[16,5,1,""],_gather_topk_beams:[16,5,1,""],_length_normalization:[16,5,1,""],_shape_list:[16,5,1,""],_unflatten_beam_dim:[16,5,1,""],sequence_beam_search:[16,5,1,""]},"parts.transformer.beam_search.SequenceBeamSearch":{_continue_search:[16,2,1,""],_create_initial_state:[16,2,1,""],_get_new_alive_state:[16,2,1,""],_get_new_finished_state:[16,2,1,""],_grow_alive_seq:[16,2,1,""],_search_step:[16,2,1,""],search:[16,2,1,""]},"parts.transformer.beam_search._StateKeys":{ALIVE_CACHE:[16,4,1,""],ALIVE_LOG_PROBS:[16,4,1,""],ALIVE_SEQ:[16,4,1,""],CUR_INDEX:[16,4,1,""],FINISHED_FLAGS:[16,4,1,""],FINISHED_SCORES:[16,4,1,""],FINISHED_SEQ:[16,4,1,""]},"parts.transformer.common":{LayerNormalization:[16,1,1,""],PrePostProcessingWrapper:[16,1,1,""]},"parts.transformer.common.LayerNormalization":{build:[16,2,1,""],call:[16,2,1,""]},"parts.transformer.embedding_layer":{EmbeddingSharedWeights:[16,1,1,""]},"parts.transformer.embedding_layer.EmbeddingSharedWeights":{build:[16,2,1,""],call:[16,2,1,""],linear:[16,2,1,""]},"parts.transformer.ffn_layer":{FeedFowardNetwork:[16,1,1,""]},"parts.transformer.ffn_layer.FeedFowardNetwork":{call:[16,2,1,""]},"parts.transformer.utils":{get_decoder_self_attention_bias:[16,5,1,""],get_padding:[16,5,1,""],get_padding_bias:[16,5,1,""],get_position_encoding:[16,5,1,""]},"utils.funcs":{evaluate:[17,5,1,""],infer:[17,5,1,""],restore_and_get_results:[17,5,1,""],train:[17,5,1,""]},"utils.hooks":{BroadcastGlobalVariablesHook:[17,1,1,""],PrintLossAndTimeHook:[17,1,1,""],PrintSamplesHook:[17,1,1,""],RunEvaluationHook:[17,1,1,""]},"utils.hooks.BroadcastGlobalVariablesHook":{__init__:[17,2,1,""],after_create_session:[17,2,1,""],begin:[17,2,1,""]},"utils.hooks.PrintLossAndTimeHook":{after_run:[17,2,1,""],before_run:[17,2,1,""],begin:[17,2,1,""]},"utils.hooks.PrintSamplesHook":{after_run:[17,2,1,""],before_run:[17,2,1,""],begin:[17,2,1,""]},"utils.hooks.RunEvaluationHook":{after_run:[17,2,1,""],before_run:[17,2,1,""],begin:[17,2,1,""]},"utils.utils":{Logger:[17,1,1,""],array_to_string:[17,5,1,""],cast_types:[17,5,1,""],check_params:[17,5,1,""],clip_last_batch:[17,5,1,""],clip_sparse:[17,5,1,""],collect_if_horovod:[17,5,1,""],deco_print:[17,5,1,""],flatten_dict:[17,5,1,""],get_available_gpus:[17,5,1,""],get_git_diff:[17,5,1,""],get_git_hash:[17,5,1,""],get_results_for_epoch:[17,5,1,""],iterate_data:[17,5,1,""],log_summaries_from_dict:[17,5,1,""],mask_nans:[17,5,1,""],nest_dict:[17,5,1,""],nested_update:[17,5,1,""],text_ids_to_string:[17,5,1,""]},"utils.utils.Logger":{flush:[17,2,1,""],write:[17,2,1,""]},data:{data_layer:[0,0,0,"-"],image2label:[1,0,0,"-"],speech2text:[2,0,0,"-"],text2speech:[3,0,0,"-"],text2text:[4,0,0,"-"],utils:[0,0,0,"-"]},decoders:{convs2s_decoder:[5,0,0,"-"],decoder:[5,0,0,"-"],fc_decoders:[5,0,0,"-"],rnn_decoders:[5,0,0,"-"],tacotron2_decoder:[5,0,0,"-"],transformer_decoder:[5,0,0,"-"]},encoders:{cnn_encoder:[6,0,0,"-"],convs2s_encoder:[6,0,0,"-"],ds2_encoder:[6,0,0,"-"],encoder:[6,0,0,"-"],resnet_blocks:[6,0,0,"-"],resnet_encoder:[6,0,0,"-"],rnn_encoders:[6,0,0,"-"],tacotron2_encoder:[6,0,0,"-"],transformer_encoder:[6,0,0,"-"],w2l_encoder:[6,0,0,"-"]},losses:{cross_entropy_loss:[7,0,0,"-"],ctc_loss:[7,0,0,"-"],loss:[7,0,0,"-"],sequence_loss:[7,0,0,"-"],tacotron_loss:[7,0,0,"-"]},models:{encoder_decoder:[8,0,0,"-"],image2label:[8,0,0,"-"],model:[8,0,0,"-"],speech2text:[8,0,0,"-"],text2speech:[8,0,0,"-"],text2text:[8,0,0,"-"]},optimizers:{automatic_loss_scaler:[10,0,0,"-"],lr_policies:[10,0,0,"-"],mp_wrapper:[10,0,0,"-"],optimizers:[10,0,0,"-"]},parts:{cnns:[12,0,0,"-"],convs2s:[13,0,0,"-"],rnns:[14,0,0,"-"],tacotron:[15,0,0,"-"],transformer:[16,0,0,"-"]},utils:{funcs:[17,0,0,"-"],hooks:[17,0,0,"-"],utils:[17,0,0,"-"]}},objnames:{"0":["py","module","Python module"],"1":["py","class","Python class"],"2":["py","method","Python method"],"3":["py","staticmethod","Python static method"],"4":["py","attribute","Python attribute"],"5":["py","function","Python function"]},objtypes:{"0":"py:module","1":"py:class","2":"py:method","3":"py:staticmethod","4":"py:attribute","5":"py:function"},terms:{"106gb":[25,44],"1080ti":41,"10k":48,"10m":45,"16xlarg":40,"1e6":4,"1e9":16,"1x1":6,"20k":48,"20m":45,"224gb":[25,44],"2xlarg":40,"300k":39,"45k":48,"4gpu":[35,38,41],"55gb":[25,44],"85k":48,"8xlarg":40,"\u03b1":[26,37],"\u03b4":[26,37],"\u03b5":[26,37],"\u03b6":[26,37],"\u03ba":[26,37],"abstract":[0,5,6,7,8,34],"boolean":[1,6,14],"byte":4,"case":[0,5,6,7,8,10,14,18,20,30,35,40],"char":0,"class":[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,20,30],"default":[3,4,5,6,7,10,14,17,30,32,33,35,40,45],"enum":4,"export":[25,44],"final":[5,6,8,14,17,25,30,41,44,48],"float":[1,2,3,5,6,8,10,13,14,15,16,30,36,40],"function":[0,2,3,5,6,7,8,10,12,13,14,16,17,30,34,40],"import":[4,30,40],"int":[0,1,2,3,4,5,6,8,10,13,14,16,17,30],"long":14,"new":[0,1,4,13,14,16,17,28,30,31,34],"return":[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,20,40],"short":[14,30,41],"static":[0,1,2,3,4,5,6,7,8,10,14,20,30,40],"switch":48,"true":[0,1,3,4,5,6,7,8,10,14,15,16,18,24,30,32,33,41,42],"try":[6,10,26,30,33,37],"while":[1,4,5,20,26,30,35,39,40,42,45,46,48],AWS:40,Adative:45,Adding:28,And:[0,1,3,4,39,40],But:[8,43],EOS:[3,16],For:[1,2,4,5,6,8,10,14,17,20,24,25,26,27,30,32,33,34,35,37,39,40,41,42,44,46,47,48],IDs:4,Its:14,NOT:14,Not:5,One:[26,30,37,40,43],Such:[14,20,43],TTS:14,That:[0,1,4,5,8],The:[0,1,3,4,5,6,8,10,14,15,16,17,20,25,27,30,34,35,36,38,40,41,43,44,45,46,47,48],Then:39,There:[30,43,48],These:[1,5,8,14,17,39,40],Use:[5,6],Used:[4,8,16],Uses:[6,17,41],Using:28,Will:[3,6,8],With:[18,20,41],__call__:6,__init__:[0,1,2,3,4,5,6,7,8,13,14,15,17,20,30],_aspect_preserving_res:1,_bahdanau_score_with_loc:14,_baseattentionmechan:14,_basemonotonicattentionmechan:14,_batch_exampl:4,_build_attent:5,_build_forward_pass_graph:8,_building_block_v1:6,_building_block_v2:6,_cast_typ:[5,6,7],_central_crop:1,_clip_by_global_norm:10,_clip_gradients_by_norm:10,_compute_loss:7,_continue_search:16,_count_and_gen_subtoken:4,_count_token:4,_create_decod:8,_create_encod:8,_create_initial_st:16,_create_loss:8,_create_min_max_boundari:4,_decod:5,_decode_crop_and_flip:1,_distributed_appli:10,_encod:6,_escape_token:4,_expand_to_beam_s:16,_filter_and_bucket_subtoken:4,_filter_max_length:4,_flatten_beam_dim:16,_gather_beam:16,_gather_topk_beam:16,_gather_tre:14,_gen_new_subtoken_list:4,_generate_alphabet_dict:4,_generate_subtoken:4,_generate_subtokens_with_target_vocab_s:4,_get_example_length:4,_get_input_for_group:14,_get_new_alive_st:16,_get_new_finished_st:16,_get_num_objects_per_step:8,_get_symbols_to_logits_fn:5,_grow_alive_seq:16,_input_tensor:34,_item_or_tupl:14,_length_norm:16,_linear:14,_list_to_index_dict:4,_load_record:4,_load_vocab_fil:4,_maybe_merge_batch_beam:14,_maybe_split_batch_beam:14,_mean_image_subtraction_and_norm:1,_merge_batch_beam:14,_monotonic_probability_fn:14,_native_to_unicod:4,_output:8,_parse_audio_el:2,_parse_audio_transcript_el:[2,3],_parse_exampl:4,_parse_example_proto:1,_parse_transcript_el:3,_read_and_batch_from_fil:4,_resize_imag:1,_save_vocab_fil:4,_search_step:16,_shape_list:16,_smallest_size_at_least:1,_split_batch_beam:14,_split_string_to_token:4,_split_token_to_subtoken:4,_statekei:16,_subtoken_ids_to_token:4,_test:[32,33],_token_to_subtoken_id:4,_unflatten_beam_dim:16,_unicode_to_n:4,abl:[0,1,4,25,32,33,44],about:[6,17,39,41,42,46],abov:[14,26,37,40],abs:[6,10,14,41],absolut:40,acceler:14,accept:[4,6,12,14,34],access:[0,5,6,7,8],accord:[7,14,43],accumul:[8,30],accuraci:[1,8,32,33,40],achiev:[14,32,33,36,39,45],across:[4,7,8,30,40],activ:[5,6,12,13,14,40],activation_fn:[5,6,12],actual:[5,8,14,30],adagrad:[8,10,30],adam:[8,10,30,36,38,41,48],adapt:[6,8,30,38,43],add:[4,5,6,8,10,14,17,30,40,48],add_eo:4,add_r:13,add_regular:5,added:[0,4,6,8,13,14,16,17,30,45,46],adding:[7,14,17,45],addit:[2,6,8,10,14,16,25,27,30,40,41,43,44,45,47,48],addition:[1,30,34],adjust:[8,10,26,30,35,40],advis:48,after:[0,1,6,7,8,10,13,14,17,25,26,30,32,33,39,41,44,45],after_create_sess:17,after_run:17,again:30,aggreg:8,aggregation_method:10,aggregationmethod:10,agiomyrgiannaki:14,aka:38,alben:40,algorithm:[8,10,30,39,40,43,48],align:[5,14,48],alignment_histori:14,alignments_s:14,aliv:16,alive_cach:16,alive_log_prob:16,alive_seq:16,all:[0,1,2,3,4,5,6,7,8,10,14,16,17,20,24,26,27,30,32,33,34,37,39,40,41,45,46,47],allow:[4,24,26,32,33,37,39,41,43,45,48],almost:[38,39,45],along:[6,14],alpha:16,alphabet:[4,5,45],alphabet_config_path:5,alreadi:[14,17],also:[0,1,3,4,8,10,17,18,26,30,31,35,36,39,40,42,45,48],altern:[32,33,40],alwai:[8,10,30,32,40],amax:10,amount:4,anaconda:33,analog:8,analysi:[2,3],ani:[4,5,6,8,10,14,15,16,17,30,39,40,41],anneal_teacher_forc:15,anoth:[4,14],answer:[8,30],anymor:17,anyon:34,anyth:10,api:2,apostroph:45,appear:[4,34],append:[4,8,30],appli:[3,4,6,8,10,12,13,14,15,16,30,40],apply_gradi:10,approach:[8,14,18,40],apt:[25,32,33,44],arbitrari:[6,10],architectur:[26,37,40],archiv:[25,44],aren:4,arg:[14,17],argmax:14,argument:[2,3,4,5,6,7,8,10,14,16,17,18,25,27,30,44,47],arithmet:40,around:[1,5,6,7,25,36,39,40,44],arrai:[2,3,4,5,6,7,8],arrang:1,array_op:14,array_to_str:17,articl:14,artifici:5,arxiv:[6,10,14,40,41],asg:45,aspect:1,assign:[0,5,43],assum:[3,14,25,27,32,33,44,47],assumpt:[8,14],attend:14,attent:[5,6,13,14,16,26,36,37,38,39,41,48],attention_bia:[5,16],attention_cel:14,attention_depth:14,attention_dropout:16,attention_lay:[9,11],attention_layer_s:[5,14],attention_mechan:14,attention_or_cell_output:14,attention_st:14,attention_typ:5,attention_wn_lay:[9,11],attention_wrapp:[9,11],attentioninputwrapp:14,attentionlayernorm:13,attentionmechan:14,attentionwrapp:14,attentionwrapperst:14,attribut:[8,30],audio:[2,3,8,17,25,27,34,43,44,45,46,47,48],audio_dur:2,audio_length:8,augment:[2,43],augment_audio_sign:2,author:48,auto:[7,45],automat:[5,6,7,8,10,30,36,39,41],automatic_loss_sc:40,automatic_loss_scal:9,automaticlossscal:10,autoregress:16,avail:[8,26,30,35,40,41],averag:[7,8,30],average_across_timestep:7,avoid:14,awai:34,axi:[6,8,14],back:[16,36,40],backoff:[8,10,30,39,40],backoffscal:10,backpropag:40,backslash:4,bahadanau:14,bahdanau:[5,14],bahdanau_norm:5,bahdanauattent:14,bahdanaumonotonicattent:14,baidu:43,bandwidth:40,base:[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,18,25,26,30,31,36,37,38,39,41,42,43,44,45,48],base_model:30,base_param:[30,40],baselin:[36,39],basi:3,basic:[7,14,15],basic_sequence_loss:7,basicdecoderoutput:15,basicsequenceloss:7,basicslstmcel:14,batch:[4,5,6,7,8,10,12,13,14,15,16,20,30,36,39,41,43,45],batch_in_token:4,batch_norm:[6,13],batch_siz:[2,4,5,6,7,13,14,15,16],batch_size_per_gpu:[7,8,26,30,35,41,42,46],batches_per_epoch:10,bazel:[32,33],bbox:1,beahvior:14,beam:[5,14,16,32,33,42,43,45],beam_indic:16,beam_search:[9,11],beam_search_decoder_output:14,beam_siz:16,beam_width:[5,14],beamsearch:14,beamsearchdecod:14,beamsearchdecoderoutput:14,beamsearchdecoderst:14,beamsearchrnndecoderwithattent:5,becaus:[4,10,16,26,40],becom:2,been:[5,10,14,16,17,36,38,40],befor:[4,6,8,10,13,14,17,26,30,40],before_run:17,begin:[4,14,17,40],begin_decay_at:10,behavior:[14,40],being:[4,28,34],below:[32,33,39,40,41,48],bench_start:30,bench_step:30,benchmark:[8,30,40],benefici:40,bengio:14,besid:8,best:[14,16,32,33,43,45],better:[1,16,48],between:[4,8,14,16,39,41,48],bhadanau:14,bia:[5,13,14,16],bias:14,bias_initi:14,bidir_rnn_encoder_with_emb:6,bidirect:[41,43],bidirectionalrnnencoderwithembed:6,big:[35,41],bigger:[39,40],bin:[32,33],binari:[4,25,44],bind:39,birect:38,blank:[43,45],bleu:[8,36,37,39,41],blisc:[14,15],blob:16,block:[6,30],block_fn:6,block_lay:6,blue:26,bn_epsilon:[6,12],bn_momentum:[6,12],bn_regular:6,bodi:16,bool:[0,3,5,6,7,8,10,13,14,15,16,30],boost:[32,33],bori:40,both:[1,3,4,8,14,30,32,33,35,36,38,40,41,45,48],bottleneck:6,bottleneck_block:6,bottleneck_block_v1:6,bottleneck_block_v2:6,bottom:14,bound:1,boundari:[4,10],boundary_scal:4,box:[1,34],bpe:35,bpe_us:8,broadcast:17,broadcastglobalvariableshook:17,btl:39,bucket:4,buckets_max:4,buckets_min:4,buffer:1,build:[2,3,5,6,16,17,24,31,32,33,35,40],build_graph:[0,1,2,3,4,34],build_image_data:1,build_lay:6,build_lm:[25,44],build_pip_packag:[32,33],building_block:6,building_block_v1:6,building_block_v2:6,built:[6,8,30],bxhxwxc:45,bxtx1xc:45,bxtxc:45,c_state:14,cach:16,calcul:[0,1,4,5,8,13,14,16],calculate_bleu:8,call:[3,5,6,7,8,10,13,14,16,17,20,27,34,35,36,40,45,47,48],callabl:[5,6,10,14],callback:17,can:[0,1,2,3,4,5,6,7,8,10,14,15,17,18,20,24,26,27,30,31,32,33,34,35,37,40,41,42,43,45,46,47],candiat:4,candid:4,cannot:[8,14,16,30],cast:[5,6,7,40],cast_typ:17,cat:[26,35,39],cell:[5,6,14,15,34,41],cell_class:14,cell_input_fn:14,cell_output:14,cell_param:14,cell_stat:14,center:1,central:1,chang:[14,17,18,26,27,35,36,39,40,45,46,47,48],channel:[1,6,43],channels_first:[5,6],channels_last:[5,6,12],charact:[4,5,6,27,43,46,47],check:[6,8,14,30,32,33,34,40,43],check_grad:10,check_param:17,checkpoint:[8,14,17,30,34,35,36,39,41,42,43,45,46],chen:14,child:30,cho:14,choic:46,choos:[14,40],chorowski:14,christoph:14,cifar:1,cifardatalay:1,clariti:[35,36],classic:8,classif:45,clean:[25,35,41,42,44,45],cleaned_fil:26,clear:48,clip:[8,10,30,38,43,45,48],clip_by_norm:10,clip_gradi:10,clip_last_batch:[8,17],clip_norm:10,clip_spars:17,clone:[14,32,33],close:[4,14,41,43],cloud:40,cmake:33,cnn:[6,9,11],cnn_encod:9,cnn_layer:6,cnnencod:6,code:[4,8,14,30,39],coeffici:[10,40],colin:14,collect:[8,10,16,17,40],collect_if_horovod:17,colloqui:1,coloc:10,colocate_gradients_with_op:10,color:1,colorspac:1,column:14,com:[13,14,16,32,33],combin:[8,10,16],combine_head:16,come:41,command:[18,24,25,26,30,32,33,37,39,41,42,44],comment:41,commit:30,common:[9,11,36,39,40],commonli:40,compar:[6,40],compat:10,compil:[8,30],complet:[8,10,21,22,23,29,30,34],complex:40,compon:14,compos:14,compress:[25,44,48],compris:48,comput:[1,3,7,8,10,14,16,39,40,48],compute_gradi:[10,40],compute_loss:[7,8,17],concat:14,concaten:[8,14,48],concret:40,condit:14,config:[0,1,2,3,4,5,6,7,8,10,17,18,28,32,33,34,35,36,38,39,41,42,43,46],config_fil:[24,25,26,27,30,32,33,35,37,39,41,42,44,46,47],configur:[5,8,18,26,27,30,31,32,33,34,37,39,41,42,43,45,47],conflict:14,conjunct:[8,30],connect:[5,6,8,13,14,16,38,43,45,48],connectionist:45,conrib:14,consecut:4,consid:42,consist:[5,6,17,27,43,45,46,47],constant:[10,40],constraint:14,construct:[0,1,3,4,5,6,7,8,14,17],constructor:[0,2,3,5,6,7,8,10,14,30],consum:48,consumpt:40,contain:[0,1,2,3,4,5,6,7,8,10,13,14,16,17,26,27,30,40,41,46,47],content:[1,5,6,7],context:[14,48],continu:[5,16,30],continue_learn:30,contrib:[14,15],control:[8,14,45],conv1d:[6,12],conv1dnetworknorm:13,conv2d:[6,12],conv2d_fixed_pad:6,conv:[5,6],conv_actv:12,conv_block:[9,11],conv_bn_actv:12,conv_lay:6,conv_pad:13,conv_seq2seq:13,conv_wn_lay:[9,11],conveni:30,convent:6,converg:40,convergens:38,convert:[2,4,8,14,25,36,40,43,44],convnet_lay:6,convolut:[5,6,12,13,26,36,37,39,41,43,45,48],convs2:[6,9,11,16,31,35,41],convs2s_decod:9,convs2s_encod:9,convs2s_encoder_with_emb:6,convs2sdecod:5,convs2sencod:6,coord:[1,17],coordin:[1,17],copi:[6,8,14,34,40],copt:[32,33],core:[4,40],core_cel:5,core_cell_param:5,correct:[5,7,8,10,14,16,25,26,30,37,43,44],correctli:[8,32,33,34],correspond:[0,1,2,3,4,8,10,14,16,20,26,27,30,32,33,35,37,40,45,46,47],correspondingli:[10,20],cosin:16,could:[0,2,3,5,6,7,8,10,17,30],count:[0,4,5,30],cover:30,cpu:[4,40],creat:[0,1,3,4,5,6,7,8,14,15,16,17,24,30,34,37,40,46],create_feed_dict:34,create_interactive_placehold:34,create_toy_data:[26,37],creation:[8,40],crop:1,crop_height:1,crop_width:1,cross:7,cross_entropi:7,cross_entropy_loss:9,cross_entropy_with_smooth:7,crossentropyloss:7,crossentropywithsmooth:7,csv:[2,3,25,27,44,46,47],ctc:[5,7,43,45],ctc_decoder_with_lm:[32,33],ctc_greedy_decod:5,ctc_loss:9,ctcloss:7,cuda:[32,33,40],cudnn:[6,33,41,42,45],cudnn_gru:6,cudnn_lstm:6,cudnnlstm:14,cumprod:14,cumsum:14,cumul:14,cur_index:16,current:[1,5,6,8,10,13,14,15,16,17,30,34,35,41,42,46,48],curv:39,custom:[15,32,33,40],cut:[5,8],d_model:10,dai:[41,42],data:[1,2,3,4,5,6,7,8,9,14,17,19,25,26,28,30,37,39,40,44],data_fil:4,data_format:[6,12],data_lay:[1,2,3,4,5,6,7,8,9,30],data_layer_param:[8,30,46],data_root:[26,35],datalay:[0,1,2,3,4,8,20,30],datapoint:3,dataset:[0,1,2,3,4,8,20,24,26,37,42,43,45,46],dataset_fil:[2,3,27,46,47],dataset_loc:[3,27,46,47],david:40,dct:17,debug:30,debug_port:[17,30],debugger_port:30,dec:6,decai:[10,38,40,41,43,45,48],decay_r:10,decay_step:10,decid:48,deco_print:17,decod:[0,1,3,4,6,7,8,9,13,14,15,16,19,25,26,28,30,31,37,38,41,42,43,44,45,48],decode_and_crop:1,decode_pad:13,decode_pass:5,decoded_output:[35,39],decoder_cel:15,decoder_cell_typ:5,decoder_cell_unit:5,decoder_dp_input_keep_prob:5,decoder_dp_output_keep_prob:5,decoder_initial_st:14,decoder_lay:5,decoder_library_path:5,decoder_output:[5,7],decoder_param:[8,41,42],decoder_predict:7,decoder_use_skip_connect:5,decreas:[4,40,43,45],deep:[6,14,40,41,43],deepbench:40,deepspeech2:[31,41,42],deepspeech2encod:[6,30],deepspeech:[6,30],defaultdict:4,defin:[0,1,3,4,5,6,8,10,14,16,26,30,34,40],definit:6,degre:40,delet:[25,44],delim:[8,17],delimit:[27,46,47],demo:34,demonstr:39,denomin:[8,30],denorm:3,denot:1,dens:[6,8,14,15],dense_tensor:7,dense_to_spars:7,depend:[3,6,14,39,43],deprec:14,depth:[1,14,31],deriv:[0,5,6,7,8,30],descent:43,describ:[0,1,3,4,5,6,7,8,14,30,32,33,40,41,48],descript:[0,1,2,3,4,5,6,7,8,30,35,41,42,43,46],design:[31,40],desir:40,detail:[1,2,5,6,8,14,24,30,41,42,46],determin:[5,14,16],detoken:[35,39],dev:[25,26,32,33,37,41,42,44,45],deviat:[3,14],devic:17,dgx1:45,diagon:48,diamo:40,dicionari:7,dict:[0,1,2,3,4,5,6,7,8,14,16,17,30,34],dict_to_log:17,dictionari:[0,1,2,3,4,5,6,7,8,16,17,20,30,34],dictiontari:17,did:[26,37],diederik:14,diff:30,differ:[1,4,6,14,16,17,26,30,32,33,37,39,40,41,48],dilat:45,dim:[5,6,7,14],dimens:[1,4,5,6,13,14,15,16,45],dimension:[6,10,14],dimenst:13,diment:13,dir:[8,17],direct:[6,38,41,48],directori:[3,8,27,30,32,33,34,46,47],disabl:[8,14,15,26,30,32,33,35,40,42],disclaim:31,discov:[32,33],disk:[8,26,37],displai:30,distanc:8,distort:1,distribuit:[24,32,33],distribut:[4,8,14,30,31,33,40,43],divid:[1,16],divis:[0,2,4,8,14],dmitrii:14,dnn:[40,43],do_mask:7,doc:[5,6,7,8,30,33],docker:40,docstr:14,document:[14,30,40,42],doe:[1,5,7,8,14,15,26,30,32,33,35,40,41,42,46],doesn:1,domain:[2,3],don:[4,6,16,24,32,33,41],done:[13,26,35,36,39,42,46],dot:[3,16],doubl:39,dougla:14,download:[25,26,27,35,42,44,46,47],download_lm:[32,33,42],downsampl:6,downsid:43,dp_input_keep_prob:14,dp_output_keep_prob:14,draw:16,drawn:4,dropout:[5,6,13,14,36,38,43,45,48],dropout_keep_prob:6,dropout_keep_prop:6,droupout:14,ds2:42,ds2_encod:[9,30],ds2_large_8gpu:[41,43],ds2_large_8gpus_mp:43,ds2_large_mp:42,ds2_librispeech_larc_config:[25,44],ds2_medium_4gpu:41,ds2_out:42,ds2_small_1gpu:[41,42],ds2_toy_config:[32,33],ds2_toy_data_config:[25,44],dtype:[0,5,6,7,8,10,14,15,16,17,30,34,39,40],due:[14,43],durat:[2,43],dure:[1,5,8,14,15,16,17,26,30,40,42,43,45,48],dynam:[8,14,40,43],dynamic_decod:[5,14,15],dzmitri:14,each:[0,1,4,5,7,8,10,14,15,16,17,20,30,34,39,40,43,48],eager:10,earli:[14,41],easi:[31,34],easier:48,easili:[26,37],eck:14,edit:34,efault:5,effect:[14,41,42,48],effici:[4,6,14,31],eight:41,either:[0,2,3,5,6,7,8,10,14,30,40],element:[2,3,4,8,14],elimin:[41,42],els:[6,7,10],elsen:40,embed:[5,6,13,14,16,36,38,39,48],embed_s:13,embed_scal:16,embedding_lay:[9,11],embedding_lookup:14,embedding_s:16,embeddingsharedweight:16,emit:14,emnlp:14,emploi:43,empti:[8,14,20,30],emul:[8,30],enabl:[3,5,6,8,10,14,15,18,30,32,48],enable_log:[24,30,32,33,41],enable_postnet:5,enable_prenet:5,enc_emb_w:6,encod:[0,1,3,4,5,7,8,9,13,14,16,19,26,28,30,31,37,38,41,48],encoder_cell_typ:6,encoder_cell_unit:6,encoder_decod:[5,6,7,9,30],encoder_decoder_attention_bia:5,encoder_dp_input_keep_prob:6,encoder_dp_output_keep_prob:6,encoder_final_st:14,encoder_lay:6,encoder_output:[5,6,14],encoder_output_a:13,encoder_output_b:13,encoder_outputs_b:5,encoder_param:[6,8],encoder_sequence_length:5,encoder_st:[6,14],encoder_use_skip_connect:6,encoderdecodermodel:[8,30],encorc:14,end:[4,5,14,16,17,26,27,32,33,37,40,47],end_compat:10,end_learning_r:10,end_of_choic:4,end_symbol:5,end_token:14,energi:[3,8,14,45,48],enforc:14,english:[4,24,34,35,36,39,42],enough:[26,30,35,40,42,46],ensur:[4,14,16,17,40],enter:34,entir:[27,47,48],entri:[10,14],entropi:7,enumer:4,eos:16,eos_id:[4,16,17],epoch:[0,1,4,8,10,30,41,43,45],epsilon:[5,6,8,16,30],equal:[1,8,14,30],equival:[10,14],erich:40,error:[8,14,25,32,33,41,42,43,44,45],escap:4,especi:40,essenti:17,estim:40,eta:45,etal:[36,39],etc:[5,6,8,20,30],etl:20,eval:[1,5,6,8,15,25,27,30,42,44,47],eval_model:17,eval_param:30,eval_step:[8,30],evalu:[0,1,4,8,17,25,26,27,30,35,37,41,43,44,47],even:[39,43],evenli:4,event:[30,40],everi:[6,8,48],every_step:17,everyth:[25,30,32,33,44],exact:[14,30],exactli:[14,38],exampl:[0,1,2,4,5,6,8,10,14,20,25,26,27,30,32,33,35,37,39,40,44,46,47],example_config:[25,26,27,30,32,33,35,37,39,42,43,44,46,47],example_seri:1,exce:[8,30],except:[6,14,17,30,32,33,40],exclud:15,execut:[8,10,18,26,30,37],exist:[0,5,14,28,40],exp:14,exp_decai:10,expect:[7,10,34],experi:[26,30,37,48],explicit:6,explicitli:[13,14,40],exponenti:[10,48],exponential_decai:10,express:30,extend:43,extens:40,extra:45,extract:[2,3,20,25,44,45,46],facebook:[36,45],fact_siz:14,factor:[14,16,36,39,40],fairli:30,fals:[0,1,3,4,5,6,7,8,10,14,15,16,17,32,33,39,41,42],fast:43,faster:[36,39,43,48],fc_decod:9,fc_layer:6,feat:7,featur:[2,3,5,6,7,31,43,45],feature_norm:3,feature_normalize_mean:3,feature_normalize_std:3,features_typ:[2,3],fed:[20,48],feed:[14,17,34],feed_dictionari:20,feedforward:[13,16],feedfowardnetwork:16,feedfowardnetworknorm:13,feel:[25,44],fetch:8,few:[41,45,48],ffn_layer:[9,11],ffn_wn_layer:[9,11],fft:3,field:[1,2,5,6,7,14,45],file:[0,1,2,3,4,5,8,17,25,26,27,30,34,35,37,39,41,42,43,44,46,47],file_byte_limit:4,file_pattern:4,file_with_bpe_segment:26,filenam:[1,2,3,4,27,46,47],filepath:4,filew:[27,47],fill:34,filter:[4,6,10,12,43],filter_s:16,filterbank:45,final_output:5,final_sequence_length:5,final_st:[5,14],finalbeamdecoderoutput:14,finalbeamsearchdecoderoutput:14,finalize_evalu:8,finalize_infer:8,find:[16,24,31],finish:[14,15,16,26,30,37],finished_flag:16,finished_scor:16,finished_seq:16,first:[0,1,4,6,8,10,13,14,16,17,18,25,26,27,30,33,34,37,38,40,44,45,46,47,48],fit:[4,39],five:43,fix:10,fixed_lr:10,fixed_pad:6,flag:[14,16],flaot:16,flat_dict:17,flatten_dict:17,flexibl:31,flip:1,float16:[0,5,6,7,8,10,30,36,40,45],float32:[0,2,5,6,7,8,10,13,15,16,24,30,36,38,39,40,41,43,45,48],flstm:[9,11],flstmcell:14,flush:17,folder:[25,26,27,30,32,33,37,44,47],follow:[0,1,3,4,5,6,7,8,12,20,24,25,26,30,32,33,35,36,37,38,40,41,42,43,44,45,46,48],footprint:45,forc:[15,30],force_var_reus:8,forev:4,forget:[14,24,32,33,41],forget_bia:14,form:[0,4,14],format:[1,4,5,6,12,34,46],formul:16,forward:[8,40],fot:3,found:[4,35,43,45,46],four:41,fp32:[39,40],fraction:4,frame:[2,8,45,48],framework:34,free:[25,44],frequenc:[2,3,4,43],frequent:4,from:[0,1,2,3,4,5,6,7,8,10,13,14,16,17,20,30,32,33,34,35,36,38,40,41,43,45,48],ftrl:[8,30],full:[6,10,40,41],fulli:[5,6,13,16,36,43,45,48],fully_connected_ctc_decod:5,fully_connected_decod:5,fully_connected_time_decod:5,fullyconnectedctcdecod:[5,25,44],fullyconnecteddecod:5,fullyconnectedtimedecod:5,func:9,funciton:15,furthermor:40,fuse:1,futur:16,gamma_regular:6,ganesh:40,garcia:40,gate:[10,13,14,45],gate_gradi:10,gate_graph:10,gate_non:10,gate_op:10,gated_linear_unit:13,gather:[16,17],gehr:36,gen_input_tensor:20,gener:[3,4,5,6,8,14,16,27,30,34,46,47,48],generate_tri:[32,33],geometr:16,german:[4,24,35,36,39],get:[3,8,10,16,20,25,26,32,33,39,43,44],get_available_gpu:17,get_data_lay:8,get_decoder_self_attention_bia:16,get_en_d:35,get_git_diff:17,get_git_hash:17,get_interactive_infer_result:34,get_magnitude_spec:3,get_mel:3,get_next:20,get_num_objects_per_step:8,get_optional_param:[0,1,2,3,4,5,6,7,8,20,30],get_output_tensor:8,get_pad:16,get_padding_bia:16,get_position_encod:16,get_regularization_loss:10,get_required_param:[0,1,2,3,4,5,6,7,8,20,30],get_results_for_epoch:17,get_size_in_sampl:[0,1,2,3,4,20],get_speech_featur:[2,3],get_speech_features_from_fil:[2,3],get_tf_dtyp:8,get_vari:40,get_wmt16_en_dt:26,getter:40,ginsburg:[14,40],git:[30,32,33],github:[13,14,16,32,33],give:13,given:[1,10,14,16,40,43],global:[10,17],global_gradient_norm:[8,30],global_norm:10,global_step:10,glstm:[5,9,11],glstmcell:14,glu:45,gnmt:[5,6,9,11,31,35,41],gnmt_encoder_with_emb:6,gnmt_encoder_with_emb_cudnn:6,gnmt_residual_fn:14,gnmt_v2:5,gnmtattentionmulticel:14,gnmtlikeencoderwithembed:6,gnmtlikeencoderwithembedding_cudnn:6,gnmtv2:38,go_symbol:5,goal:[26,37],going:[5,6,21,22,23,29,30],good:[30,36,39],googl:[35,38,39],gpu:[0,7,8,17,18,20,24,26,30,31,32,33,35,36,39,40,41,42,43,45,46],gpu_id:[8,30],grad_loss:10,gradient:[8,10,14,30,38,40,43,45,48],gradient_norm:[8,30],grads_and_var:10,gram:[25,43,44],graph:[0,1,2,3,4,5,6,7,8,10,17,30,40],graphic:40,graphkei:10,great:48,greater:6,greedi:[41,42,43,45],gregori:40,griffin:[8,48],griffin_lim:8,ground:48,group:[4,14],group_batch_s:4,group_id:14,group_siz:14,grow:16,gru:[5,6,41,43],guarante:[4,14],hacki:3,half:[40,45],halv:[39,40],handl:14,happen:[0,1,4,5,6,7,8,20],hard:14,hardmax:14,has:[0,1,2,3,4,5,6,7,8,14,16,17,24,38,40,41,48],has_nan:10,hash:30,hat:10,have:[0,1,2,3,4,5,6,7,8,10,14,15,16,20,26,27,30,32,33,35,36,38,40,41,42,45,46,47,48],head:16,height:1,height_in:6,help:[8,25,30,43,44],helper:[3,6,8,12,15,16],henc:[40,48],here:[0,1,4,5,6,7,8,14,16,20,24,30,36,39,40,43],hetland:8,hidden:[5,6,14],hidden_dropout:13,hidden_s:[5,16],hieu:14,high:40,higher:[14,32,33,43],highest:16,highli:41,histori:14,hold:[10,16],hook:[8,9],horovod:[0,4,7,8,10,17,18,24,30,39,41,45],horovod_gpu_broadcast:17,hot:[1,7,14],houston:40,how:[8,10,14,16,24,26,28,37,39,48],howev:[1,10,27,34,40,47,48],htk:48,html:33,http:[6,8,10,13,14,16,32,33,41],human:17,hvd:[8,17,30],hyper:39,hyperparamet:[39,40,46],iclr:[14,40],icml:14,id_and_audio_filenam:2,ideal:48,ident:[6,14,39],ids:[0,2,3,4,8,14,16,17,30],idx2char:8,ignor:[0,8,10,14,17,18,27,30,43,47],ignore_speci:[8,17],illeg:16,illustr:40,ilsvrc2012_val_00041207:1,imag:[1,6,8,17],image2label:[0,9,30],image_buff:1,image_s:1,imagenet_preprocess:[0,9],imagenetdatalay:1,implement:[7,8,10,13,14,15,16,20,30,34,36,41,46,48],impli:14,import_librivox:[25,42,44],improv:[1,4,40,45],in_dim:13,incept:1,includ:[0,1,2,3,4,5,6,7,8,14,25,40,44,45,46],incorrect:[15,43],increas:[16,40,43,45],increment:10,independ:[6,7,8,30],index:[14,16],indexedslic:10,indic:[1,4,16,17],inf:14,infer:[0,1,3,4,5,6,8,14,15,17,25,27,30,37,39,44,47],infer_output_fil:[25,26,27,30,35,37,39,42,44,46,47],infer_param:[30,46],infer_s2t:34,infer_t2:34,infin:16,inform:[6,8,14,16,17,30,31,48],inherit:[0,5,6,7,8,20],init_from_fil:4,init_var:16,initi:[4,5,6,8,10,13,14,15,16,17,30,36,40,43,45,48],initial_cach:16,initial_cell_st:14,initial_decoder_st:15,initial_finish:15,initial_id:16,initial_input:15,initial_st:14,initializer_param:[5,6,8,30],inner:[14,16],input:[0,1,2,3,4,5,6,7,8,12,13,14,15,16,30,34,36,39,45,48],input_attention_bia:13,input_dict:[5,6,7,17],input_lay:6,input_length:5,input_s:14,input_sequence_length:14,input_tensor:[0,1,2,3,4,5,6,7,8],input_typ:2,input_valu:8,inputs_attention_bia:5,insensit:[8,10,30],insid:[0,1,3,4,5,8,17,26,27,34,35,40,46,47,48],inspect:40,inspir:[13,14],instabl:14,instal:[24,25,31,44],install_kenlm:32,instanc:[0,5,6,7,8,14,15,40],instead:[1,5,10,14,15,32,33,35,40,45],instruct:[25,31,33,42,44],insur:16,int32:[1,14,15,16],int64:[14,16],intact:6,integ:[1,4,6,14,15],inter:40,interconnect:39,intermedi:[8,30,40],intern:[10,14,28],intial:38,intialzi:45,introduc:[1,6,39,40,43],invalid:10,invalidargu:14,invari:16,invers:4,inverse_mel:3,involv:16,is_train:[1,14],issu:[41,42],item:[4,14,16],iter:[0,1,2,3,4,8,17,20,30,39,40],iter_s:[8,10,30],iterate_data:17,its:[4,13,14,16,25,30,43,44],jaitli:14,jan:14,jian:6,join:4,join_tokens_to_str:4,jointli:14,jona:36,jonah:40,jonathan:14,jpeg:1,jul:6,just:[5,6,32,33,48],kaim:6,keep:[5,6,7,13,14,17,40],kei:[0,1,3,4,6,8,10,13,16,17],kenlm:[25,32,33,44],kept:40,kera:45,kernel:[5,6,13,41,43,48],kernel_initi:14,kernel_regular:6,kernel_s:[5,6,12],kernel_width:13,key_channel:16,keyword:16,kind:30,kingma:[13,14],knee:1,known:[1,4,14],kpu:33,kuchaev:40,kuchaiev:14,kwarg:[14,16],kyunghyun:14,l2norm:10,label:[1,5,7],lambda:[14,40],languag:[5,24,42,43,45],lar:[8,30],larc:[8,10,30,38,41,43,45,48],larc_eta:[8,30],larc_mod:[8,30],larc_param:[8,10,30],larg:[8,14,30,38,40],largest:16,last:[5,6,8,13,30,45],last_batch:[8,17],last_step:[8,17],lastli:[46,48],latenc:40,later:40,latest:32,latter:14,launch:[17,26,37],layer:[0,1,2,3,4,5,6,8,10,13,14,15,16,19,28,30,38,39,40,41,43,45,48],layer_id:13,layer_param:6,layer_typ:[6,12],layernorm:16,layernorm_lstm:6,layout:1,ld_library_path:39,lead:[32,33],learn:[5,6,8,10,14,26,30,36,37,38,41,43,45,48],learnabl:14,learning_r:[8,10,30],learning_rate_decay_fn:10,least:[3,6,16],leav:48,left:14,length:[0,1,2,3,4,5,6,7,8,13,14,15,16],length_i:16,length_penalty_weight:14,length_x:16,lenth:8,less:[4,40,41,45],let:[35,42,46],letter:45,level:[30,40,43],levenshtein:8,leyer:3,libboost:[32,33],libctc_decoder_with_kenlm:[32,33],librari:[5,35],librispeech:[24,41,42,43,45],librivox:[25,44],librosa:3,libsox:[25,44],libtensorflow_cc:[32,33],libtensorflow_framework:[32,33],lightweight:42,like:[5,6,10,16,20,26,32,33,35,38,39,41,42],lim:[8,48],limit:40,line:[0,4,17,18,26,27,30,46,47],linear:[5,13,14,16,45,48],link:[33,41,42,43],list:[0,1,2,3,4,5,6,7,8,10,14,16,20,27,30,46,47,48],list_clip:10,list_t:10,liu:14,live:16,ljspeech:[24,46],lm_binary_path:5,lm_trie_path:5,lm_weight:5,load:[0,3,4,20],load_pre_existing_vocabulari:0,localhost:39,locat:[5,14,16,26,27,32,33,35,47,48],locationlay:14,locationsensitiveattent:14,log:[3,8,14,16,17,27,28,40,43,45,47],log_dir:46,log_fil:17,log_mag_spec:3,log_mel_spec:3,log_summaries_from_dict:17,logdir:[8,26,27,30,37,47],logger:17,logic:[8,16,20],logit:[5,7,14,16],logits_to_outputs_func:5,logmax:[8,10,30,40],logmaxscal:10,lognorm:40,logspac:14,longer:[17,43],longest:4,look:[6,8,30,31,39,41,42],loop:[5,16],lose:40,loss:[0,1,3,4,5,8,9,10,19,28,30,36,39,41,43,45],loss_comput:8,loss_input_dict:7,loss_param:8,loss_scal:[8,10,30,39,40],loss_scaling_param:[8,10,30],lossi:48,lot:[5,25,26,32,33,44],lower:[4,33,40],lr_polici:[8,9,30],lr_policy_param:[8,30],ls_dir:[25,44],lst:4,lstm:[5,6,14,38,41,48],lstmstatetupl:14,luong10:38,luong:[5,14],luong_scal:5,luongattent:14,luongmonotonicattent:14,lyaer:5,m_common:[35,39],m_state:14,machin:[14,24,31,36,37,39],made:[45,48],mag:3,mag_pow:3,mag_spec:3,magnitud:[3,8,41,48],mai:[4,14,16,43],main:[5,6,7,26,30,31,37,43],maintain:[16,40],major:[5,14],make:[0,1,4,14,25,26,31,33,34,43,44,45],malform:10,man:14,mani:[39,40,43,46],manner:14,manual:[14,40],map:[0,4,5,6,14,15,39],mark:[4,14,16],mask:[7,13,14,16],mask_decoder_sequ:[5,15],mask_nan:[7,17],mask_pad:16,master:[16,33,40],match:[1,4,6,8,14,36,40,41,48],matric:14,matrix:[14,16],mavx2:[32,33],mavx:[32,33],max:[4,10],max_decode_length:[5,16],max_dur:43,max_grad_norm:[8,30],max_length:4,max_lr:10,max_pool2d:6,max_pooling2d:6,max_step:[8,30],max_subtoken_length:4,max_tim:14,max_timescal:16,maxim:10,maximum:[4,8,14,16,30,40],mayb:14,maybe_print_log:8,mca:39,mean:[1,3,4,17,40],measur:[26,35,37,39,41],mechan:[5,14,16,38,39,48],mel:[3,14,45,48],mel_basi:3,mel_spec:3,memori:[0,14,26,35,39,40,42,46],memory_s:5,memory_sequence_length:14,mention:40,merg:14,metadata:[27,46,47],method:[0,1,2,3,4,5,6,7,8,10,14,16,17,20,30,40],methodolog:40,metric:[8,42,43,48],mfcc:2,mfma:[32,33],mfpmath:[32,33],michael:40,micikeviciu:40,might:[26,30,32,33,35,40,42],mike:14,milli:2,min:4,min_boundari:4,min_count:4,min_idx:0,min_lr:10,min_timescal:16,min_upd:[8,30],minh:14,mini:20,minibatch:14,minim:[8,10,30],minimum:[0,4,14,16,48],minor:45,minumum:4,minut:[32,33],mismanag:14,misspel:[25,43,44],mix:[5,6,8,10,14,16,24,30,31,41],mixedprecisionoptimizerwrapp:[10,40],mkdir:[25,33,44],mode:[0,1,3,4,5,6,8,13,14,17,18,24,25,26,27,30,32,33,35,37,39,41,42,43,44,46,47],model:[0,1,2,3,4,5,6,7,9,10,14,15,16,17,24,26,28,31,34,37,40],model_dtyp:15,model_param:40,model_prefix:[35,39],modifi:[4,5,6,7,14,15,17,40],modul:[5,6,8,10,14,17,30],modular:31,momentum:[5,6,8,30,41,43,45],monoton:14,monotonic_attent:14,more:[4,8,14,16,26,35,40,41,42,43,45,46],moreov:30,moss:[26,37,41],most:[4,8,20,30,40,43],mostli:48,move:30,mp_regularizer_wrapp:[10,40],mp_wrapper:9,mpi4pi:[32,33],mpi:[8,32,33],mpiexec:[24,32,33,41],mpirun:[18,39],msg:17,msse4:[32,33],much:[4,16,26],multi:[8,16,18,20,24,26,31,32,33,36,37,39,41],multicel:14,multihead:16,multipl:[3,10,14,16,41],multipli:[10,14,40],multirnncel:14,must:[0,1,4,5,6,7,8,10,14,16,27,30,34,47],mutli:18,myfavoriteattentionmechan:14,n03623198:1,n_feat:15,n_fft:[3,8],n_frequency_featur:43,n_hidden:6,n_iter:8,n_mel:3,n_timestep:43,n_window_s:3,n_window_strid:3,name:[2,4,5,6,7,8,10,12,13,14,15,30,40],namedtupl:14,nan:7,narang:40,nativ:4,natur:[14,43],navdeep:14,nccl:33,nearli:[39,40],necessari:[0,6,8,17,30,32,33,34,40],necessarili:16,need:[0,1,4,5,6,8,10,16,18,20,25,26,27,30,32,33,34,37,39,40,43,44,46,47],neg:[14,16],nest:[14,15,16,30],nest_dict:17,nested_upd:17,net:[7,15],network:[6,13,14,16,40,43,48],neural:[6,14,36,39,40,43],new_beam_s:16,new_cach:16,new_height:1,new_log_prob:16,new_seq:16,new_width:1,newli:[14,46],newstest2014:[26,41],next:[5,8,14,30,31,35,40,41,46],next_batch_feed_dict:20,next_input:[14,15],next_stat:[14,15],nice:48,nmt:[26,35,37,38,41],nmt_revers:[26,37],no_dir_check:30,noam:10,node:[18,31],nois:[14,43],noise_level_max:2,noise_level_min:2,non:[14,16],none:[0,2,3,4,5,6,7,8,10,14,15,16,17,20,30,39,40],norm:[5,6,8,10,12,13,30,41],normal:[1,2,3,5,6,13,14,16,36,40,43,45],normalization_typ:13,normalize_sign:2,normliz:3,note:[0,1,3,4,5,6,7,8,10,14,17,25,26,30,34,35,39,40,44],now:[14,25,30,40,42,44],num:[5,6,7],num_audio_featur:[2,3,43],num_box:1,num_channel:[1,5,6],num_class:1,num_cpu_cor:4,num_epoch:[0,1,4,8,10,30],num_featur:[2,3,5],num_gpu:[8,18,24,26,30,32,33,35,37,39,41],num_head:16,num_iter:4,num_lay:5,num_proj:14,num_rnn_lay:6,num_time_step:[2,3],num_unit:[5,14],num_work:[0,1,2,3,4,20],number:[0,1,2,3,4,5,6,7,8,10,14,16,18,24,30,32,33,39,40,41,43,45],number_of_group:14,numer:[8,14,17,30,40],numpi:2,nvidia:[31,32,33,40],object:[0,1,3,4,5,6,7,8,10,14,15,16,17,20,30,40],observ:45,obtain:[32,33,40,41,42],occur:14,off:36,offici:31,offset:17,offset_target_by_on:7,often:[8,30,40],old:16,oleksii:40,on_horovod:[8,10],onc:[4,14,17,26,34,35,37,42,43,46],one:[0,1,3,4,5,6,7,8,10,14,16,17,26,27,30,35,36,40,41,43,46,47],onli:[0,1,4,5,6,8,10,12,14,17,18,26,30,39,40,41],onlin:14,open:[8,45],open_seq2seq:[1,2,3,4,6,8,32,33],openib:39,openseq2seq:[4,8,18,24,25,26,27,30,37,39,40,41,47],openslr:[32,33,42],oper:[5,6,10,14,15,17,32,33,40],oppos:48,ops:[1,10,14,15,17],opt:[32,33],optim:[8,9,30,36,41,43],optimize_loss:10,optimizer_cls_nam:10,optimizer_param:[8,10,30],optimizer_summari:10,option:[0,1,2,3,4,5,6,7,8,10,14,20,30],optional_dict:17,order:[4,6,14,25,26,27,32,33,34,36,40,42,43,44,45,47,48],org:[6,8,10,14,41],org_dict:17,origin:[1,4,6,14,16,17,25,36,43,44,45,48],orte_base_help_aggreg:39,other:[1,5,8,10,14,17,25,30,32,33,40,44,45,48],otherwis:[1,8,10,14,17,26,30,32,33,40],our:[35,36,40,45,48],out:[14,16,26,37,43],out_dim:13,out_of_bucket:4,output:[1,3,5,6,7,8,13,14,15,16,17,20,25,26,30,32,33,35,36,37,39,43,44,45,48],output_attent:14,output_dim:[5,14],output_dir:17,output_dtyp:[14,15],output_fil:[8,17],output_height:1,output_lay:[14,15],output_s:[5,14,15],output_time_major:14,output_typ:3,output_valu:8,output_width:1,outsid:4,over:[7,40,43],overal:17,overcom:40,overflow:40,overrid:14,overridden:14,overwrit:[8,30],overwritten:30,own:[24,27,47],p_choose_i:14,p_t:43,packag:[5,6,35],pad2eight:4,pad:[0,1,2,3,4,5,6,12,13,16,20,41,42],pad_2_eight:4,pad_eo:3,pad_id:[4,17],pad_sym:16,pad_to:[2,3],pad_vocab_to_eight:[0,16],padded_cross_entropy_with_smooth:7,padded_input_length:4,padded_length:4,padded_target_length:4,paddedcrossentropylosswithsmooth:7,padding_valu:16,pair:[4,8,10,14],pang:14,paper:[7,26,37,45,48],parallel:[4,14,16,26,35,37],parallel_interleav:4,parallel_iter:5,paralleltextdatalay:4,param:[0,1,2,3,4,5,6,7,8,10,12,14,16,17,20,30],paramet:[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,18,20,26,28,32,33,35,38,39,40,42,43,45,46],parent:[0,2,3,5,6,7,30],pars:[1,2,3],parse_record:1,part:[1,5,7,8,9,10,12,13,14,15,16,25,30,40,43,48],particular:[14,39],partli:14,pascanu:10,pass:[0,1,3,4,5,6,7,8,10,14,15,16,17,30,34,40,48],past:14,path:[0,2,3,4,5,8,24,30,32,33,41],pauliu:40,pdf:[6,10,14],penal:14,per:[2,4,7,8,27,30,36,39,43,45,46,47],perform:[1,2,5,6,7,8,10,14,15,26,30,37,40,43],period:[30,40],perl:[26,37,41],peter:14,pham:14,piecewis:10,piecewise_const:10,pip:[32,33],pip_packag:[32,33],pipelin:4,pitch:43,place:[4,30,41],placehold:[20,34],plai:42,plane:6,pleas:[14,25,34,35,42,44],plot:39,plot_spectrogram:8,plu:[27,43,47],png:8,point:[4,14,17,26,27,40,46,47],polici:[8,10,30,43],poly_decai:10,polynomi:[10,43,45],polynomial_decai:10,pool_siz:6,popul:[8,10],posit:[6,14,16],possibl:[8,14,15,30,39,40,41,43],post:[7,10,15,16],post_net_predict:7,post_process_gradi:10,postnet:[5,48],postnet_bn_epsilon:5,postnet_bn_momentum:5,postnet_conv_lay:5,postnet_data_format:5,postnet_keep_dropout_prob:5,power:[3,10,14,43],practic:40,pre:[0,3,10,14,15,16,26,39],preactiv:6,precis:[5,6,8,24,30,31,41],precison:45,pred:8,predict:[5,7,8,14,15,16,17,30],predicted_id:14,preevious_attent:14,prefer:33,prefix:4,prenet:[5,15,48],prenet_activ:5,prenet_lay:5,prenet_unit:5,prepar:[14,30],prepostprocessingwrapp:16,preprint:40,preprocess:[1,25,34,42,43,44,45],preprocess_imag:1,presenc:40,present:[10,27,47,48],preserv:1,preset:3,previou:[13,14,16],previous_attent:14,primarili:1,principl:40,print:[6,8,17,30],print_bench_info_step:[8,30],print_loss_step:[8,30],print_samples_step:[8,30],printlossandtimehook:17,printsampleshook:17,prior:[3,4,14],probability_fn:14,probabl:[5,6,14,16,30,40,43],problem:[14,26,37,40],proce:30,process:[0,1,2,3,4,8,10,14,16,17,26,30],produc:[5,6,7,14,34,43,46],product:[3,14,16,31],progress:[26,37],project:[6,13,14,31,41,43,48],projection_shortcut:6,pronunci:43,propag:[14,40],proper:14,properli:14,properti:[14,16],propos:[6,14,41],proto:1,protocol:1,provabl:16,proven:40,provid:[1,4,5,6,8,10,14,17,25,27,34,40,44,47],pseudo:48,pull:16,put:46,python:[1,4,5,6,8,10,13,14,15,16,17,20,24,25,26,27,30,32,33,35,37,39,41,42,44,46,47],qualiti:48,quantiti:10,queri:14,quit:43,quot:34,raffel:14,rais:[1,3,10,14,15,17],random:[1,4,8,14,17,30],random_se:[8,30],randomli:1,rang:[2,14,40,43],rank:[1,4,14,16,17],rare:40,rate:[6,8,10,30,36,38,41,42,43,45,48],rather:[0,6,8,30,40],ratio:[1,10],raw:[1,2,6,34,35,43,45],raw_fp32:39,raw_record:1,raw_str:4,reach:[16,45,48],read:[0,3,4,14,30],read_char:0,readabl:17,readi:10,real:26,realli:5,reason:[14,35],reccommend:5,receiv:17,recent:40,recept:45,recip:40,recogn:[25,34,44],recognit:[6,8,14,24,31,43,48],recogtnit:24,recommend:[5,10,14,20,24,32,33,40,41],reconstruct:[3,48],record:[1,4],recov:17,recurr:[6,14,39,40],recurs:14,redefin:40,reduc:[4,14,26,35,42,45,46],reduce_gradi:10,reduce_mean:7,reduce_sum:17,ref:6,refer:[1,4,16,35,48],regardless:3,regress:7,regular:[5,6,8,10,12,30,43,48],regularizer_param:[5,6,8,30],rel:42,relat:[0,1,3,4,14],releas:39,relu:[5,6,45],relu_dropout:16,remain:10,remov:[8,26,48],ren:6,renam:34,reparameter:14,repeat:[4,6,14],replac:[4,14,25,27,44,47,48],report:[10,35,36],repres:[1,10,14,16],represent:[5,6,48],representation_dim:6,request:17,request_stop:17,requir:[0,1,2,3,4,5,6,7,8,14,20,30,32,33,34,39,40],required_dict:17,res_rank:16,rescor:32,research:31,reserv:4,reserved_token:4,reshap:[6,14,16],residu:[5,6,7,13,14,38,48],residual_connect:14,resiz:1,resize_imag:1,resize_min:1,resized_imag:1,resizemethod:1,resnet:[1,6],resnet_block:9,resnet_encod:9,resnetencod:6,respect:[14,40],ressult:15,restor:[14,17,30],restore_and_get_result:17,result:[3,8,14,16,17,25,26,32,33,34,35,37,39,40,41,44,48],results_per_batch:8,retriev:[3,40],reus:[14,40],revers:[24,35],rgb:1,rif:14,right:14,rmsprop:[8,30],rnn:[5,6,7,9,11,15,26,37,38,41,48],rnn_beam_search_decod:[9,11],rnn_cell:6,rnn_cell_dim:6,rnn_cell_impl:14,rnn_decod:9,rnn_decoder_with_attent:5,rnn_encod:9,rnn_type:6,rnn_unidirect:6,rnncell:[14,15],rnndecoderwithattent:5,robust:40,ron:14,root:[17,24,32,33,39,41],root_rank:17,row:[6,8,14,17],row_conv:6,row_conv_width:6,rule:40,run:[5,6,8,10,14,16,17,18,24,25,27,28,35,37,39,40,41,42,44,46,47],run_context:17,run_valu:17,runevaluationhook:[8,17],runtim:14,runtimeerror:10,ruom:14,ryan:14,s_id:[4,17],sacrebleu:[35,36,39],safe:30,safe_cumprod:14,sai:30,saliman:[13,14],same:[0,1,4,5,6,7,10,14,16,17,34,38,39,43,45],sampl:[0,1,2,3,4,8,14,15,17,20,30,41,43,45,46],sample_id:15,sample_ids_dtyp:15,sample_ids_shap:15,sampling_prob:15,saurou:14,save:[3,4,8,30,46],save_audio:8,save_checkpoint_step:[8,30],save_summaries_step:[8,30],save_to_tensorboard:8,scalabl:[36,39],scalar:[1,10,14,15,16,17],scale:[3,4,5,8,10,14,16,30,36,39,43],scan:14,schedul:15,scheme:[4,10,38,43],schuster:14,scope:[5,6,7,10,13,14,15],score:[8,14,16,36,37,39,41,42,43],score_bias_init:14,score_mask_valu:14,score_or_log_prob:16,script:[1,18,25,26,30,32,33,35,37,41,42,44],search:[4,5,14,16,32,33,42,43,45],second:[2,4,10,13,14,17,39,40,43,48],section:[5,6,8,16,21,22,23,29,30,31,41],sed:26,see:[2,3,5,6,7,8,10,14,15,26,30,32,33,36,37,39,40,46,48],seed:[8,14,30],seem:48,seen:48,segment:[35,45],select:[8,40],self:[0,1,3,4,5,6,7,8,14,16,20,30,34],selfattent:16,semi:4,send:17,sensit:[5,45,48],sent:48,sentenc:[4,27,34,46,47],sentencepiec:[35,36,39],separ:[1,3,27,30,47],seq2seq:[7,14,15],seq:14,sequenc:[0,1,2,3,4,5,6,7,8,10,14,16,24,30,31,33,36,45,48],sequence_beam_search:16,sequence_length:[7,14,15],sequence_loss:9,sequencebeamsearch:16,serdyuk:14,seri:1,serial:[1,4],serialized_exampl:4,sess:[8,17],session:17,session_run_hook:17,sessionrunarg:17,sessionruncontext:17,sessionrunhook:17,sessionrunvalu:17,set:[4,5,6,7,8,10,14,17,18,27,30,32,33,40,43,47],setup:[25,34,41,44],sgd:[8,10,30,41,45],shaoq:6,shape:[1,2,3,4,5,6,7,13,14,15,16,20,34],sharan:40,share:[16,30,36,39,40],shen:14,shift:40,shortcut:6,shorter:[16,43],should:[0,1,3,4,5,6,7,8,10,13,14,16,17,20,24,25,26,27,30,32,33,34,35,36,37,39,40,41,44,46,47,48],show:[8,36,39],showcas:34,shrunk:10,shuffl:[0,4,14,20],side:1,sigmoid:14,sigmoid_nois:14,sigmoid_noise_se:14,signal:[2,3,8,17,43,45],signatur:[6,14],significantli:[4,39,43],similar:[4,6,39],simpl:[1,5,14,18,26,30,37,40,48],simplest:35,simpli:34,sinc:[4,6,8,14,25,30,32,33,39,40,43,44,48],sine:16,singl:[1,4,6,14,16,26,35,36,41,42,46],single_cel:14,singleton:7,singular:14,situat:[17,40],size:[0,1,2,3,4,5,6,7,8,13,14,15,16,17,20,25,30,35,36,38,39,40,41,43,44,45,48],skerri:14,skip:[30,40],skip_update_ph:10,slice:14,slide:45,slight:[43,45],slightli:4,sloppi:4,slot:39,slower:[10,43],slowest:14,slr:45,slstm:[5,9,11],small:[8,14,26,30,35,38,40,41,42,43],smallest:1,smallest_sid:1,smooth:7,softmax:[7,14,16,36],softwar:39,sole:39,solut:14,some:[1,5,6,8,10,14,16,30,31,32,33,34,35,40,46],someth:33,sometim:[30,39],soon:[14,21,22,23,29,30,41],sort:4,sound:48,sourc:[0,1,2,3,4,5,6,7,8,10,12,13,14,15,16,17,30,32,33,36,38,39],source_length:2,source_sequ:[2,6],source_tensor:[0,1,2,3,4,6,8,34],sox:[25,44],space:[13,45],spars:8,sparse_tensor_to_char:8,sparsemax:14,sparsetensorvalu:8,spatial:6,spec:[3,7,8],spec_lay:15,specfic:15,special:[27,47],specialtexttoken:4,specif:[2,3,5,6,30,35,42,46],specifi:[2,6,8,10,13,16,18,20,27,30,34,47],spectrogram:[2,3,5,7,8,14,15,41,43,48],spectrogram_predict:5,speech2text:[0,9,25,30,32,33,34,42,43,44],speech2textdatalay:2,speech:[2,3,8,14,24,31,34,43,45,48],speech_util:[0,9],speed:[4,40],speedup:[39,40],split:[4,5,14,16,27,47],split_data:[1,2,3],split_head:16,sqrt:10,src:[26,37],src_emb_dim:13,src_emb_siz:6,src_input:[5,6],src_length:[5,6,7],src_sequenc:6,src_vocab_s:6,stabil:[8,30],stabl:45,stack:14,stai:40,staircas:[10,38],stamp:30,standard:[6,8,14,40],start:[10,14,16,17,18,26,30,38,48],start_input:14,start_token:14,state:[5,6,14,15,16,38,48],state_is_tupl:14,state_s:14,statist:40,std:3,stderr:30,stdout:30,step:[1,8,10,14,15,17,30,32,33,35,39,41,43,45,48],steps_in_epoch:8,steps_per_epoch:10,still:16,stochast:43,stop:[3,5,8,14,15,17,41,48],stop_gradi:15,stop_token:7,stop_token_input:5,stop_token_lay:15,stop_token_pr:8,stop_token_predict:[5,7,15],stop_token_target:8,store:[3,4,8,14,16],str:[0,2,3,4,5,6,7,8,13,17],stream:17,strength:16,stretch:43,stride:[2,3,5,6,12,43,45],string:[1,2,3,4,5,6,8,10,17,30,35],strongli:5,structur:[14,15,16,28,48],style:14,sub:10,subfold:30,submit:40,subsequ:[1,14,30],subset:[14,41,42],substitut:[24,32,33,41],subtoken:[4,16],subtoken_count:4,subtoken_dict:4,subtoken_list:4,subtract:1,success:48,sudo:[25,32,33,44],suffer:14,suffic:34,suffici:48,suggest:[6,40],sum:[7,10,14,17],sum_i:14,summar:[40,43],summari:[8,10,17,30],sun:6,suppli:10,support:[0,5,6,7,8,12,14,15,17,18,20,30,32,33,34,35,40,42,46],supported_algo:10,sure:[0,1,4,25,26,27,33,34,44,47],surround:34,symbol:[0,5,16,43,45],symbols_to_logits_fn:16,symlink:[32,33],synset:1,synthesi:[14,24,31],system:[26,45],t2t:[0,9],t_list:10,tab:30,tabl:41,tacotron2:[5,31,41],tacotron2_decod:9,tacotron2_encod:9,tacotron2decod:5,tacotron2encod:6,tacotron:[5,6,7,9,11,41,46],tacotron_2_decod:5,tacotron_decod:[9,11],tacotron_help:[9,11],tacotron_lj_float:[27,41,46,47],tacotron_lj_float_8gpu:41,tacotron_lj_mix:41,tacotron_loss:9,tacotrondecod:15,tacotronhelp:15,tacotronloss:7,tacotrontraininghelp:15,tag:17,taht:[0,1,3,4],take:[5,6,7,10,14,16,17,25,26,32,33,34,35,42,43,44,46,48],taken:[8,14],tanh:[5,14],target:[0,1,2,3,4,5,7,8,13,17,26,36,37,38,39],target_emb:13,target_length:[2,5],target_s:4,target_sequ:[2,7],target_tensor:[0,1,2,3,4,5,7,8],target_vocab_s:4,task:[24,35,36,39],tbd:[35,39],teacher:15,techniqu:6,teganmaharaj:14,tempor:45,tensor2tensor:16,tensor:[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,20,34,40,45],tensorarrai:[14,15],tensorboard:[8,10,17,26,30,37],tensorflow:[0,1,4,5,6,7,8,10,13,14,15,16,17,30,31,40,45],tensorflow_pkg:[32,33],tensorshap:[14,15],term:[5,10,14],termin:16,tesla:40,test:[5,26,27,37,45,47],test_util:[27,47],text2speech:[0,9,27,34,46,47],text2speechdatalay:3,text2text:[0,9,26,30,34,35,37,39],text:[1,2,3,4,5,6,8,17,24,25,34,43],text_ids_to_str:17,text_input:[3,35,39],textlinedataset:[2,3],tfrecord:4,tgt:[26,37],tgt_emb_siz:5,tgt_input:5,tgt_length:[5,7],tgt_sequenc:7,tgt_vocab_s:[5,7],than:[1,4,6,8,10,14,16,26,35,36,40,41,43,45],thang:14,thed:5,thei:[1,4,6,10,14,40],them:[25,40,44],therefor:[35,39],thi:[0,1,3,4,5,6,7,8,10,13,14,16,17,20,21,22,23,25,26,27,29,30,31,34,35,36,37,39,40,41,42,44,45,46,47,48],thing:[4,26,30,37,40],those:[8,14],thread:17,three:[1,4,27,47,48],threshold:[4,43],through:[1,14,16,48],thu:[4,5,30,39],tile:[14,16],tile_batch:14,tiled_encoder_final_st:14,tiled_encoder_output:14,tiled_input:14,tiled_sequence_length:14,tim:14,time:[1,3,4,5,6,7,8,14,15,17,25,30,32,33,34,35,36,39,40,43,44,45],time_major:[5,6,15],time_stretch_ratio:2,timestep:[7,14,40],tip:46,titan:40,titl:8,tmp:[32,33],tobyyouup:13,todo:20,togeth:[8,14,17,40],toi:[24,25,32,33,35,42,44],tok:[26,41],token:[0,3,5,8,9,14,15,16,27,34,35,36,39,41,47,48],token_count:4,tokenizer_wrapp:[35,39],too:14,tool:[32,33],toolkit:31,top:[4,14,16],topic:30,topolog:43,total:[0,10,39,40,45],total_regularization_loss:10,tower:[8,18],toy_text_data:[26,37],tra:4,track:[14,17],tracks_own_finish:14,train:[0,1,4,5,6,8,10,12,14,15,16,17,24,26,30,31,34,37,41],train_ev:[8,24,25,26,27,30,32,33,35,37,41,42,44,47],train_model:17,train_op:8,train_param:[27,30,46,47],train_step:8,trainable_vari:10,trainer:10,training_step:8,transcript:[3,27,43,46,47],transform:[4,5,6,9,10,11,13,20,26,31,35,37,41],transform_for_bleu:8,transformer_decod:9,transformer_encod:9,transformer_polici:10,transformerdatalay:4,transformerdecod:5,transformerencod:6,translat:[4,8,14,16,24,31,36,37,39],transpos:16,treat:[8,10,30],tri:[6,41],trick:14,trie:[5,25,44],true_batch_s:14,true_siz:[8,17],tupl:[1,2,3,8,10,14,15,16],turn:39,tutori:[24,30,31],twice:4,two:[1,4,14,16,17,18,25,34,40,43,44,48],txt:[26,27,32,33,35,37,39,42,47],type:[0,1,2,3,4,5,6,7,8,10,12,13,14,15,16,39,40,43],typeerror:[10,14,15],typic:[0,5,6,7,40],ubuntu:33,ultim:6,unbatch:4,unchang:[14,16],under:[10,46],underflow:[14,40],undergo:1,underli:[2,40],underlin:4,understand:30,unescap:4,unescape_token:4,unfinish:15,uni:6,unicod:4,unidir_rnn_encoder_with_emb:6,unidirect:41,unidirectionalrnnencoderwithembed:6,uniqu:16,unit:[5,6,13,14,41,45],unittest:[32,33],unk_id:4,unknown:1,unnorm:48,unspecifi:14,until:48,unus:46,unused_kwarg:15,upcom:17,upd_dict:17,updat:[4,8,10,14,30,33,34,40],update_op:10,use:[0,1,4,5,6,7,8,10,14,15,18,20,24,25,26,30,32,33,35,36,37,40,41,42,43,44,45,48],use_bia:14,use_cudnn_rnn:6,use_horovod:[8,18,24,30,32,33,39,41],use_language_model:[5,32,33,41,42],use_new_attent:14,use_norm:10,use_staircase_decai:10,use_swap_memori:[5,6],used:[0,1,3,4,5,6,7,8,10,13,14,15,16,17,26,30,36,39,40,41,42,45,48],useful:[8,30,31],user:[14,40],uses:[7,13,14,25,26,37,40,43,44],using:[1,2,4,6,8,10,14,17,18,20,26,27,32,33,35,39,40,41,42,45,47,48],usual:[5,7,14,25,33,40,43,44],util:[1,8,9,11,40],utter:[25,44],v100:40,val:[27,47],valid:[0,1,4,5,6,8,10,14,17,24,30,32,33,41,42],valid_word_count_weight:5,valu:[1,3,4,5,6,8,10,13,14,15,16,17,30,40],value_channel:16,valueerror:[1,10,14],var_list:10,var_scope_nam:13,vari:[39,43],variabl:[4,5,6,7,8,10,13,14,16,17,30,40],variable_norm:[8,30],varianc:40,variant:6,varibl:45,varieti:40,variou:[5,6,10,30],vaswani:39,vector:[1,13,14],venkatesh:40,verbos:[6,17],veri:[3,14,26,36,39,42,43],versa:14,version:[4,5,14,33,39,40,42],vgg:1,via:[14,27,34,47,48],vice:14,view:[4,26,37],visual:[8,10],vocab:[0,4,8,17,27,47],vocab_fil:[2,3,4,27,47],vocab_s:[5,16],vocab_tt:[27,47],vocabluari:35,vocabulari:[0,2,3,4,5,6,7,17,26,36,39,43,45],volta:[24,40,41],w2l_encod:9,w2l_large_8gpu:41,w2l_plus_large_mp:[42,45],wai:[4,8,10,40],wang:14,want:[6,25,26,27,30,33,35,42,44,46,47,48],warm:[10,41],warmpup:36,warmup:36,warmup_step:10,wav2lett:[6,41],wav:[3,8,27,46,47],wave2lett:[6,31],wave2letterencod:6,wave2letterv2:45,wave:[2,3],waveform:[43,45],wavel2lett:42,wavelength:16,wavenet:14,weight:[5,6,13,14,16,17,40,43,45,48],weight_norm:13,weiss:14,well:[5,6,8,26,37,43,48],wer:[41,42,43,45],were:[6,14,26,43],wether:5,what:[28,48],when:[0,1,3,4,5,6,8,10,14,15,16,17,18,24,30,32,33,39,40,41,45,48],whenev:[30,40],where:[1,3,4,8,10,14,16,20,26,30,37,40,43],wherea:48,whether:[0,1,3,4,5,6,7,8,10,13,14,15,16,30],which:[0,1,3,4,5,6,7,8,10,14,16,17,20,26,30,37,39,40,41,43,45,48],whl:[32,33],whole:[8,30,43],whose:14,width:[1,5,6,13,45],width_in:6,window:[2,3,45],window_s:[2,3],window_strid:[2,3],wise:[38,43,45],within:[6,42],without:[1,5,6,16,24,30,32,33,39,40,41,43,45],wmt14:[35,39],wmt16_de_en:[35,39],wmt:[26,35,36,39],word:[0,4,5,8,35,41,42,43,45,48],word_count_weight:5,work:[5,8,26,30,33,34,37,41,43],worker:[4,7,8,17],worker_id:[0,1,2,3,4,8,20],workshop:14,wors:32,worst:[14,16],worth:40,would:[27,32,33,42,47],wrap:[4,5,14,17,40],wrapper:[1,5,6,7,14,16,40],write:[17,30],wrong:14,xiangyu:6,xmax:1,xmin:1,yang:14,yanni:14,ymax:1,ymin:1,yonghui:14,yoshua:14,you:[0,1,4,6,8,10,14,16,17,18,20,24,25,26,27,30,31,32,33,35,37,39,40,41,42,44,46,47],your:[0,1,4,20,24,26,27,30,32,33,35,39,42,46,47],yourself:40,yuxuan:14,zero:[8,14,16],zero_st:14,zhang:[6,14],zhifeng:14,zoneout:[5,6,9,11,48],zoneout_prob:[5,6,14],zoneoutwrapp:14,zongheng:14},titles:["data","image2label","speech2text","text2speech","text2text","decoders","encoders","losses","models","API documentation","optimizers","parts","cnns","convs2s","rnns","tacotron","transformer","utils","Distributed training","Adding new models","Adding new data layer","Adding new decoder","Adding new encoder","Adding new loss","Getting started","Speech Recognition","Machine Translation","Text-To-Speech","In-depth tutorials","Internal structure","Using existing models","OpenSeq2Seq","Installation instructions","Installation","Interactive Infer Mode","Machine Translation","ConvS2S","Getting Started","GNMT","Transformer","Mixed precision training","Models and recipes","Speech Recognition","DeepSpeech2","Speech Recognition","Wave2Letter+","Speech Synthesis","Text-To-Speech","Tacotron 2"],titleterms:{"new":[19,20,21,22,23],Adding:[19,20,21,22,23],Using:30,add:[32,33],adventur:[26,37],api:9,attention_lay:16,attention_wn_lay:13,attention_wrapp:14,automat:40,automatic_loss_scal:10,beam_search:16,being:30,bleu:[26,35],bpe:26,build:[25,44],clean:26,cnn:12,cnn_encod:6,common:16,comput:[26,35],config:30,conv_block:12,conv_wn_lay:13,convs2:[13,36],convs2s_decod:5,convs2s_encod:6,creat:26,cross_entropy_loss:7,ctc:[32,33],ctc_loss:7,data:[0,20,34,35,42,46],data_lay:0,dataset:[25,27,44,47],decod:[5,21,32,33],deepspeech2:43,depth:28,descript:48,detail:40,distribut:18,document:9,download:[32,33],ds2_encod:6,embedding_lay:16,enabl:[34,40],encod:[6,22],encoder_decod:8,english:26,evalu:42,exampl:34,exist:30,fc_decod:5,feel:[26,37],ffn_layer:16,ffn_wn_layer:13,flstm:14,func:17,gener:[32,33],german:26,get:[24,35,37,42,46],glstm:14,gnmt:[14,38],gpu:48,hook:17,horovod:[32,33],how:[25,27,30,32,33,34,40,44,47],image2label:[1,8],imagenet_preprocess:1,implement:40,infer:[26,34,35,42,46],instal:[32,33],instruct:32,interact:34,intern:29,introduct:34,jupyt:34,languag:[25,32,33,44],layer:[20,34],librispeech:[25,44],ljspeech:[27,47],log:30,loss:[7,23,40],lr_polici:10,machin:[26,35,41],mix:[36,38,39,40,43,45,48],mode:34,model:[8,19,25,27,30,32,33,35,36,38,39,41,42,43,44,45,46,47,48],mp_wrapper:10,multi:48,notebook:34,openseq2seq:[31,32,33],optim:[10,40],own:[25,44],paramet:30,part:11,pre:43,precis:[36,38,39,40,43,45,48],prerequisit:40,recip:41,recognit:[25,32,33,41,42,44],regular:40,resnet_block:6,resnet_encod:6,revers:[26,37],rnn:14,rnn_beam_search_decod:14,rnn_decod:5,rnn_encod:6,run:[26,30,32,33,34],scale:40,score:[26,35],segment:26,sequenc:[26,37],sequence_loss:7,slstm:14,speech2text:[2,8],speech:[25,27,32,33,41,42,44,46,47],speech_util:[2,3],start:[24,35,37,42,46],structur:29,synthesi:46,t2t:4,tacotron2_decod:5,tacotron2_encod:6,tacotron:[15,48],tacotron_decod:15,tacotron_help:15,tacotron_loss:7,task:[26,37],tensorflow:[32,33],test:[32,33],text2speech:[3,8],text2text:[4,8],text:[27,41,47],tip:48,toi:[26,37],token:4,train:[18,25,27,32,33,35,36,38,39,40,42,43,44,45,46,47,48],transform:[16,39],transformer_decod:5,transformer_encod:6,translat:[26,35,41],trick:48,tutori:28,util:[0,14,16,17],w2l_encod:6,wave2lett:45,what:30,your:[25,44],zoneout:14}})
\ No newline at end of file
+Search.setIndex({docnames:["api-docs/data","api-docs/data.image2label","api-docs/data.speech2text","api-docs/data.text2speech","api-docs/data.text2text","api-docs/decoders","api-docs/encoders","api-docs/losses","api-docs/models","api-docs/modules","api-docs/optimizers","api-docs/parts","api-docs/parts.cnns","api-docs/parts.convs2s","api-docs/parts.rnns","api-docs/parts.tacotron","api-docs/parts.transformer","api-docs/utils","distr-training","extending","extending/adding-new-data-layer","extending/adding-new-decoder","extending/adding-new-encoder","extending/adding-new-loss","getting-started","getting-started/asr","getting-started/nmt","getting-started/tts","in-depth-tutorials","in-depth-tutorials/internal-structure","in-depth-tutorials/using-existing-models","index","installation","installation-instructions","interactive-infer-demos","machine-translation","machine-translation/convs2s","machine-translation/get_started_nmt","machine-translation/gnmt","machine-translation/transformer","mixed-precision","speech-recognition","speech-recognition/deepspeech2","speech-recognition/get_started_toy_model","speech-recognition/wave2letter","speech-synthesis","speech-synthesis/get_started_tts","speech-synthesis/tacotron-2"],envversion:53,filenames:["api-docs/data.rst","api-docs/data.image2label.rst","api-docs/data.speech2text.rst","api-docs/data.text2speech.rst","api-docs/data.text2text.rst","api-docs/decoders.rst","api-docs/encoders.rst","api-docs/losses.rst","api-docs/models.rst","api-docs/modules.rst","api-docs/optimizers.rst","api-docs/parts.rst","api-docs/parts.cnns.rst","api-docs/parts.convs2s.rst","api-docs/parts.rnns.rst","api-docs/parts.tacotron.rst","api-docs/parts.transformer.rst","api-docs/utils.rst","distr-training.rst","extending.rst","extending/adding-new-data-layer.rst","extending/adding-new-decoder.rst","extending/adding-new-encoder.rst","extending/adding-new-loss.rst","getting-started.rst","getting-started/asr.rst","getting-started/nmt.rst","getting-started/tts.rst","in-depth-tutorials.rst","in-depth-tutorials/internal-structure.rst","in-depth-tutorials/using-existing-models.rst","index.rst","installation.rst","installation-instructions.rst","interactive-infer-demos.rst","machine-translation.rst","machine-translation/convs2s.rst","machine-translation/get_started_nmt.rst","machine-translation/gnmt.rst","machine-translation/transformer.rst","mixed-precision.rst","speech-recognition.rst","speech-recognition/deepspeech2.rst","speech-recognition/get_started_toy_model.rst","speech-recognition/wave2letter.rst","speech-synthesis.rst","speech-synthesis/get_started_tts.rst","speech-synthesis/tacotron-2.rst"],objects:{"":{data:[0,0,0,"-"],decoders:[5,0,0,"-"],encoders:[6,0,0,"-"],losses:[7,0,0,"-"],models:[8,0,0,"-"],optimizers:[10,0,0,"-"],parts:[11,0,0,"-"],utils:[17,0,0,"-"]},"data.data_layer":{DataLayer:[0,1,1,""]},"data.data_layer.DataLayer":{__init__:[0,2,1,""],build_graph:[0,2,1,""],create_feed_dict:[0,2,1,""],create_interactive_placeholders:[0,2,1,""],get_optional_params:[0,3,1,""],get_required_params:[0,3,1,""],get_size_in_samples:[0,2,1,""],input_tensors:[0,4,1,""],iterator:[0,4,1,""],params:[0,4,1,""]},"data.image2label":{image2label:[1,0,0,"-"],imagenet_preprocessing:[1,0,0,"-"]},"data.image2label.image2label":{CifarDataLayer:[1,1,1,""],ImagenetDataLayer:[1,1,1,""]},"data.image2label.image2label.CifarDataLayer":{build_graph:[1,2,1,""],get_optional_params:[1,3,1,""],get_required_params:[1,3,1,""],get_size_in_samples:[1,2,1,""],input_tensors:[1,4,1,""],iterator:[1,4,1,""],parse_record:[1,2,1,""],preprocess_image:[1,2,1,""]},"data.image2label.image2label.ImagenetDataLayer":{build_graph:[1,2,1,""],get_optional_params:[1,3,1,""],get_required_params:[1,3,1,""],get_size_in_samples:[1,2,1,""],input_tensors:[1,4,1,""],iterator:[1,4,1,""],split_data:[1,2,1,""]},"data.image2label.imagenet_preprocessing":{_aspect_preserving_resize:[1,5,1,""],_central_crop:[1,5,1,""],_decode_crop_and_flip:[1,5,1,""],_mean_image_subtraction_and_normalization:[1,5,1,""],_parse_example_proto:[1,5,1,""],_resize_image:[1,5,1,""],_smallest_size_at_least:[1,5,1,""],parse_record:[1,5,1,""],preprocess_image:[1,5,1,""]},"data.speech2text":{speech2text:[2,0,0,"-"],speech_utils:[2,0,0,"-"]},"data.speech2text.speech2text":{Speech2TextDataLayer:[2,1,1,""]},"data.speech2text.speech2text.Speech2TextDataLayer":{__init__:[2,2,1,""],_get_audio:[2,2,1,""],_parse_audio_element:[2,2,1,""],_parse_audio_transcript_element:[2,2,1,""],build_graph:[2,2,1,""],create_feed_dict:[2,2,1,""],create_interactive_placeholders:[2,2,1,""],get_optional_params:[2,3,1,""],get_required_params:[2,3,1,""],get_size_in_samples:[2,2,1,""],input_tensors:[2,4,1,""],iterator:[2,4,1,""],split_data:[2,2,1,""]},"data.speech2text.speech_utils":{augment_audio_signal:[2,5,1,""],get_speech_features:[2,5,1,""],get_speech_features_from_file:[2,5,1,""],normalize_signal:[2,5,1,""]},"data.text2speech":{speech_utils:[3,0,0,"-"],text2speech:[3,0,0,"-"]},"data.text2speech.speech_utils":{denormalize:[3,5,1,""],get_mel:[3,5,1,""],get_speech_features:[3,5,1,""],get_speech_features_from_file:[3,5,1,""],inverse_mel:[3,5,1,""],normalize:[3,5,1,""]},"data.text2speech.text2speech":{Text2SpeechDataLayer:[3,1,1,""]},"data.text2speech.text2speech.Text2SpeechDataLayer":{__init__:[3,2,1,""],_parse_audio_transcript_element:[3,2,1,""],_parse_transcript_element:[3,2,1,""],build_graph:[3,2,1,""],create_feed_dict:[3,2,1,""],create_interactive_placeholders:[3,2,1,""],get_magnitude_spec:[3,2,1,""],get_optional_params:[3,3,1,""],get_required_params:[3,3,1,""],get_size_in_samples:[3,2,1,""],input_tensors:[3,4,1,""],iterator:[3,4,1,""],n_fft:[3,4,1,""],parse_text_output:[3,2,1,""],sampling_rate:[3,4,1,""],split_data:[3,2,1,""]},"data.text2text":{t2t:[4,0,0,"-"],text2text:[4,0,0,"-"],tokenizer:[4,0,0,"-"]},"data.text2text.t2t":{_batch_examples:[4,5,1,""],_create_min_max_boundaries:[4,5,1,""],_filter_max_length:[4,5,1,""],_get_example_length:[4,5,1,""],_load_records:[4,5,1,""],_parse_example:[4,5,1,""],_read_and_batch_from_files:[4,5,1,""]},"data.text2text.text2text":{ParallelTextDataLayer:[4,1,1,""],SpecialTextTokens:[4,1,1,""],TransformerDataLayer:[4,1,1,""]},"data.text2text.text2text.ParallelTextDataLayer":{build_graph:[4,2,1,""],create_feed_dict:[4,2,1,""],create_interactive_placeholders:[4,2,1,""],get_optional_params:[4,3,1,""],get_required_params:[4,3,1,""],get_size_in_samples:[4,2,1,""],input_tensors:[4,4,1,""],iterator:[4,4,1,""]},"data.text2text.text2text.SpecialTextTokens":{END_OF_CHOICE:[4,4,1,""],EOS_ID:[4,4,1,""],OUT_OF_BUCKET:[4,4,1,""],PAD_ID:[4,4,1,""],S_ID:[4,4,1,""],UNK_ID:[4,4,1,""]},"data.text2text.text2text.TransformerDataLayer":{build_graph:[4,2,1,""],get_optional_params:[4,3,1,""],get_required_params:[4,3,1,""],input_tensors:[4,4,1,""],iterator:[4,4,1,""]},"data.text2text.tokenizer":{Subtokenizer:[4,1,1,""],_count_and_gen_subtokens:[4,5,1,""],_count_tokens:[4,5,1,""],_escape_token:[4,5,1,""],_filter_and_bucket_subtokens:[4,5,1,""],_gen_new_subtoken_list:[4,5,1,""],_generate_alphabet_dict:[4,5,1,""],_generate_subtokens:[4,5,1,""],_generate_subtokens_with_target_vocab_size:[4,5,1,""],_list_to_index_dict:[4,5,1,""],_load_vocab_file:[4,5,1,""],_native_to_unicode:[4,5,1,""],_save_vocab_file:[4,5,1,""],_split_string_to_tokens:[4,5,1,""],_split_token_to_subtokens:[4,5,1,""],_unicode_to_native:[4,5,1,""],join_tokens_to_string:[4,5,1,""],unescape_token:[4,5,1,""]},"data.text2text.tokenizer.Subtokenizer":{__init__:[4,2,1,""],_subtoken_ids_to_tokens:[4,2,1,""],_token_to_subtoken_ids:[4,2,1,""],decode:[4,2,1,""],encode:[4,2,1,""],init_from_files:[4,3,1,""]},"data.utils":{load_pre_existing_vocabulary:[0,5,1,""],pad_vocab_to_eight:[0,5,1,""]},"decoders.convs2s_decoder":{ConvS2SDecoder:[5,1,1,""]},"decoders.convs2s_decoder.ConvS2SDecoder":{_get_symbols_to_logits_fn:[5,2,1,""],decode_pass:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""],predict:[5,2,1,""]},"decoders.decoder":{Decoder:[5,1,1,""]},"decoders.decoder.Decoder":{__init__:[5,2,1,""],_cast_types:[5,2,1,""],_decode:[5,2,1,""],decode:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""],mode:[5,4,1,""],name:[5,4,1,""],params:[5,4,1,""]},"decoders.fc_decoders":{FullyConnectedCTCDecoder:[5,1,1,""],FullyConnectedDecoder:[5,1,1,""],FullyConnectedTimeDecoder:[5,1,1,""]},"decoders.fc_decoders.FullyConnectedCTCDecoder":{__init__:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""]},"decoders.fc_decoders.FullyConnectedDecoder":{__init__:[5,2,1,""],_decode:[5,2,1,""],get_required_params:[5,3,1,""]},"decoders.fc_decoders.FullyConnectedTimeDecoder":{__init__:[5,2,1,""],_decode:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""]},"decoders.rnn_decoders":{BeamSearchRNNDecoderWithAttention:[5,1,1,""],RNNDecoderWithAttention:[5,1,1,""]},"decoders.rnn_decoders.BeamSearchRNNDecoderWithAttention":{__init__:[5,2,1,""],_decode:[5,2,1,""],get_optional_params:[5,3,1,""]},"decoders.rnn_decoders.RNNDecoderWithAttention":{__init__:[5,2,1,""],_build_attention:[5,2,1,""],_decode:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""]},"decoders.tacotron2_decoder":{Prenet:[5,1,1,""],Tacotron2Decoder:[5,1,1,""]},"decoders.tacotron2_decoder.Prenet":{__init__:[5,2,1,""],add_regularization:[5,2,1,""],output_size:[5,4,1,""]},"decoders.tacotron2_decoder.Tacotron2Decoder":{__init__:[5,2,1,""],_build_attention:[5,2,1,""],_decode:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""]},"decoders.transformer_decoder":{TransformerDecoder:[5,1,1,""]},"decoders.transformer_decoder.TransformerDecoder":{_get_symbols_to_logits_fn:[5,2,1,""],decode_pass:[5,2,1,""],get_optional_params:[5,3,1,""],get_required_params:[5,3,1,""],predict:[5,2,1,""]},"encoders.cnn_encoder":{CNNEncoder:[6,1,1,""],build_layer:[6,5,1,""]},"encoders.cnn_encoder.CNNEncoder":{__init__:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"encoders.convs2s_encoder":{ConvS2SEncoder:[6,1,1,""]},"encoders.convs2s_encoder.ConvS2SEncoder":{get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.ds2_encoder":{DeepSpeech2Encoder:[6,1,1,""],rnn_cell:[6,5,1,""],row_conv:[6,5,1,""]},"encoders.ds2_encoder.DeepSpeech2Encoder":{__init__:[6,2,1,""],_encode:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"encoders.encoder":{Encoder:[6,1,1,""]},"encoders.encoder.Encoder":{__init__:[6,2,1,""],_cast_types:[6,2,1,""],_encode:[6,2,1,""],encode:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],mode:[6,4,1,""],name:[6,4,1,""],params:[6,4,1,""]},"encoders.resnet_blocks":{batch_norm:[6,5,1,""],block_layer:[6,5,1,""],bottleneck_block_v1:[6,5,1,""],bottleneck_block_v2:[6,5,1,""],building_block_v1:[6,5,1,""],building_block_v2:[6,5,1,""],conv2d_fixed_padding:[6,5,1,""],fixed_padding:[6,5,1,""]},"encoders.resnet_encoder":{ResNetEncoder:[6,1,1,""]},"encoders.resnet_encoder.ResNetEncoder":{get_optional_params:[6,3,1,""]},"encoders.rnn_encoders":{BidirectionalRNNEncoderWithEmbedding:[6,1,1,""],GNMTLikeEncoderWithEmbedding:[6,1,1,""],GNMTLikeEncoderWithEmbedding_cuDNN:[6,1,1,""],UnidirectionalRNNEncoderWithEmbedding:[6,1,1,""]},"encoders.rnn_encoders.BidirectionalRNNEncoderWithEmbedding":{__init__:[6,2,1,""],_encode:[6,2,1,""],enc_emb_w:[6,4,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.rnn_encoders.GNMTLikeEncoderWithEmbedding":{__init__:[6,2,1,""],enc_emb_w:[6,4,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.rnn_encoders.GNMTLikeEncoderWithEmbedding_cuDNN":{__init__:[6,2,1,""],enc_emb_w:[6,4,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.rnn_encoders.UnidirectionalRNNEncoderWithEmbedding":{__init__:[6,2,1,""],_encode:[6,2,1,""],enc_emb_w:[6,4,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""],src_emb_size:[6,4,1,""],src_vocab_size:[6,4,1,""]},"encoders.tacotron2_encoder":{Tacotron2Encoder:[6,1,1,""]},"encoders.tacotron2_encoder.Tacotron2Encoder":{__init__:[6,2,1,""],_encode:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"encoders.transformer_encoder":{TransformerEncoder:[6,1,1,""]},"encoders.transformer_encoder.TransformerEncoder":{get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"encoders.w2l_encoder":{Wave2LetterEncoder:[6,1,1,""]},"encoders.w2l_encoder.Wave2LetterEncoder":{__init__:[6,2,1,""],_encode:[6,2,1,""],get_optional_params:[6,3,1,""],get_required_params:[6,3,1,""]},"losses.cross_entropy_loss":{CrossEntropyLoss:[7,1,1,""]},"losses.ctc_loss":{CTCLoss:[7,1,1,""],dense_to_sparse:[7,5,1,""]},"losses.ctc_loss.CTCLoss":{__init__:[7,2,1,""],_compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""]},"losses.loss":{Loss:[7,1,1,""]},"losses.loss.Loss":{__init__:[7,2,1,""],_cast_types:[7,2,1,""],_compute_loss:[7,2,1,""],compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""],get_required_params:[7,3,1,""],name:[7,4,1,""],params:[7,4,1,""]},"losses.sequence_loss":{BasicSampledSequenceLoss:[7,1,1,""],BasicSequenceLoss:[7,1,1,""],CrossEntropyWithSmoothing:[7,1,1,""],PaddedCrossEntropyLossWithSmoothing:[7,1,1,""]},"losses.sequence_loss.BasicSampledSequenceLoss":{__init__:[7,2,1,""],_compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""],get_required_params:[7,3,1,""]},"losses.sequence_loss.BasicSequenceLoss":{__init__:[7,2,1,""],_compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""],get_required_params:[7,3,1,""]},"losses.sequence_loss.CrossEntropyWithSmoothing":{__init__:[7,2,1,""],_compute_loss:[7,2,1,""],get_optional_params:[7,3,1,""],get_required_params:[7,3,1,""]},"losses.sequence_loss.PaddedCrossEntropyLossWithSmoothing":{get_optional_params:[7,3,1,""]},"losses.tacotron_loss":{TacotronLoss:[7,1,1,""]},"losses.tacotron_loss.TacotronLoss":{_compute_loss:[7,2,1,""],get_optional_params:[7,2,1,""]},"models.encoder_decoder":{EncoderDecoderModel:[8,1,1,""]},"models.encoder_decoder.EncoderDecoderModel":{__init__:[8,2,1,""],_build_forward_pass_graph:[8,2,1,""],_create_decoder:[8,2,1,""],_create_encoder:[8,2,1,""],_create_loss:[8,2,1,""],decoder:[8,4,1,""],encoder:[8,4,1,""],get_optional_params:[8,3,1,""],get_required_params:[8,3,1,""],loss_computator:[8,4,1,""]},"models.image2label":{Image2Label:[8,1,1,""]},"models.image2label.Image2Label":{_get_num_objects_per_step:[8,2,1,""],evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],maybe_print_logs:[8,2,1,""]},"models.model":{Model:[8,1,1,""]},"models.model.Model":{__init__:[8,2,1,""],_build_forward_pass_graph:[8,2,1,""],_get_num_objects_per_step:[8,2,1,""],build_forward_pass_graph:[8,2,1,""],clip_last_batch:[8,2,1,""],compile:[8,2,1,""],evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],finalize_inference:[8,2,1,""],get_data_layer:[8,2,1,""],get_num_objects_per_step:[8,2,1,""],get_optional_params:[8,3,1,""],get_output_tensors:[8,2,1,""],get_required_params:[8,3,1,""],get_tf_dtype:[8,2,1,""],hvd:[8,4,1,""],infer:[8,2,1,""],last_step:[8,4,1,""],maybe_print_logs:[8,2,1,""],mode:[8,4,1,""],num_gpus:[8,4,1,""],on_horovod:[8,4,1,""],params:[8,4,1,""],steps_in_epoch:[8,4,1,""]},"models.speech2text":{Speech2Text:[8,1,1,""],levenshtein:[8,5,1,""],sparse_tensor_to_chars:[8,5,1,""]},"models.speech2text.Speech2Text":{_get_num_objects_per_step:[8,2,1,""],evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],finalize_inference:[8,2,1,""],infer:[8,2,1,""],maybe_print_logs:[8,2,1,""]},"models.text2speech":{Text2Speech:[8,1,1,""],griffin_lim:[8,5,1,""],plot_spectrograms:[8,5,1,""],save_audio:[8,5,1,""]},"models.text2speech.Text2Speech":{evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],finalize_inference:[8,2,1,""],get_required_params:[8,3,1,""],infer:[8,2,1,""],maybe_print_logs:[8,2,1,""]},"models.text2text":{Text2Text:[8,1,1,""],calculate_bleu:[8,5,1,""],transform_for_bleu:[8,5,1,""]},"models.text2text.Text2Text":{_get_num_objects_per_step:[8,2,1,""],evaluate:[8,2,1,""],finalize_evaluation:[8,2,1,""],finalize_inference:[8,2,1,""],infer:[8,2,1,""],maybe_print_logs:[8,2,1,""]},"optimizers.automatic_loss_scaler":{AutomaticLossScaler:[10,1,1,""],BackoffScaler:[10,1,1,""],LogMaxScaler:[10,1,1,""]},"optimizers.automatic_loss_scaler.AutomaticLossScaler":{SUPPORTED_ALGOS:[10,4,1,""],check_grads:[10,3,1,""],loss_scale:[10,4,1,""],update_op:[10,2,1,""]},"optimizers.automatic_loss_scaler.BackoffScaler":{loss_scale:[10,4,1,""],update_op:[10,2,1,""]},"optimizers.automatic_loss_scaler.LogMaxScaler":{loss_scale:[10,4,1,""],update_op:[10,2,1,""]},"optimizers.lr_policies":{exp_decay:[10,5,1,""],fixed_lr:[10,5,1,""],piecewise_constant:[10,5,1,""],poly_decay:[10,5,1,""],transformer_policy:[10,5,1,""]},"optimizers.mp_wrapper":{MixedPrecisionOptimizerWrapper:[10,1,1,""],mp_regularizer_wrapper:[10,5,1,""]},"optimizers.mp_wrapper.MixedPrecisionOptimizerWrapper":{apply_gradients:[10,2,1,""],compute_gradients:[10,2,1,""]},"optimizers.optimizers":{_clip_by_global_norm:[10,5,1,""],_clip_gradients_by_norm:[10,5,1,""],get_regularization_loss:[10,5,1,""],optimize_loss:[10,5,1,""],post_process_gradients:[10,5,1,""],reduce_gradients:[10,5,1,""]},"parts.cnns":{conv_blocks:[12,0,0,"-"]},"parts.cnns.conv_blocks":{conv_actv:[12,5,1,""],conv_bn_actv:[12,5,1,""],conv_in_actv:[12,5,1,""],conv_ln_actv:[12,5,1,""]},"parts.convs2s":{attention_wn_layer:[13,0,0,"-"],conv_wn_layer:[13,0,0,"-"],ffn_wn_layer:[13,0,0,"-"]},"parts.convs2s.attention_wn_layer":{AttentionLayerNormalized:[13,1,1,""]},"parts.convs2s.attention_wn_layer.AttentionLayerNormalized":{__init__:[13,2,1,""],call:[13,2,1,""]},"parts.convs2s.conv_wn_layer":{Conv1DNetworkNormalized:[13,1,1,""]},"parts.convs2s.conv_wn_layer.Conv1DNetworkNormalized":{__init__:[13,2,1,""],call:[13,2,1,""]},"parts.convs2s.ffn_wn_layer":{FeedFowardNetworkNormalized:[13,1,1,""]},"parts.convs2s.ffn_wn_layer.FeedFowardNetworkNormalized":{__init__:[13,2,1,""],call:[13,2,1,""]},"parts.rnns":{attention_wrapper:[14,0,0,"-"],flstm:[14,0,0,"-"],glstm:[14,0,0,"-"],gnmt:[14,0,0,"-"],rnn_beam_search_decoder:[14,0,0,"-"],slstm:[14,0,0,"-"],utils:[14,0,0,"-"],zoneout:[14,0,0,"-"]},"parts.rnns.attention_wrapper":{AttentionMechanism:[14,1,1,""],AttentionWrapper:[14,1,1,""],AttentionWrapperState:[14,1,1,""],BahdanauAttention:[14,1,1,""],BahdanauMonotonicAttention:[14,1,1,""],LocationSensitiveAttention:[14,1,1,""],LuongAttention:[14,1,1,""],LuongMonotonicAttention:[14,1,1,""],hardmax:[14,5,1,""],monotonic_attention:[14,5,1,""],safe_cumprod:[14,5,1,""]},"parts.rnns.attention_wrapper.AttentionMechanism":{alignments_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.rnns.attention_wrapper.AttentionWrapper":{__init__:[14,2,1,""],_item_or_tuple:[14,2,1,""],call:[14,2,1,""],output_size:[14,4,1,""],state_size:[14,4,1,""],zero_state:[14,2,1,""]},"parts.rnns.attention_wrapper.AttentionWrapperState":{clone:[14,2,1,""]},"parts.rnns.attention_wrapper.BahdanauAttention":{__init__:[14,2,1,""]},"parts.rnns.attention_wrapper.BahdanauMonotonicAttention":{__init__:[14,2,1,""]},"parts.rnns.attention_wrapper.LocationSensitiveAttention":{__init__:[14,2,1,""]},"parts.rnns.attention_wrapper.LuongAttention":{__init__:[14,2,1,""]},"parts.rnns.attention_wrapper.LuongMonotonicAttention":{__init__:[14,2,1,""]},"parts.rnns.flstm":{FLSTMCell:[14,1,1,""]},"parts.rnns.flstm.FLSTMCell":{__init__:[14,2,1,""],call:[14,2,1,""],output_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.rnns.glstm":{GLSTMCell:[14,1,1,""]},"parts.rnns.glstm.GLSTMCell":{__init__:[14,2,1,""],_get_input_for_group:[14,2,1,""],call:[14,2,1,""],output_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.rnns.gnmt":{GNMTAttentionMultiCell:[14,1,1,""],gnmt_residual_fn:[14,5,1,""]},"parts.rnns.gnmt.GNMTAttentionMultiCell":{__init__:[14,2,1,""]},"parts.rnns.rnn_beam_search_decoder":{BeamSearchDecoder:[14,1,1,""],BeamSearchDecoderOutput:[14,1,1,""],BeamSearchDecoderState:[14,1,1,""],FinalBeamSearchDecoderOutput:[14,1,1,""],tile_batch:[14,5,1,""]},"parts.rnns.rnn_beam_search_decoder.BeamSearchDecoder":{__init__:[14,2,1,""],_maybe_merge_batch_beams:[14,2,1,""],_maybe_split_batch_beams:[14,2,1,""],_merge_batch_beams:[14,2,1,""],_split_batch_beams:[14,2,1,""],batch_size:[14,4,1,""],finalize:[14,2,1,""],initialize:[14,2,1,""],output_dtype:[14,4,1,""],output_size:[14,4,1,""],step:[14,2,1,""],tracks_own_finished:[14,4,1,""]},"parts.rnns.slstm":{BasicSLSTMCell:[14,1,1,""],_linear:[14,5,1,""]},"parts.rnns.slstm.BasicSLSTMCell":{__init__:[14,2,1,""],call:[14,2,1,""],output_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.rnns.utils":{single_cell:[14,5,1,""]},"parts.rnns.zoneout":{ZoneoutWrapper:[14,1,1,""]},"parts.rnns.zoneout.ZoneoutWrapper":{output_size:[14,4,1,""],state_size:[14,4,1,""]},"parts.tacotron":{tacotron_decoder:[15,0,0,"-"],tacotron_helper:[15,0,0,"-"]},"parts.tacotron.tacotron_decoder":{BasicDecoderOutput:[15,1,1,""],TacotronDecoder:[15,1,1,""]},"parts.tacotron.tacotron_decoder.TacotronDecoder":{__init__:[15,2,1,""],batch_size:[15,4,1,""],initialize:[15,2,1,""],output_dtype:[15,4,1,""],output_size:[15,4,1,""],step:[15,2,1,""]},"parts.tacotron.tacotron_helper":{TacotronHelper:[15,1,1,""],TacotronTrainingHelper:[15,1,1,""]},"parts.tacotron.tacotron_helper.TacotronHelper":{__init__:[15,2,1,""],batch_size:[15,4,1,""],initialize:[15,2,1,""],next_inputs:[15,2,1,""],sample:[15,2,1,""],sample_ids_dtype:[15,4,1,""],sample_ids_shape:[15,4,1,""]},"parts.tacotron.tacotron_helper.TacotronTrainingHelper":{__init__:[15,2,1,""],batch_size:[15,4,1,""],initialize:[15,2,1,""],next_inputs:[15,2,1,""],sample:[15,2,1,""],sample_ids_dtype:[15,4,1,""],sample_ids_shape:[15,4,1,""]},"parts.transformer":{attention_layer:[16,0,0,"-"],beam_search:[16,0,0,"-"],common:[16,0,0,"-"],embedding_layer:[16,0,0,"-"],ffn_layer:[16,0,0,"-"],utils:[16,0,0,"-"]},"parts.transformer.attention_layer":{Attention:[16,1,1,""],SelfAttention:[16,1,1,""]},"parts.transformer.attention_layer.Attention":{call:[16,2,1,""],combine_heads:[16,2,1,""],split_heads:[16,2,1,""]},"parts.transformer.attention_layer.SelfAttention":{call:[16,2,1,""]},"parts.transformer.beam_search":{SequenceBeamSearch:[16,1,1,""],_StateKeys:[16,1,1,""],_expand_to_beam_size:[16,5,1,""],_flatten_beam_dim:[16,5,1,""],_gather_beams:[16,5,1,""],_gather_topk_beams:[16,5,1,""],_length_normalization:[16,5,1,""],_shape_list:[16,5,1,""],_unflatten_beam_dim:[16,5,1,""],sequence_beam_search:[16,5,1,""]},"parts.transformer.beam_search.SequenceBeamSearch":{_continue_search:[16,2,1,""],_create_initial_state:[16,2,1,""],_get_new_alive_state:[16,2,1,""],_get_new_finished_state:[16,2,1,""],_grow_alive_seq:[16,2,1,""],_search_step:[16,2,1,""],search:[16,2,1,""]},"parts.transformer.beam_search._StateKeys":{ALIVE_CACHE:[16,4,1,""],ALIVE_LOG_PROBS:[16,4,1,""],ALIVE_SEQ:[16,4,1,""],CUR_INDEX:[16,4,1,""],FINISHED_FLAGS:[16,4,1,""],FINISHED_SCORES:[16,4,1,""],FINISHED_SEQ:[16,4,1,""]},"parts.transformer.common":{LayerNormalization:[16,1,1,""],PrePostProcessingWrapper:[16,1,1,""]},"parts.transformer.common.LayerNormalization":{build:[16,2,1,""],call:[16,2,1,""]},"parts.transformer.embedding_layer":{EmbeddingSharedWeights:[16,1,1,""]},"parts.transformer.embedding_layer.EmbeddingSharedWeights":{build:[16,2,1,""],call:[16,2,1,""],linear:[16,2,1,""]},"parts.transformer.ffn_layer":{FeedFowardNetwork:[16,1,1,""]},"parts.transformer.ffn_layer.FeedFowardNetwork":{call:[16,2,1,""]},"parts.transformer.utils":{get_decoder_self_attention_bias:[16,5,1,""],get_padding:[16,5,1,""],get_padding_bias:[16,5,1,""],get_position_encoding:[16,5,1,""]},"utils.funcs":{evaluate:[17,5,1,""],infer:[17,5,1,""],restore_and_get_results:[17,5,1,""],train:[17,5,1,""]},"utils.hooks":{BroadcastGlobalVariablesHook:[17,1,1,""],PrintLossAndTimeHook:[17,1,1,""],PrintSamplesHook:[17,1,1,""],RunEvaluationHook:[17,1,1,""]},"utils.hooks.BroadcastGlobalVariablesHook":{__init__:[17,2,1,""],after_create_session:[17,2,1,""],begin:[17,2,1,""]},"utils.hooks.PrintLossAndTimeHook":{after_run:[17,2,1,""],before_run:[17,2,1,""],begin:[17,2,1,""]},"utils.hooks.PrintSamplesHook":{after_run:[17,2,1,""],before_run:[17,2,1,""],begin:[17,2,1,""]},"utils.hooks.RunEvaluationHook":{after_run:[17,2,1,""],before_run:[17,2,1,""],begin:[17,2,1,""]},"utils.utils":{Logger:[17,1,1,""],array_to_string:[17,5,1,""],cast_types:[17,5,1,""],check_logdir:[17,5,1,""],check_params:[17,5,1,""],clip_last_batch:[17,5,1,""],clip_sparse:[17,5,1,""],collect_if_horovod:[17,5,1,""],create_logdir:[17,5,1,""],create_model:[17,5,1,""],deco_print:[17,5,1,""],flatten_dict:[17,5,1,""],get_available_gpus:[17,5,1,""],get_base_config:[17,5,1,""],get_git_diff:[17,5,1,""],get_git_hash:[17,5,1,""],get_interactive_infer_results:[17,5,1,""],get_results_for_epoch:[17,5,1,""],iterate_data:[17,5,1,""],log_summaries_from_dict:[17,5,1,""],mask_nans:[17,5,1,""],nest_dict:[17,5,1,""],nested_update:[17,5,1,""],text_ids_to_string:[17,5,1,""]},"utils.utils.Logger":{flush:[17,2,1,""],write:[17,2,1,""]},data:{data_layer:[0,0,0,"-"],image2label:[1,0,0,"-"],speech2text:[2,0,0,"-"],text2speech:[3,0,0,"-"],text2text:[4,0,0,"-"],utils:[0,0,0,"-"]},decoders:{convs2s_decoder:[5,0,0,"-"],decoder:[5,0,0,"-"],fc_decoders:[5,0,0,"-"],rnn_decoders:[5,0,0,"-"],tacotron2_decoder:[5,0,0,"-"],transformer_decoder:[5,0,0,"-"]},encoders:{cnn_encoder:[6,0,0,"-"],convs2s_encoder:[6,0,0,"-"],ds2_encoder:[6,0,0,"-"],encoder:[6,0,0,"-"],resnet_blocks:[6,0,0,"-"],resnet_encoder:[6,0,0,"-"],rnn_encoders:[6,0,0,"-"],tacotron2_encoder:[6,0,0,"-"],transformer_encoder:[6,0,0,"-"],w2l_encoder:[6,0,0,"-"]},losses:{cross_entropy_loss:[7,0,0,"-"],ctc_loss:[7,0,0,"-"],loss:[7,0,0,"-"],sequence_loss:[7,0,0,"-"],tacotron_loss:[7,0,0,"-"]},models:{encoder_decoder:[8,0,0,"-"],image2label:[8,0,0,"-"],model:[8,0,0,"-"],speech2text:[8,0,0,"-"],text2speech:[8,0,0,"-"],text2text:[8,0,0,"-"]},optimizers:{automatic_loss_scaler:[10,0,0,"-"],lr_policies:[10,0,0,"-"],mp_wrapper:[10,0,0,"-"],optimizers:[10,0,0,"-"]},parts:{cnns:[12,0,0,"-"],convs2s:[13,0,0,"-"],rnns:[14,0,0,"-"],tacotron:[15,0,0,"-"],transformer:[16,0,0,"-"]},utils:{funcs:[17,0,0,"-"],hooks:[17,0,0,"-"],utils:[17,0,0,"-"]}},objnames:{"0":["py","module","Python module"],"1":["py","class","Python class"],"2":["py","method","Python method"],"3":["py","staticmethod","Python static method"],"4":["py","attribute","Python attribute"],"5":["py","function","Python function"]},objtypes:{"0":"py:module","1":"py:class","2":"py:method","3":"py:staticmethod","4":"py:attribute","5":"py:function"},terms:{"106gb":[25,43],"10k":47,"10m":44,"16xlarg":40,"1e6":4,"1e9":16,"1x1":6,"20k":47,"20m":44,"224gb":[25,43],"2xlarg":40,"300k":39,"45k":47,"4gpu":[35,38],"55gb":[25,43],"85k":47,"8xlarg":40,"\u03b1":[26,37],"\u03b4":[26,37],"\u03b5":[26,37],"\u03b6":[26,37],"\u03ba":[26,37],"abstract":[0,5,6,7,8,34],"boolean":[1,6,14],"byte":4,"case":[0,5,6,7,8,10,14,18,20,30,35,40],"char":0,"class":[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,20,30],"default":[3,4,5,6,7,10,14,17,30,32,33,35,40,44],"enum":4,"export":[25,43],"final":[5,6,8,14,17,25,30,43,47],"float":[1,2,3,5,6,8,10,13,14,15,16,30,36,40],"function":[0,2,3,4,5,6,7,8,10,12,13,14,16,17,30,34,40],"import":[4,30,40],"int":[0,1,2,3,4,5,6,8,10,13,14,16,17,30],"long":14,"new":[0,1,4,13,14,16,17,28,30,31,34],"return":[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,20,40],"short":[14,30],"static":[0,1,2,3,4,5,6,7,8,10,14,20,30,40],"switch":47,"true":[0,1,3,4,5,6,7,8,10,14,15,16,17,18,24,30,32,33,41],"try":[6,10,26,30,33,37],"while":[1,4,5,20,26,30,35,39,40,41,44,45,47],AWS:40,Adative:44,Adding:28,And:[0,1,3,4,39,40],But:[8,42],EOS:[3,16],For:[1,2,4,5,6,8,10,14,17,20,24,25,26,27,30,32,33,34,35,37,39,40,41,43,45,46,47],IDs:4,Its:14,NOT:14,Not:5,One:[3,26,30,37,40,42],Such:[14,20,42],TTS:14,That:[0,1,4,5,8],The:[0,1,3,4,5,6,8,10,14,15,16,17,20,25,27,30,34,35,36,38,40,42,43,44,45,46,47],Then:39,There:[30,42,47],These:[1,5,8,14,17,39,40],Use:[5,6],Used:[4,8,16],Uses:[6,17],Using:28,Will:[3,6,8],With:[18,20],__call__:6,__init__:[0,1,2,3,4,5,6,7,8,13,14,15,17,20,30],_aspect_preserving_res:1,_bahdanau_score_with_loc:14,_baseattentionmechan:14,_basemonotonicattentionmechan:14,_batch_exampl:4,_build_attent:5,_build_forward_pass_graph:8,_building_block_v1:6,_building_block_v2:6,_cast_typ:[5,6,7],_central_crop:1,_clip_by_global_norm:10,_clip_gradients_by_norm:10,_compute_loss:7,_continue_search:16,_count_and_gen_subtoken:4,_count_token:4,_create_decod:8,_create_encod:8,_create_initial_st:16,_create_loss:8,_create_min_max_boundari:4,_decod:5,_decode_crop_and_flip:1,_distributed_appli:10,_encod:6,_escape_token:4,_expand_to_beam_s:16,_filter_and_bucket_subtoken:4,_filter_max_length:4,_flatten_beam_dim:16,_gather_beam:16,_gather_topk_beam:16,_gather_tre:14,_gen_new_subtoken_list:4,_generate_alphabet_dict:4,_generate_subtoken:4,_generate_subtokens_with_target_vocab_s:4,_get_audio:2,_get_example_length:4,_get_input_for_group:14,_get_new_alive_st:16,_get_new_finished_st:16,_get_num_objects_per_step:8,_get_symbols_to_logits_fn:5,_grow_alive_seq:16,_input_tensor:[0,2,3,4,34],_item_or_tupl:14,_length_norm:16,_linear:14,_list_to_index_dict:4,_load_record:4,_load_vocab_fil:4,_maybe_merge_batch_beam:14,_maybe_split_batch_beam:14,_mean_image_subtraction_and_norm:1,_merge_batch_beam:14,_monotonic_probability_fn:14,_native_to_unicod:4,_output:8,_parse_audio_el:2,_parse_audio_transcript_el:[2,3],_parse_exampl:4,_parse_example_proto:1,_parse_transcript_el:3,_read_and_batch_from_fil:4,_resize_imag:1,_save_vocab_fil:4,_search_step:16,_shape_list:16,_smallest_size_at_least:1,_split_batch_beam:14,_split_string_to_token:4,_split_token_to_subtoken:4,_statekei:16,_subtoken_ids_to_token:4,_test:[32,33],_token_to_subtoken_id:4,_unflatten_beam_dim:16,_unicode_to_n:4,abl:[0,1,4,25,32,33,43],about:[6,17,39,41,45],abov:[14,26,37,40],abs:[6,10,14],absolut:40,acceler:14,accept:[4,6,14,34],access:[0,5,6,7,8],accord:[7,14,42],accumul:[8,30],accuraci:[1,8,32,33,40],achiev:[14,32,33,36,39,44],across:[4,7,8,30,40],activ:[5,6,12,13,14,40],activation_fn:[5,6,12],actual:[5,8,14,30],adagrad:[8,10,30],adam:[8,10,30,36,38,47],adapt:[6,8,30,38,42],add:[4,5,6,8,10,14,17,30,40,47],add_eo:4,add_r:13,add_regular:5,added:[0,4,6,8,13,14,16,17,30,44,45],adding:[7,14,17,44],addit:[2,6,8,10,14,16,25,27,30,40,42,43,44,46,47],addition:[1,30,34],adjust:[8,10,26,30,35,40],advis:47,after:[0,1,6,7,8,10,13,14,17,25,26,30,32,33,39,43,44],after_create_sess:17,after_run:17,again:30,aggreg:8,aggregation_method:10,aggregationmethod:10,agiomyrgiannaki:14,aka:38,alben:40,algorithm:[3,8,10,30,39,40,42,47],align:[5,14,47],alignment_histori:14,alignments_s:14,aliv:16,alive_cach:16,alive_log_prob:16,alive_seq:16,all:[0,1,2,3,4,5,6,7,8,10,14,16,17,20,24,26,27,30,32,33,34,37,39,40,44,45,46],allow:[4,24,26,32,33,37,39,42,44,47],almost:[38,39,44],along:[6,14],alpha:[5,16],alphabet:[4,5,44],alphabet_config_path:5,alreadi:[14,17],also:[0,1,3,4,8,10,17,18,26,30,31,35,36,39,40,41,44,47],altern:[32,33,40],alwai:[8,10,30,32,40],amax:10,ammend:17,amount:4,anaconda:33,analog:8,analysi:[2,3],ani:[4,5,6,8,10,14,15,16,17,30,39,40],anneal_teacher_forc:15,anoth:[4,14],answer:[8,30],anymor:17,anyon:34,anyth:10,api:2,apostroph:44,appear:[4,34],append:[4,8,30],appli:[3,4,6,8,10,12,13,14,15,16,30,40],apply_gradi:10,approach:[8,14,18,40],apt:[25,32,33,43],arbitrari:[6,10],architectur:[26,37,40],archiv:[25,43],aren:4,arg:[14,17],argmax:14,argument:[2,3,4,5,6,7,8,10,14,16,17,18,25,27,30,43,46],arithmet:40,around:[1,5,6,7,8,25,36,39,40,43],arrai:[2,3,4,5,6,7,8],arrang:1,array_op:14,array_to_str:17,articl:14,artifici:5,arug:17,arxiv:[6,10,14,40],asg:44,aspect:1,assign:[0,5,42],assum:[3,14,25,27,32,33,43,46],assumpt:[8,14],attend:14,attent:[5,6,13,14,15,16,26,36,37,38,39,47],attention_bia:[5,16],attention_cel:14,attention_depth:14,attention_dropout:16,attention_lay:[9,11],attention_layer_s:[5,14],attention_mechan:14,attention_or_cell_output:14,attention_st:14,attention_typ:[5,15],attention_wn_lay:[9,11],attention_wrapp:[9,11],attentioninputwrapp:14,attentionlayernorm:13,attentionmechan:14,attentionwrapp:14,attentionwrapperst:14,attribut:[8,30],audio:[2,3,8,17,25,27,34,42,43,44,45,46,47],audio_dur:2,audio_length:8,augment:[2,42],augment_audio_sign:2,author:47,auto:[7,44],automat:[5,6,7,8,10,30,36,39],automatic_loss_sc:40,automatic_loss_scal:9,automaticlossscal:10,autoregress:16,avail:[8,26,30,35,40],averag:[7,8,30],average_across_timestep:7,avoid:14,awai:34,awd_initi:14,axi:[6,8,14],back:[16,36,40],backoff:[8,10,30,39,40],backoffscal:10,backpropag:40,backslash:4,bahadanau:14,bahdanau:[5,14],bahdanau_norm:5,bahdanauattent:14,bahdanaumonotonicattent:14,baidu:42,bandwidth:40,base:[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,18,25,26,30,31,35,36,37,38,39,41,42,43,44,47],base_config:17,base_model:[17,30],base_param:[30,40],baselin:[36,39],basi:3,basic:[7,14,15],basic_sampled_sequence_loss:7,basic_sequence_loss:7,basicdecoderoutput:15,basicsampledsequenceloss:7,basicsequenceloss:7,basicslstmcel:14,batch:[4,5,6,7,8,10,12,13,14,15,16,20,30,36,39,42,44],batch_in_token:4,batch_norm:[6,13],batch_siz:[2,4,5,6,7,13,14,15,16],batch_size_per_gpu:[7,8,26,30,35,41,45],batches_per_epoch:10,bazel:[32,33],bbox:1,beahvior:14,beam:[5,14,16,32,33,41,42,44],beam_indic:16,beam_search:[9,11],beam_search_decoder_output:14,beam_siz:16,beam_width:[5,14],beamsearch:14,beamsearchdecod:14,beamsearchdecoderoutput:14,beamsearchdecoderst:14,beamsearchrnndecoderwithattent:5,becaus:[4,10,16,26,40],becom:2,been:[5,10,14,16,17,36,38,40],befor:[4,6,8,10,13,14,17,26,30,40],before_run:17,begin:[4,14,17,40],begin_decay_at:10,behavior:[14,40],being:[4,28,34],below:[32,33,39,40,47],bench_start:30,bench_step:30,benchmark:[8,30,40],benefici:40,bengio:14,besid:8,best:[14,16,32,33,42,44],best_model:17,beta:5,better:[1,16,47],between:[4,8,14,16,39,47],bhadanau:14,bia:[5,13,14,16],bias:14,bias_initi:14,bidir_rnn_encoder_with_emb:6,bidirect:42,bidirectionalrnnencoderwithembed:6,bigger:[39,40],bin:[32,33],binari:[4,25,43],bind:39,birect:38,blank:[42,44],bleu:[8,36,37,39],blisc:[14,15],blob:16,block:[6,30],block_fn:6,block_lay:6,blue:26,bn_epsilon:[6,12],bn_momentum:[6,12],bn_regular:6,bodi:16,bool:[0,3,5,6,7,8,10,13,14,15,16,17,30],boost:[32,33],bori:40,both:[1,3,4,8,14,30,32,33,35,36,38,40,44,47],bottleneck:6,bottleneck_block:6,bottleneck_block_v1:6,bottleneck_block_v2:6,bottom:14,bound:1,boundari:[4,10],boundary_scal:4,box:[1,34],bpe:[4,35],bpe_us:8,broadcast:17,broadcastglobalvariableshook:17,btl:39,bucket:4,buckets_max:4,buckets_min:4,buffer:1,build:[0,2,3,5,6,16,17,24,31,32,33,35,40],build_forward_pass_graph:8,build_graph:[0,1,2,3,4,34],build_image_data:1,build_lay:6,build_lm:[25,43],build_pip_packag:[32,33],building_block:6,building_block_v1:6,building_block_v2:6,built:[6,8,30],bxhxwxc:44,bxtx1xc:44,bxtxc:44,c_state:14,cach:16,calcul:[0,1,4,5,8,13,14,16],calculate_bleu:8,call:[3,5,6,7,8,10,13,14,16,17,20,27,34,35,36,40,44,46,47],callabl:[5,6,10,14],callback:17,can:[0,1,2,3,4,5,6,7,8,10,14,15,17,18,20,24,26,27,30,31,32,33,34,35,37,40,41,42,44,45,46],candiat:4,candid:4,cannot:[8,14,16,30],cast:[5,6,7,40],cast_typ:17,cat:[26,35,39],cell:[5,6,14,15,34],cell_class:14,cell_input_fn:14,cell_output:14,cell_param:14,cell_stat:14,center:1,central:1,chang:[3,14,17,18,26,27,35,36,39,40,44,45,46,47],channel:[1,6,42],channels_first:[5,6],channels_last:[5,6],charact:[4,5,6,27,42,45,46],check:[6,8,14,30,32,33,34,40,42],check_grad:10,check_logdir:17,check_param:17,checkpoint:[8,14,17,30,34,35,36,39,41,42,44,45],chen:14,child:30,cho:14,choic:45,choos:[14,40],chorowski:14,christoph:14,cifar:1,cifardatalay:1,ckpt_dir:17,clariti:[35,36],classic:8,classif:44,clean:[17,25,35,41,43,44],cleaned_fil:26,clear:47,clip:[3,8,10,30,38,42,44,47],clip_by_norm:10,clip_gradi:10,clip_last_batch:[8,17],clip_norm:10,clip_spars:17,clone:[14,32,33],close:[4,14,42],cloud:40,cmake:33,cnn:[6,9,11],cnn_encod:9,cnn_layer:6,cnnencod:6,code:[4,8,14,30,39],coeffici:[10,40],colin:14,collect:[8,10,16,17,40],collect_if_horovod:17,colloqui:1,coloc:10,colocate_gradients_with_op:10,color:1,colorspac:1,column:14,com:[13,14,16,32,33],combin:[8,10,16],combine_head:16,command:[17,18,24,25,26,30,32,33,37,39,41,43],commit:30,common:[9,11,36,39,40],commonli:40,compar:[6,40],compat:10,compil:[8,17,30],complet:[8,10,21,22,23,29,30,34],complex:40,compon:14,compos:14,compress:[25,43,47],compris:47,comput:[1,3,7,8,10,14,16,39,40,47],compute_gradi:[10,40],compute_loss:[7,8,17],concat:14,concaten:[8,14,47],concret:40,condit:14,config:[0,1,2,3,4,5,6,7,8,10,17,18,28,32,33,34,35,36,38,39,41,42,45],config_fil:[24,25,26,27,30,32,33,35,37,39,41,43,45,46],config_modul:17,configur:[5,8,18,26,27,30,31,32,33,34,37,39,41,42,44,46],conflict:14,conjunct:[8,30],connect:[5,6,8,13,14,16,38,42,44,47],connectionist:44,conrib:14,consecut:4,consid:41,consist:[5,6,17,27,42,44,45,46],constant:[10,40],constraint:14,construct:[0,1,3,4,5,6,7,8,14,17],constructor:[0,2,3,5,6,7,8,10,14,30],consum:47,consumpt:40,contain:[0,1,2,3,4,5,6,7,8,10,13,14,16,17,26,27,30,40,45,46],content:[1,5,6,7],context:[14,47],continu:[5,16,17,30],continue_learn:30,contrib:[14,15],control:[8,14,44],conv1d:[6,12],conv1dnetworknorm:13,conv2d:[6,12],conv2d_fixed_pad:6,conv:[5,6],conv_actv:12,conv_block:[9,11],conv_bn_actv:12,conv_in_actv:12,conv_lay:6,conv_ln_actv:12,conv_pad:13,conv_seq2seq:13,conv_wn_lay:[9,11],conveni:30,convent:6,converg:40,convergens:38,convert:[2,4,8,14,25,36,40,42,43],convnet_lay:6,convolut:[5,6,12,13,26,36,37,39,42,44,47],convs2:[6,9,11,16,31,35],convs2s_decod:9,convs2s_encod:9,convs2s_encoder_with_emb:6,convs2sdecod:5,convs2sencod:6,coord:[1,17],coordin:[1,17],copi:[6,8,14,34,40],copt:[32,33],core:[4,40],core_cel:5,core_cell_param:5,correct:[5,7,8,10,14,16,25,26,30,37,42,43],correctli:[8,17,32,33,34],correspond:[0,1,2,3,4,8,10,14,16,20,26,27,30,32,33,35,37,40,44,45,46],correspondingli:[10,20],corretli:17,cosin:16,could:[0,2,3,5,6,7,8,10,17,30],count:[0,4,5,30],cover:30,cpu:[4,40],creat:[0,1,2,3,4,5,6,7,8,14,15,16,17,24,30,34,37,40,45],create_feed_dict:[0,2,3,4,34],create_interactive_placehold:[0,2,3,4,34],create_logdir:17,create_model:17,create_toy_data:[26,37],creation:[8,40],crop:1,crop_height:1,crop_width:1,cross:7,cross_entropi:7,cross_entropy_loss:9,cross_entropy_with_smooth:7,crossentropyloss:7,crossentropywithsmooth:7,csv:[2,3,25,27,43,45,46],ctc:[5,7,42,44],ctc_decoder_with_lm:[32,33],ctc_greedy_decod:5,ctc_loss:9,ctcloss:7,cuda:[32,33,40],cudnn:[6,33,41,44],cudnn_gru:6,cudnn_lstm:6,cudnnlstm:14,cumprod:14,cumsum:14,cumul:14,cur_index:16,current:[1,3,5,6,8,10,13,14,15,16,17,30,34,35,41,45,47],curv:39,custom:[15,32,33,40],cut:[3,5,8],d_model:10,dai:41,data:[1,2,3,4,5,6,7,8,9,14,17,19,25,26,28,30,37,39,40,43],data_fil:4,data_format:[6,12],data_lay:[1,2,3,4,5,6,7,8,9,30],data_layer_param:[8,30,45],data_min:3,data_root:[26,35],datalay:[0,1,2,3,4,8,20,30],datapoint:3,dataset:[0,1,2,3,4,8,20,24,26,37,41,42,44,45],dataset_fil:[2,3,27,45,46],dataset_loc:[3,27,45,46],david:40,dct:17,debug:30,debug_port:[17,30],debugger_port:30,dec:6,decai:[10,38,40,42,44,47],decay_r:10,decay_step:10,decid:[3,47],deco_print:17,decod:[0,1,3,4,6,7,8,9,13,14,15,16,19,25,26,28,30,31,37,38,41,42,43,44,47],decode_and_crop:1,decode_pad:13,decode_pass:5,decoded_output:[35,39],decoder_cel:15,decoder_cell_typ:5,decoder_cell_unit:5,decoder_dp_input_keep_prob:5,decoder_dp_output_keep_prob:5,decoder_initial_st:14,decoder_lay:5,decoder_library_path:5,decoder_output:[5,7],decoder_param:[8,41],decoder_predict:7,decoder_use_skip_connect:5,decreas:[4,40,42,44],deep:[6,14,40,42],deepbench:40,deepspeech2:[31,41],deepspeech2encod:[6,30],deepspeech:[6,30],defaultdict:4,defin:[0,1,2,3,4,5,6,8,10,14,16,26,30,34,40],definit:6,degre:40,delet:[25,43],delim:[8,17],delimit:[27,45,46],demo:34,demonstr:39,denomin:[8,30],denorm:3,denot:1,dens:[6,8,14,15],dense_tensor:7,dense_to_spars:7,depend:[3,6,14,39,42],deprec:14,depth:[1,14,31],deriv:[0,5,6,7,8,30],descent:42,describ:[0,1,3,4,5,6,7,8,14,30,32,33,40,47],descript:[0,1,2,3,4,5,6,7,8,30,35,41,42,45],design:[31,40],desir:40,detail:[1,2,5,6,8,14,24,30,41,45],determin:[5,14,16],detoken:[35,39],dev:[25,26,32,33,37,41,43,44],deviat:[3,14],devic:17,dgx1:44,diagon:47,diamo:40,dicionari:7,dict:[0,1,2,3,4,5,6,7,8,14,16,17,30,34],dict_to_log:17,dictionari:[0,1,2,3,4,5,6,7,8,16,17,20,30,34],dictiontari:17,did:[26,37],diederik:14,diff:30,differ:[1,4,6,14,16,17,26,30,32,33,37,39,40,47],dilat:[12,44],dim:[5,6,7,14],dimens:[1,4,5,6,13,14,15,16,44],dimension:[6,10,14],dimenst:13,diment:13,dir:[8,17],direct:[6,38,47],directori:[3,8,27,30,32,33,34,45,46],disabl:[8,14,15,26,30,32,33,35,40,41],disclaim:31,discov:[32,33],disk:[8,26,37],displai:30,distanc:8,distort:1,distribuit:[24,32,33],distribut:[4,8,14,30,31,33,40,42],divid:[1,16],divis:[0,2,4,8,14],dmitrii:14,dnn:[40,42],do_mask:7,doc:[5,6,7,8,30,33],docker:40,docstr:14,document:[14,30,40,41],doe:[1,5,7,8,14,15,26,30,32,33,35,40,41,45],doesn:1,domain:[2,3],don:[4,6,16,24,32,33],done:[13,26,35,36,39,41,45],dot:[3,16],doubl:39,dougla:14,download:[25,26,27,35,41,43,45,46],download_lm:[32,33,41],downsampl:6,downsid:42,dp_input_keep_prob:14,dp_output_keep_prob:14,draw:16,drawn:4,dropout:[5,6,13,14,36,38,42,44,47],dropout_keep_prob:6,dropout_keep_prop:6,dropout_prob:5,dropout_se:14,droupout:14,ds2:41,ds2_encod:[9,30],ds2_large_8gpu:42,ds2_large_8gpus_mp:42,ds2_large_mp:41,ds2_librispeech_larc_config:[25,43],ds2_out:41,ds2_small_1gpu:41,ds2_toy_config:[25,32,33],ds2_toy_data_config:43,dtype:[0,5,6,7,8,10,14,15,16,17,30,34,39,40],due:[14,42],durat:[2,3,42],duration_max:3,duration_min:3,dure:[1,5,8,14,15,16,17,26,30,40,41,42,44,47],dynam:[8,14,40,42],dynamic_decod:[5,14,15],dzmitri:14,each:[0,1,4,5,7,8,10,14,15,16,17,20,30,34,39,40,42,47],eager:10,earli:14,easi:[31,34],easier:47,easili:[26,37],eck:14,edit:34,efault:5,effect:[14,41,47],effici:[4,6,14,31],either:[0,2,3,5,6,7,8,10,14,17,30,40],element:[0,2,3,4,8,14],elimin:41,els:[6,7,10],elsen:40,embed:[5,6,13,14,16,36,38,39,47],embed_s:13,embed_scal:16,embedding_lay:[9,11],embedding_lookup:14,embedding_s:16,embeddingsharedweight:16,emit:14,emnlp:14,emploi:42,empti:[8,14,20,30],emul:[8,30],enabl:[3,5,6,8,10,14,15,17,18,30,32,47],enable_log:[17,24,30,32,33],enable_postnet:5,enable_prenet:5,enc_emb_w:6,encod:[0,1,3,4,5,7,8,9,13,14,16,19,26,28,30,31,37,38,47],encoder_cell_typ:6,encoder_cell_unit:6,encoder_decod:[5,6,7,9,30],encoder_decoder_attention_bia:5,encoder_dp_input_keep_prob:6,encoder_dp_output_keep_prob:6,encoder_final_st:14,encoder_lay:6,encoder_output:[5,6,14],encoder_output_a:13,encoder_output_b:13,encoder_outputs_b:5,encoder_param:[6,8],encoder_sequence_length:5,encoder_st:[6,14],encoder_use_skip_connect:6,encoderdecodermodel:[8,30],encorc:14,end:[4,5,14,16,17,26,27,32,33,37,40,46],end_compat:10,end_learning_r:10,end_of_choic:4,end_symbol:5,end_token:14,energi:[3,8,14,44,47],enforc:14,english:[4,24,34,35,36,39,41],enough:[26,30,35,40,41,45],ensur:[4,14,16,17,40],enter:34,entir:[27,46,47],entri:[10,14],entropi:7,enumer:4,eos:16,eos_id:[4,16,17],epoch:[0,1,4,8,10,30,42,44],epsilon:[5,6,8,16,30],equal:[1,8,14,30],equival:[10,14],erich:40,error:[8,14,25,32,33,41,42,43,44],escap:4,especi:40,essenti:17,estim:40,eta:44,etal:[36,39],etc:[5,6,8,20,30],etl:20,eval:[1,5,6,8,15,17,25,27,30,41,43,46],eval_model:17,eval_param:30,eval_step:[8,30],evalu:[0,1,4,8,17,25,26,27,30,35,37,42,43,46],even:[39,42],evenli:4,event:[30,40],everi:[6,8,47],every_step:17,everyth:[25,30,32,33,43],exact:[14,30],exactli:[14,38],exampl:[0,1,2,4,5,6,8,10,14,20,25,26,27,30,32,33,35,37,39,40,43,45,46],example_config:[25,26,27,30,32,33,35,37,39,41,42,43,45,46],example_seri:1,exce:[8,30],except:[6,14,17,30,32,33,40],exclud:15,execut:[8,10,18,26,30,37],exist:[0,14,28,40],exp:14,exp_decai:10,expect:[7,10,34],experi:[26,30,37,47],explicit:6,explicitli:[13,14,40],exponenti:[10,47],exponential_decai:10,express:30,extend:42,extens:40,extra:44,extract:[2,3,20,25,43,44,45],facebook:[36,44],fact_siz:14,factor:[14,16,36,39,40],fairli:30,fals:[0,1,3,4,5,6,7,8,10,14,15,16,17,32,33,39,41],fast:42,faster:[36,39,42,47],fc_decod:9,fc_layer:6,feat:7,featur:[2,3,5,6,7,31,42,44],feature_norm:3,feature_normalize_mean:3,feature_normalize_std:3,features_typ:[2,3],fed:[20,47],feed:[0,2,3,4,14,17,34],feed_dict:[2,3,4],feed_dictionari:20,feedforward:[13,16],feedfowardnetwork:16,feedfowardnetworknorm:13,feel:[25,43],fetch:8,few:[44,47],ffn_layer:[9,11],ffn_wn_layer:[9,11],fft:[3,8],field:[1,2,5,6,7,14,44],file:[0,1,2,3,4,5,8,17,25,26,27,30,34,35,37,39,41,42,43,45,46],file_byte_limit:4,file_pattern:4,file_with_bpe_segment:26,filenam:[1,2,3,4,27,45,46],filepath:4,filew:[27,46],fill:34,filter:[4,6,8,10,12,42],filter_s:16,filterbank:44,final_output:5,final_sequence_length:5,final_st:[5,14],finalbeamdecoderoutput:14,finalbeamsearchdecoderoutput:14,finalize_evalu:8,finalize_infer:8,find:[16,24,31],finish:[14,15,16,26,30,37],finished_flag:16,finished_scor:16,finished_seq:16,first:[0,1,4,6,8,10,13,14,16,17,18,25,26,27,30,33,34,37,38,40,43,44,45,46,47],fit:[4,39],five:42,fix:10,fixed_lr:10,fixed_pad:6,flag:[14,16],flaot:16,flat_dict:17,flatten_dict:17,flexibl:31,flip:1,float16:[0,5,6,7,8,10,30,36,40,44],float32:[0,2,5,6,7,8,10,13,15,16,24,30,36,38,39,40,42,44,47],flstm:[9,11],flstmcell:14,flush:17,folder:[25,26,27,30,32,33,37,43,46],follow:[0,1,3,4,5,6,7,8,12,20,24,25,26,30,32,33,35,36,37,38,40,41,42,43,44,45,47],footprint:44,forc:[15,30],force_var_reus:8,forev:4,forget:[14,24,32,33],forget_bia:14,form:[0,4,14],format:[1,4,5,6,34,45],formul:16,forward:[8,40],fot:3,found:[4,35,42,44,45],fp32:[8,39,40],fraction:4,frame:[2,8,44,47],framework:34,free:[25,43],frequenc:[2,3,4,42],frequent:4,from:[0,1,2,3,4,5,6,7,8,10,13,14,16,17,20,30,32,33,34,35,36,38,40,42,44,47],ftrl:[8,30],full:[6,10,40],fulli:[5,6,13,16,36,42,44,47],fully_connected_ctc_decod:5,fully_connected_decod:5,fully_connected_time_decod:5,fullyconnectedctcdecod:[5,25,43],fullyconnecteddecod:5,fullyconnectedtimedecod:5,func:9,funciton:15,furthermor:40,fuse:1,futur:16,gamma_regular:6,ganesh:40,garcia:40,gate:[10,13,14,44],gate_gradi:10,gate_graph:10,gate_non:10,gate_op:10,gated_linear_unit:13,gather:[16,17],gehr:36,gen_input_tensor:20,gener:[3,4,5,6,8,14,16,27,30,34,45,46,47],generate_tri:[32,33],geometr:16,german:[4,24,35,36,39],get:[3,8,10,16,17,20,25,26,32,33,39,42,43],get_available_gpu:17,get_base_config:17,get_data_lay:8,get_decoder_self_attention_bia:16,get_en_d:35,get_git_diff:17,get_git_hash:17,get_interactive_infer_result:[17,34],get_magnitude_spec:3,get_mel:3,get_next:20,get_num_objects_per_step:8,get_optional_param:[0,1,2,3,4,5,6,7,8,20,30],get_output_tensor:8,get_pad:16,get_padding_bia:16,get_position_encod:16,get_regularization_loss:10,get_required_param:[0,1,2,3,4,5,6,7,8,20,30],get_results_for_epoch:17,get_size_in_sampl:[0,1,2,3,4,20],get_speech_featur:[2,3],get_speech_features_from_fil:[2,3],get_tf_dtyp:8,get_vari:40,get_wmt16_en_dt:26,getter:40,ginsburg:[14,40],git:[30,32,33],github:[13,14,16,32,33],give:13,given:[0,1,10,14,16,40,42],global:[10,17],global_gradient_norm:[8,30],global_norm:10,global_step:10,glstm:[5,9,11],glstmcell:14,glu:44,gnmt:[5,6,9,11,31,35],gnmt_encoder_with_emb:6,gnmt_encoder_with_emb_cudnn:6,gnmt_residual_fn:14,gnmt_v2:5,gnmtattentionmulticel:14,gnmtlikeencoderwithembed:6,gnmtlikeencoderwithembedding_cudnn:6,gnmtv2:38,go_symbol:5,goal:[26,37],going:[5,6,21,22,23,29,30],good:[30,36,39],googl:[35,38,39],gpu:[0,7,8,17,18,20,24,26,30,31,32,33,35,36,39,40,41,42,44,45],gpu_id:[8,30],grad_loss:10,gradient:[8,10,14,30,38,40,42,44,47],gradient_norm:[8,30],grads_and_var:10,gram:[25,42,43],graph:[0,1,2,3,4,5,6,7,8,10,17,30,40],graphic:40,graphkei:10,great:47,greater:[3,6],greedi:[41,42,44],gregori:40,griffin:[8,47],griffin_lim:8,ground:47,group:[4,14],group_batch_s:4,group_id:14,group_siz:14,grow:16,gru:[5,6,42],guarante:[4,14],half:[40,44],halv:[39,40],handl:14,happen:[0,1,4,5,6,7,8,20],hard:14,hardmax:14,has:[0,1,2,3,4,5,6,7,8,14,16,17,24,38,40,47],has_nan:10,hash:30,hat:10,have:[0,1,2,3,4,5,6,7,8,10,14,15,16,20,26,27,30,32,33,35,36,38,40,41,44,45,46,47],head:16,height:1,height_in:6,help:[8,17,25,30,42,43],helper:[3,6,8,12,15,16,17],henc:[40,47],here:[0,1,4,5,6,7,8,14,16,20,24,30,36,39,40,42],hetland:8,hidden:[5,6,14],hidden_dropout:13,hidden_s:[5,16],hieu:14,high:40,higher:[14,32,33,42],highest:16,histori:14,hold:[10,16],hook:[8,9],hop_length:3,horovod:[0,4,7,8,10,17,18,24,30,39,44],horovod_gpu_broadcast:17,hot:[1,7,14],houston:40,how:[8,10,14,16,24,26,28,37,39,47],howev:[1,10,27,34,40,46,47],htk:[3,47],html:33,http:[6,8,10,13,14,16,32,33],human:17,hvd:[8,17,30],hyper:39,hyperparamet:[39,40,45],iclr:[14,40],icml:14,id_and_audio_filenam:2,ideal:47,ident:[6,14,39],ids:[0,2,3,4,8,14,16,17,30],idx2char:8,ifft:8,ignor:[0,8,10,14,17,18,27,30,42,46],ignore_speci:[8,17],illeg:16,illustr:40,ilsvrc2012_val_00041207:1,imag:[1,6,8,17],image2label:[0,9,30],image_buff:1,image_s:1,imagenet_preprocess:[0,9],imagenetdatalay:1,implement:[7,8,10,13,14,15,16,20,30,34,36,45,47],impli:14,import_librivox:[25,41,43],improv:[1,4,40,44],in_dim:13,incept:1,includ:[0,1,2,3,4,5,6,7,8,14,25,40,43,44,45],incorrect:[15,42],increas:[16,40,42,44],increment:10,independ:[6,7,8,30],index:[14,16],indexedslic:10,indic:[1,4,16,17],inf:14,infer:[0,1,2,3,4,5,6,8,14,15,17,25,27,30,37,39,43,46],infer_output_fil:[25,26,27,30,35,37,39,41,43,45,46],infer_param:[30,45],infer_s2t:34,infer_t2:34,infin:16,inform:[6,8,14,16,17,30,31,47],inherit:[0,5,6,7,8,20],init_from_fil:4,init_var:[13,16],initi:[4,5,6,8,10,13,14,15,16,17,30,36,40,42,44,47],initial_cach:16,initial_cell_st:14,initial_decoder_st:15,initial_finish:15,initial_id:16,initial_input:15,initial_st:14,initializer_param:[5,6,8,30],inner:[14,16],input:[0,1,2,3,4,5,6,7,8,12,13,14,15,16,30,34,36,39,44,47],input_attention_bia:13,input_dict:[5,6,7,17],input_lay:6,input_length:5,input_s:14,input_sequence_length:14,input_tensor:[0,1,2,3,4,5,6,7,8],input_typ:2,input_valu:8,input_weight_keep_prob:14,inputs_attention_bia:5,insensit:[8,10,30],insid:[0,1,3,4,5,8,17,26,27,34,35,40,45,46,47],inspect:40,inspir:[13,14],instabl:14,instal:[24,25,31,43],install_kenlm:32,instanc:[0,5,6,7,8,12,14,15,40],instead:[1,5,10,14,15,32,33,35,40,44],instruct:[25,31,33,41,43],insur:16,int32:[1,14,15,16],int64:[14,16],intact:6,integ:[1,4,6,14,15],intend:[0,2,3,4],inter:40,interact:[0,2,3,4],interconnect:39,intermedi:[8,30,40],intern:[10,14,28],intial:38,intialzi:44,introduc:[1,6,39,40,42],invalid:10,invalidargu:14,invari:16,invers:4,inverse_mel:3,involv:16,is_train:[1,14],issu:41,item:[4,14,16],iter:[0,1,2,3,4,8,17,20,30,39,40],iter_s:[8,10,30],iterate_data:17,its:[4,13,14,16,25,30,42,43],jaitli:14,jan:14,jian:6,join:4,join_tokens_to_str:4,jointli:14,jona:36,jonah:40,jonathan:14,jpeg:1,jul:6,jupyt:0,just:[5,6,32,33,47],kaim:6,keep:[5,6,7,13,14,17,40],kei:[0,1,3,4,6,8,10,13,16,17],kenlm:[25,32,33,43],kept:40,kera:44,kernel:[5,6,13,42,47],kernel_initi:14,kernel_regular:6,kernel_s:[5,6,12],kernel_width:13,key_channel:16,keyword:16,kind:30,kingma:[13,14],knee:1,known:[1,4,14],kpu:33,kuchaev:40,kuchaiev:14,kwarg:[14,16],kyunghyun:14,l2norm:10,label:[1,5,7],lambda:[14,40],languag:[5,24,41,42,44],lar:[8,30],larc:[8,10,30,38,42,44,47],larc_eta:[8,30],larc_mod:[8,30],larc_param:[8,10,30],larg:[8,14,30,38,40],largest:16,last:[5,6,8,13,30,44],last_batch:[8,17],last_step:[8,17],lastli:[45,47],latenc:40,later:40,latest:32,latter:14,launch:[17,26,37],layer:[0,1,2,3,4,5,6,8,10,12,13,14,15,16,19,28,30,38,39,40,42,44,47],layer_id:13,layer_norm:13,layer_param:6,layer_typ:[6,12],layernorm:16,layernorm_lstm:6,layout:1,ld_library_path:39,lead:[32,33],learn:[5,6,8,10,14,17,26,30,36,37,38,42,44,47],learnabl:14,learning_r:[8,10,30],learning_rate_decay_fn:10,least:[3,6,16],leav:47,left:14,length:[0,1,2,3,4,5,6,7,8,13,14,15,16],length_i:16,length_penalty_weight:14,length_x:16,lenth:8,less:[3,4,40,44],let:[35,41,45],letter:44,level:[30,40,42],levenshtein:8,libboost:[32,33],libctc_decoder_with_kenlm:[32,33],librari:[5,17,35],librispeech:[24,41,42,44],librivox:[25,43],librosa:3,libsox:[25,43],libtensorflow_cc:[32,33],libtensorflow_framework:[32,33],lightweight:41,like:[5,6,10,16,20,26,32,33,35,38,39,41],lim:[8,47],limit:40,line:[0,4,17,18,26,27,30,45,46],linear:[5,13,14,16,44,47],link:[33,41,42],list:[0,1,2,3,4,5,6,7,8,10,14,16,20,27,30,45,46,47],list_clip:10,list_t:10,liu:14,live:16,ljspeech:[3,24,45],lm_path:5,load:[0,3,4,20],load_pre_existing_vocabulari:0,localhost:39,locat:[5,14,16,26,27,32,33,35,46,47],locationlay:14,locationsensitiveattent:14,log:[3,8,14,16,17,27,28,40,42,44,46],log_dir:45,log_fil:17,log_mag_spec:3,log_mel_spec:3,log_summaries_from_dict:17,logdir:[8,17,26,27,30,37,46],logger:17,logic:[8,16,20],logit:[5,7,14,16],logits_to_outputs_func:5,logmax:[8,10,30,40],logmaxscal:10,lognorm:40,logspac:14,longer:[17,42],longest:4,look:[6,8,17,30,31,39,41],loop:[5,16],lose:40,loss:[0,1,3,4,5,8,9,10,19,28,30,36,39,42,44],loss_comput:8,loss_input_dict:7,loss_param:8,loss_scal:[8,10,30,39,40],loss_scaling_param:[8,10,30],lossi:47,lot:[5,25,26,32,33,43],lower:[4,33,40],lr_polici:[8,9,30],lr_policy_param:[8,30],ls_dir:[25,43],lst:4,lstm:[5,6,14,38,47],lstmstatetupl:14,luong10:38,luong:[5,14],luong_scal:5,luongattent:14,luongmonotonicattent:14,lyaer:5,m_common:[35,39],m_state:14,machin:[14,24,31,36,37,39],made:[44,47],mag:3,mag_pow:3,mag_spec:3,magnitud:[3,8,47],mai:[4,14,16,42],main:[5,6,7,26,30,31,37,42],maintain:[16,40],major:[5,14],make:[0,1,4,14,25,26,31,33,34,42,43,44],malform:10,man:14,mani:[39,40,42,45],manner:14,manual:[14,40],map:[0,4,5,6,14,15,39],mark:[4,14,16],mask:[7,13,14,16],mask_decoder_sequ:[5,15],mask_nan:[7,17],mask_pad:16,master:[16,33,40],match:[1,4,6,8,14,36,40,47],matric:14,matrix:[14,16],mavx2:[32,33],mavx:[32,33],max:[4,10],max_decode_length:[5,16],max_dur:42,max_grad_norm:[8,30],max_length:4,max_lr:10,max_pool2d:6,max_pooling2d:6,max_step:[8,30],max_subtoken_length:4,max_tim:14,max_timescal:16,maxim:10,maximum:[3,4,8,14,16,30,40],mayb:14,maybe_print_log:8,mca:39,mean:[1,3,4,17,40],measur:[26,35,37,39],mechan:[5,14,16,38,39,47],mel:[3,14,44,47],mel_basi:3,mel_spec:3,mel_typ:3,memori:[0,14,26,35,39,40,41,45],memory_s:5,memory_sequence_length:14,mention:40,merg:14,metadata:[27,45,46],method:[0,1,2,3,4,5,6,7,8,10,14,16,17,20,30,40],methodolog:40,metric:[8,41,42,47],mfcc:2,mfma:[32,33],mfpmath:[32,33],michael:40,micikeviciu:40,might:[26,30,32,33,35,40,41],mike:14,milli:2,min:[3,4],min_boundari:4,min_count:4,min_idx:0,min_lr:10,min_timescal:16,min_upd:[8,30],minh:14,mini:20,minibatch:14,minim:[8,10,30],minimum:[0,3,4,14,16,47],minor:44,minumum:4,minut:[32,33],mismanag:14,misspel:[25,42,43],mix:[5,6,8,10,14,16,24,30,31],mixedprecisionoptimizerwrapp:[10,40],mkdir:[25,33,43],mode:[0,1,3,4,5,6,8,13,14,17,18,24,25,26,27,30,32,33,35,37,39,41,42,43,45,46],model:[0,1,2,3,4,5,6,7,9,10,14,15,16,17,24,26,28,31,34,37,40],model_dtyp:15,model_in:[0,2,3,4,17],model_param:40,model_prefix:[35,39],modifi:[4,5,6,7,14,15,17,40],modul:[5,6,8,10,14,17,30],modular:31,momentum:[5,6,8,30,42,44],monoton:14,monotonic_attent:14,more:[4,8,14,16,26,35,40,41,42,44,45],moreov:30,moss:[26,37],most:[4,8,20,30,40,42],mostli:47,move:30,mp_regularizer_wrapp:[10,40],mp_wrapper:9,mpi4pi:[32,33],mpi:[8,32,33],mpiexec:[24,32,33],mpirun:[18,39],msg:17,msse4:[32,33],much:[4,16,26],multi:[8,16,18,20,24,26,31,32,33,36,37,39],multicel:14,multihead:16,multipl:[3,10,14,16],multipli:[3,10,14,40],multirnncel:14,must:[0,1,2,3,4,5,6,7,8,10,14,16,27,30,34,46],mutli:18,myfavoriteattentionmechan:14,n03623198:1,n_feat:15,n_fft:[3,8],n_frequency_featur:42,n_hidden:6,n_iter:8,n_mel:3,n_timestep:42,name:[2,4,5,6,7,8,10,12,13,14,15,17,30,40],namedtupl:14,nan:7,narang:40,nativ:4,natur:[14,42],navdeep:14,nccl:33,nearli:[39,40],necessari:[0,6,8,17,30,32,33,34,40],necessarili:16,need:[0,1,4,5,6,8,10,16,17,18,20,25,26,27,30,32,33,34,37,39,40,42,43,45,46],neg:[14,16],nest:[14,15,16,30],nest_dict:17,nested_upd:17,net:[7,15],network:[6,13,14,16,40,42,47],neural:[6,14,36,39,40,42],new_beam_s:16,new_cach:16,new_height:1,new_log_prob:16,new_seq:16,new_width:1,newli:[14,45],newstest2014:26,next:[5,8,14,30,31,35,40,45],next_batch_feed_dict:20,next_input:[14,15],next_stat:[14,15],nice:47,nmt:[26,35,37,38],nmt_revers:[26,37],no_dir_check:30,noam:10,node:[18,31],nois:[14,42],noise_level_max:2,noise_level_min:2,non:[14,16],none:[0,2,3,4,5,6,7,8,10,13,14,15,16,17,20,30,39,40],norm:[3,5,6,8,10,12,13,30],normal:[1,2,3,5,6,13,14,16,36,40,42,44],normalization_typ:13,normalize_sign:2,normliz:3,note:[0,1,3,4,5,6,7,8,10,14,17,25,26,30,34,35,39,40,43],notebook:0,now:[14,25,30,40,41,43],num:[5,6,7],num_audio_featur:[2,3,42],num_box:1,num_channel:[1,5,6],num_class:1,num_cpu_cor:4,num_epoch:[0,1,4,8,10,30],num_featur:[2,3,5],num_gpu:[8,18,24,26,30,32,33,35,37,39],num_head:16,num_iter:4,num_lay:5,num_proj:14,num_rnn_lay:6,num_step:17,num_time_step:[2,3],num_unit:[5,14],num_work:[0,1,2,3,4,20],number:[0,1,2,3,4,5,6,7,8,10,14,16,18,24,30,32,33,39,40,42,44],number_of_group:14,numer:[8,14,17,30,40],numpi:2,nvidia:[31,32,33,40],object:[0,1,3,4,5,6,7,8,10,14,15,16,17,20,30,40],observ:44,obtain:[32,33,40,41],occur:14,off:36,offici:31,offset:17,offset_target_by_on:7,often:[8,30,40],old:16,oleksii:40,on_horovod:[8,10],onc:[4,14,17,26,34,35,37,41,42,45],one:[0,1,3,4,5,6,7,8,10,14,16,17,26,27,30,35,36,40,42,45,46],onli:[0,1,4,5,6,8,10,14,17,18,26,30,39,40],onlin:14,open:[8,44],open_seq2seq:[1,2,3,4,6,8,32,33],openib:39,openseq2seq:[4,8,17,18,24,25,26,27,30,37,39,40,46],openslr:[32,33,41],oper:[5,6,10,14,15,17,32,33,40],oppos:47,ops:[1,10,14,15,17],opt:[32,33],optim:[8,9,30,36,42],optimize_loss:10,optimizer_cls_nam:10,optimizer_param:[8,10,30],optimizer_summari:10,option:[0,1,2,3,4,5,6,7,8,10,14,20,30],optional_dict:17,order:[4,6,14,25,26,27,32,33,34,36,40,41,42,43,44,46,47],org:[6,8,10,14],org_dict:17,origin:[1,4,6,14,16,17,25,36,42,43,44,47],orte_base_help_aggreg:39,other:[1,5,8,10,14,17,25,30,32,33,40,43,44,47],otherwis:[1,8,10,14,17,26,30,32,33,40],our:[35,36,40,44,47],out:[14,16,26,37,42],out_dim:13,out_of_bucket:4,output:[1,3,5,6,7,8,13,14,15,16,17,20,25,26,30,32,33,35,36,37,39,42,43,44,47],output_attent:14,output_dim:[5,14],output_dir:17,output_dtyp:[14,15],output_fil:[8,17],output_height:1,output_lay:[14,15],output_s:[5,14,15],output_time_major:14,output_typ:3,output_valu:8,output_width:1,outsid:4,over:[7,40,42],overal:17,overcom:40,overflow:40,overrid:14,overridden:14,overwrit:[8,30],overwritten:30,own:[24,27,46],p_choose_i:14,p_t:42,packag:[5,6,35],pad2eight:4,pad:[0,1,2,3,4,5,6,12,13,16,20,41],pad_2_eight:4,pad_eo:3,pad_id:[4,17],pad_sym:16,pad_to:[2,3],pad_valu:3,pad_vocab_to_eight:[0,16],padded_cross_entropy_with_smooth:7,padded_input_length:4,padded_length:4,padded_target_length:4,paddedcrossentropylosswithsmooth:7,padding_valu:16,pair:[4,8,10,14],pang:14,paper:[7,26,37,44,47],parallel:[4,14,16,26,35,37],parallel_interleav:4,parallel_iter:5,paralleltextdatalay:4,param:[0,1,2,3,4,5,6,7,8,10,12,14,16,17,20,30],paramet:[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,18,20,26,28,32,33,35,38,39,40,41,42,44,45],parent:[0,2,3,5,6,7,30],pars:[1,2,3,17],parse_record:1,parse_text_output:3,part:[1,5,7,8,9,10,12,13,14,15,16,25,30,40,42,47],particular:[14,39],partli:14,pascanu:10,pass:[0,1,2,3,4,5,6,7,8,10,14,15,16,17,30,34,40,47],past:14,path:[0,2,3,4,5,8,24,30,32,33],pauliu:40,pdf:[6,10,14],penal:14,per:[2,4,7,8,27,30,36,39,42,44,45,46],perform:[1,2,5,6,7,8,10,14,15,26,30,37,40,42],period:[30,40],perl:[26,37],peter:14,pham:14,piecewis:10,piecewise_const:10,pip:[32,33],pip_packag:[32,33],pipelin:4,pitch:42,place:[4,30],placehold:[0,2,3,4,20,34],plai:41,plane:6,pleas:[3,14,25,34,35,41,43],plot:39,plot_spectrogram:8,plu:[27,42,46],png:8,point:[4,14,17,26,27,40,45,46],polici:[8,10,30,42],poly_decai:10,polynomi:[10,42,44],polynomial_decai:10,pool_siz:6,popul:[8,10],posit:[6,14,16],possibl:[8,14,15,30,39,40,42],post:[7,10,15,16],post_net_predict:7,post_process_gradi:10,postnet:[5,47],postnet_bn_epsilon:5,postnet_bn_momentum:5,postnet_conv_lay:5,postnet_data_format:5,postnet_keep_dropout_prob:5,power:[3,8,10,14,42],practic:40,pre:[0,3,10,14,15,16,26,39],preactiv:6,precis:[5,6,8,24,30,31],precison:44,pred:8,predict:[5,7,8,14,15,16,17,30],predicted_id:14,preevious_attent:14,prefer:33,prefix:[4,5],prenet:[5,15,47],prenet_activ:5,prenet_lay:5,prenet_unit:5,prepar:[14,30],prepostprocessingwrapp:16,preprint:40,preprocess:[0,1,25,34,41,42,43,44],preprocess_imag:1,presenc:40,present:[10,27,46,47],preserv:1,preset:3,previou:[13,14,16],previous_attent:14,primarili:1,principl:40,print:[6,8,17,30],print_bench_info_step:[8,30],print_loss_step:[8,30],print_ppl:17,print_samples_step:[8,30],printlossandtimehook:17,printsampleshook:17,prior:[3,4,14],probability_fn:14,probabl:[5,6,14,16,30,40,42],problem:[14,26,37,40],proce:30,process:[0,1,2,3,4,8,10,14,16,17,26,30],produc:[5,6,7,14,34,42,45],product:[3,14,16,31],progress:[26,37],project:[6,13,14,31,42,47],projection_shortcut:6,pronunci:42,propag:[14,40],proper:14,properli:14,properti:[14,16],propos:[6,14],proto:1,protocol:1,provabl:16,proven:40,provid:[1,4,5,6,8,10,14,17,25,27,34,40,43,46],pseudo:47,pull:16,put:45,python:[1,4,5,6,8,10,13,14,15,16,17,20,24,25,26,27,30,32,33,35,37,39,41,43,45,46],qualiti:47,quantiti:10,queri:14,quit:42,quot:34,raffel:14,rais:[1,3,10,14,15,17],random:[1,4,8,14,17,30],random_se:[8,30],randomli:1,rang:[2,14,40,42],rank:[1,4,14,16,17],rare:40,rate:[6,8,10,30,36,38,41,42,44,47],rather:[0,6,8,30,40],ratio:[1,10],raw:[0,1,2,6,17,34,35,42,44],raw_fp32:39,raw_record:1,raw_str:4,reach:[16,44,47],read:[0,3,4,14,17,30],read_char:0,readabl:17,readi:10,real:26,realli:5,reason:[14,35],reccommend:5,receiv:17,recent:40,recept:44,recip:40,recogn:[25,34,43],recognit:[6,8,14,24,31,42,47],recogtnit:24,recommend:[5,10,14,20,24,32,33,40],reconstruct:[3,47],record:[1,4],recov:17,recurr:[6,14,39,40],recurrent_keep_prob:14,recurrent_weight_keep_prob:14,recurs:14,redefin:40,reduc:[4,14,26,35,41,44,45],reduce_gradi:10,reduce_mean:7,reduce_sum:17,ref:6,refer:[1,4,16,35,47],regardless:3,regress:7,regular:[5,6,8,10,12,13,16,30,42,47],regularizer_param:[5,6,8,30],rel:41,relat:[0,1,3,4,14],releas:39,relu:[5,6,44],relu_dropout:16,remain:10,remov:[8,26,47],ren:6,renam:34,reparameter:14,repeat:[4,6,14],replac:[4,14,25,27,43,46,47],report:[10,35,36],repres:[1,10,14,16],represent:[5,6,47],representation_dim:6,request:17,request_stop:17,requir:[0,1,2,3,4,5,6,7,8,14,20,30,32,33,34,39,40],required_dict:17,res_rank:16,rescor:32,research:31,reserv:4,reserved_token:4,reshap:[6,14,16],residu:[5,6,7,13,14,38,47],residual_connect:14,resiz:1,resize_imag:1,resize_min:1,resized_imag:1,resizemethod:1,resnet:[1,6],resnet_block:9,resnet_encod:9,resnetencod:6,respect:[8,14,40],ressult:15,restor:[14,17,30],restore_and_get_result:17,restore_best_checkpoint:17,result:[3,8,14,16,17,25,26,32,33,34,35,37,39,40,43,47],results_per_batch:8,retriev:[3,40],reus:[14,40],revers:[24,35],rgb:1,rif:14,right:14,rmsprop:[8,30],rnn:[5,6,7,9,11,15,26,37,38,47],rnn_beam_search_decod:[9,11],rnn_cell:6,rnn_cell_dim:6,rnn_cell_impl:14,rnn_decod:9,rnn_decoder_with_attent:5,rnn_encod:9,rnn_type:6,rnn_unidirect:6,rnncell:[14,15],rnndecoderwithattent:5,robust:40,ron:14,root:[17,24,32,33,39],root_rank:17,row:[6,8,14,17],row_conv:6,row_conv_width:6,rule:40,run:[5,6,8,10,14,16,17,18,24,25,27,28,35,37,39,40,41,43,45,46],run_context:17,run_valu:17,runevaluationhook:[8,17],runpi:17,runtim:14,runtimeerror:10,ruom:14,ryan:14,s_id:[4,17],sacrebleu:[35,36,39],safe:30,safe_cumprod:14,sai:30,saliman:[13,14],same:[0,1,4,5,6,7,10,14,16,17,34,38,39,42,44],sampl:[0,1,2,3,4,8,14,15,17,20,30,42,44,45],sample_id:15,sample_ids_dtyp:15,sample_ids_shap:15,sampling_prob:15,sampling_r:[3,8],samplng:8,saurou:14,save:[3,4,8,30,45],save_audio:8,save_checkpoint_step:[8,30],save_format:8,save_summaries_step:[8,30],save_to_tensorboard:8,scalabl:[36,39],scalar:[1,10,14,15,16,17],scale:[3,4,5,8,10,14,16,30,36,39,42],scaling_factor:13,scan:14,schedul:15,scheme:[4,10,38,42],schuster:14,scope:[5,6,7,10,13,14,15],score:[8,14,16,36,37,39,41,42],score_bias_init:14,score_mask_valu:14,score_or_log_prob:16,script:[1,18,25,26,30,32,33,35,37,41,43],search:[4,5,14,16,32,33,41,42,44],second:[2,4,10,13,14,17,39,40,42,47],section:[5,6,8,16,21,22,23,29,30,31],sed:26,see:[2,3,5,6,7,8,10,14,15,26,30,32,33,36,37,39,40,45,47],seed:[8,14,30],seem:47,seen:47,segment:[35,44],select:[8,40],self:[0,1,2,3,4,5,6,7,8,14,16,20,30,34],selfattent:16,semi:4,send:17,sensit:[5,44,47],sent:47,sentenc:[4,27,34,45,46],sentencepiec:[35,36,39],separ:[1,3,27,30,46],seq2seq:[7,14,15],seq:14,sequenc:[0,1,2,3,4,5,6,7,8,10,14,16,24,30,31,33,36,44,47],sequence_beam_search:16,sequence_length:[7,14,15],sequence_loss:9,sequencebeamsearch:16,serdyuk:14,seri:1,serial:[1,4],serialized_exampl:4,sess:[8,17],session:17,session_run_hook:17,sessionrunarg:17,sessionruncontext:17,sessionrunhook:17,sessionrunvalu:17,set:[3,4,5,6,7,8,10,14,17,18,27,30,32,33,40,42,46],setup:[17,25,34,43],sgd:[8,10,30,44],shaoq:6,shape:[1,2,3,4,5,6,7,13,14,15,16,20,34],sharan:40,share:[16,30,36,39,40],shen:14,shift:40,shortcut:6,shorter:[16,42],should:[0,1,3,4,5,6,7,8,10,13,14,16,17,20,24,25,26,27,30,32,33,34,35,36,37,39,40,43,45,46,47],show:[8,36,39],showcas:34,shrunk:10,shuffl:[0,4,14,20],side:1,sigmoid:14,sigmoid_nois:14,sigmoid_noise_se:14,signal:[2,3,8,17,42,44],signatur:[6,14],significantli:[4,39,42],silenc:3,similar:[4,6,39],simpl:[1,5,14,18,26,30,37,40,47],simplest:35,simpli:34,sinc:[4,6,8,14,25,30,32,33,39,40,42,43,47],sine:16,singl:[1,4,6,14,16,26,35,36,41,45],single_cel:14,singleton:7,singular:14,situat:[17,40],size:[0,1,2,3,4,5,6,7,8,13,14,15,16,17,20,25,30,35,36,38,39,40,42,43,44,47],skerri:14,skip:[30,40],skip_update_ph:10,slanei:3,slice:14,slide:44,slight:[42,44],slightli:4,sloppi:4,slot:39,slower:[10,42],slowest:14,slr:44,slstm:[5,9,11],small:[8,14,26,30,35,38,40,41,42],smallest:1,smallest_sid:1,smooth:7,softmax:[7,14,16,36],softwar:39,sole:39,solut:14,some:[1,5,6,8,10,14,16,17,30,31,32,33,34,35,40,45],someth:33,sometim:[30,39],soon:[14,21,22,23,29,30],sort:4,sound:[8,47],sourc:[0,1,2,3,4,5,6,7,8,10,12,13,14,15,16,17,30,32,33,36,38,39],source_length:2,source_sequ:[2,6],source_tensor:[0,1,2,3,4,6,8,34],sox:[25,43],space:[13,44],spars:8,sparse_tensor_to_char:8,sparsemax:14,sparsetensorvalu:8,spatial:6,spec:[3,7,8],spec_lay:15,specfic:15,special:[27,46],specialtexttoken:4,specif:[2,3,5,6,30,35,41,45],specifi:[2,6,8,10,13,16,17,18,20,27,30,34,46],spectrogram:[2,3,5,7,8,14,15,42,47],spectrogram_predict:5,speech2text:[0,9,25,30,32,33,34,41,42,43],speech2textdatalay:2,speech:[2,3,8,14,24,31,34,42,44,47],speech_util:[0,9],speed:[4,40],speedup:[39,40],split:[4,5,14,16,27,46],split_data:[1,2,3],split_head:16,spoken:3,sqrt:10,src:[26,37],src_emb_dim:13,src_emb_siz:6,src_input:[5,6],src_length:[5,6,7],src_sequenc:6,src_vocab_s:6,stabil:[8,30],stabl:44,stack:14,stai:40,staircas:[10,38],stamp:30,standard:[6,8,14,40],start:[10,14,16,17,18,26,30,38,47],start_input:14,start_token:14,state:[5,6,14,15,16,38,47],state_is_tupl:14,state_s:14,statist:40,std:3,stderr:30,stdout:30,step:[1,3,8,10,14,15,17,30,32,33,35,39,42,44,47],steps_in_epoch:8,steps_per_epoch:10,still:16,stochast:42,stop:[3,5,8,14,15,17,47],stop_gradi:15,stop_token:7,stop_token_input:5,stop_token_lay:15,stop_token_pr:8,stop_token_predict:[5,7,15],stop_token_target:8,store:[3,4,8,14,16],str:[0,2,3,4,5,6,7,8,13,17],stream:17,strength:16,stretch:42,stride:[2,3,5,6,12,42,44],string:[1,2,3,4,5,6,8,10,17,30,35],strongli:5,structur:[14,15,16,28,47],style:14,sub:10,subfold:30,submit:40,subsequ:[1,14,30],subset:[14,41],substitut:[24,32,33],subtoken:[4,16],subtoken_count:4,subtoken_dict:4,subtoken_list:4,subtract:1,success:47,sudo:[25,32,33,43],suffer:14,suffic:34,suffici:47,suggest:[6,40],sum:[7,10,14,17],sum_i:14,summar:[40,42],summari:[8,10,17,30],sun:6,suppli:10,support:[0,2,3,4,5,6,7,8,12,14,15,17,18,20,30,32,33,34,35,40,41,45],supported_algo:10,sure:[0,1,4,25,26,27,33,34,43,46],surround:34,symbol:[0,5,16,42,44],symbols_to_logits_fn:16,symlink:[32,33],synset:1,synthesi:[14,24,31],system:[26,44],t2t:[0,9],t_list:10,tab:30,tacotron2:[5,31],tacotron2_decod:9,tacotron2_encod:9,tacotron2decod:5,tacotron2encod:6,tacotron:[5,6,7,9,11,45],tacotron_2_decod:5,tacotron_decod:[9,11],tacotron_help:[9,11],tacotron_lj_float:[27,45,46],tacotron_loss:9,tacotrondecod:15,tacotronhelp:15,tacotronloss:7,tacotrontraininghelp:15,tag:17,taht:[0,1,3,4],take:[3,5,6,7,10,14,16,17,25,26,32,33,34,35,41,42,43,45,47],taken:[8,14],tanh:[5,14],target:[0,1,2,3,4,5,7,8,13,17,26,36,37,38,39],target_emb:13,target_length:[2,5],target_s:4,target_sequ:[2,7],target_tensor:[0,1,2,3,4,5,7,8],target_vocab_s:4,task:[24,35,36,39],tbd:[35,39],teacher:15,techniqu:6,teganmaharaj:14,tempor:44,tensor2tensor:16,tensor:[0,1,2,3,4,5,6,7,8,10,13,14,15,16,17,20,34,40,44],tensorarrai:[14,15],tensorboard:[8,10,17,26,30,37],tensorflow:[0,1,4,5,6,7,8,10,13,14,15,16,17,30,31,40,44],tensorflow_pkg:[32,33],tensorshap:[14,15],term:[5,10,14],termin:16,tesla:40,test:[5,26,27,37,44,46],test_util:[27,46],text2speech:[0,9,27,34,45,46],text2speechdatalay:3,text2text:[0,9,26,30,34,35,37,39],text:[1,2,3,4,5,6,8,17,24,25,34,42],text_ids_to_str:17,text_input:[3,35,39],textlinedataset:[2,3],tfrecord:4,tgt:[26,37],tgt_emb_siz:5,tgt_input:5,tgt_length:[5,7],tgt_sequenc:7,tgt_vocab_s:[5,7],than:[1,3,4,6,8,10,14,16,26,35,36,40,42,44],thang:14,thed:5,thei:[1,4,6,10,14,40],them:[25,40,43],therefor:[35,39],thi:[0,1,2,3,4,5,6,7,8,10,13,14,16,17,20,21,22,23,25,26,27,29,30,31,34,35,36,37,39,40,41,43,44,45,46,47],thing:[4,26,30,37,40],those:[8,14],thread:17,three:[1,4,27,46,47],threshold:[4,42],through:[1,14,16,47],thu:[4,5,30,39],tile:[14,16],tile_batch:14,tiled_encoder_final_st:14,tiled_encoder_output:14,tiled_input:14,tiled_sequence_length:14,tim:14,time:[1,3,4,5,6,7,8,14,15,17,25,30,32,33,34,35,36,39,40,42,43,44],time_major:[5,6,15],time_stretch_ratio:2,timestep:[7,14,40],tip:45,titan:40,titl:8,tmp:[32,33],tobyyouup:13,todo:20,togeth:[8,14,17,40],toi:[24,25,32,33,35,41,43],tok:26,token:[0,3,5,8,9,14,15,16,27,34,35,36,39,46,47],token_count:4,tokenizer_wrapp:[35,39],too:14,tool:[32,33],toolkit:31,top:[4,14,16],topic:30,topolog:42,total:[0,10,39,40,44],total_regularization_loss:10,tower:[8,18],toy_text_data:[26,37],tra:4,track:[14,17],tracks_own_finish:14,train:[0,1,3,4,5,6,8,10,12,14,15,16,17,24,26,30,31,34,37],train_ev:[8,17,24,25,26,27,30,32,33,35,37,41,43,46],train_model:17,train_op:8,train_param:[27,30,45,46],train_step:8,trainable_vari:10,trainer:10,training_step:8,transcript:[3,27,42,45,46],transform:[4,5,6,9,10,11,13,20,26,31,35,37],transform_for_bleu:8,transformer_decod:9,transformer_encod:9,transformer_polici:10,transformerdatalay:4,transformerdecod:5,transformerencod:6,translat:[4,8,14,16,24,31,36,37,39],transpos:[3,16],treat:[8,10,30],tri:6,trick:14,trie:[5,25,43],trie_path:5,trim:3,trt:8,true_batch_s:14,true_siz:[8,17],tupl:[1,2,3,8,10,14,15,16,17],turn:39,tutori:[24,30,31],twice:4,two:[1,4,14,16,17,18,25,34,40,42,43,47],txt:[26,27,32,33,35,37,39,41,46],type:[0,1,2,3,4,5,6,7,8,10,12,13,14,15,16,17,39,40,42],typeerror:[10,14,15],typic:[0,5,6,7,40],ubuntu:33,ultim:6,unbatch:4,unchang:[14,16],under:[10,45],underflow:[14,40],undergo:1,underli:[2,40],underlin:4,understand:30,unescap:4,unescape_token:4,unfinish:15,uni:6,unicod:4,unidir_rnn_encoder_with_emb:6,unidirectionalrnnencoderwithembed:6,uniqu:16,unit:[5,6,13,14,44],unittest:[32,33],unk_id:4,unknown:1,unnorm:47,unspecifi:14,until:47,unus:45,unused_kwarg:15,upcom:17,upd_dict:17,updat:[4,8,10,14,30,33,34,40],update_op:10,use:[0,1,3,4,5,6,7,8,10,14,15,18,20,24,25,26,30,32,33,35,36,37,40,41,42,43,44,47],use_bia:14,use_cudnn_rnn:6,use_horovod:[8,18,24,30,32,33,39],use_language_model:[5,32,33,41],use_new_attent:14,use_norm:10,use_staircase_decai:10,use_swap_memori:[5,6],use_trt:[8,17],used:[0,1,3,4,5,6,7,8,10,13,14,15,16,17,26,30,36,39,40,41,44,47],useful:[8,30,31],user:[0,14,40],uses:[7,13,14,25,26,37,40,42,43],using:[1,2,3,4,6,8,10,14,17,18,20,26,27,32,33,35,39,40,41,44,46,47],usual:[5,7,14,25,33,40,42,43],util:[1,8,9,11,40],utter:[25,43],v100:40,val:[27,46],valid:[0,1,4,5,6,8,10,14,17,24,30,32,33,41],valu:[1,2,3,4,5,6,8,10,13,14,15,16,17,30,40],value_channel:16,valueerror:[1,10,14],var_list:10,var_scope_nam:13,vari:[39,42],variabl:[4,5,6,7,8,10,13,14,16,17,30,40],variable_norm:[8,30],varianc:40,variant:6,variational_recurr:14,varibl:44,varieti:40,variou:[5,6,10,30],vaswani:39,vector:[1,13,14],venkatesh:40,verbos:[6,17],veri:[14,26,36,39,41,42],versa:14,version:[4,5,14,33,39,40,41],vgg:1,via:[3,14,27,34,46,47],vice:14,view:[4,26,37],visual:[8,10],vocab:[0,4,8,17,27,46],vocab_fil:[2,3,4,27,46],vocab_s:[5,16],vocab_tt:[27,46],vocabluari:35,vocabulari:[0,2,3,4,5,6,7,17,26,36,39,42,44],volta:[24,40],w2l_encod:9,w2l_plus_large_mp:[41,44],wai:[4,8,10,40],wang:14,want:[6,25,26,27,30,33,35,41,43,45,46,47],warm:10,warmpup:36,warmup:36,warmup_step:10,wav2lett:6,wav:[2,3,8,27,45,46],wave2lett:[6,31],wave2letterencod:6,wave2letterv2:44,wave:[2,3],waveform:[42,44],wavel2lett:41,wavelength:16,wavenet:14,weight:[5,6,13,14,16,17,40,42,44,47],weight_norm:13,weight_vari:14,weiss:14,well:[5,6,8,26,37,42,47],wer:[41,42,44],were:[6,14,26,42],wether:5,what:[28,47],when:[0,1,3,4,5,6,8,10,14,15,16,17,18,24,30,32,33,39,40,44,47],whenev:[30,40],where:[1,3,4,8,10,14,16,20,26,30,37,40,42],wherea:47,whether:[0,1,3,4,5,6,7,8,10,13,14,15,16,30],which:[0,1,3,4,5,6,7,8,10,14,16,17,20,26,30,37,39,40,42,44,47],whl:[32,33],whole:[8,30,42],whose:14,whther:3,width:[1,5,6,13,44],width_in:6,window:[2,3,44],window_s:2,window_strid:2,wise:[38,42,44],within:[6,41],without:[1,5,6,16,24,30,32,33,39,40,42,44],wmt14:[35,39],wmt16_de_en:[35,39],wmt:[26,35,36,39],word:[0,4,5,8,35,41,42,44,47],work:[5,8,26,30,33,34,37,42],worker:[4,7,8,17],worker_id:[0,1,2,3,4,8,20],workshop:14,wors:32,worst:[14,16],worth:40,would:[27,32,33,41,46],wrap:[4,5,14,17,40],wrapper:[1,5,6,7,8,14,16,40],write:[17,30],wrong:14,xiangyu:6,xmax:1,xmin:1,yang:14,yanni:14,ymax:1,ymin:1,yonghui:14,yoshua:14,you:[0,1,4,6,8,10,14,16,17,18,20,24,25,26,27,30,31,32,33,35,37,39,40,41,43,45,46],your:[0,1,4,20,24,26,27,30,32,33,35,39,41,45,46],yourself:40,yuxuan:14,zero:[8,14,16],zero_st:14,zhang:[6,14],zhifeng:14,zoneout:[5,6,9,11,47],zoneout_prob:[5,6,14],zoneoutwrapp:14,zongheng:14},titles:["data","image2label","speech2text","text2speech","text2text","decoders","encoders","losses","models","API documentation","optimizers","parts","cnns","convs2s","rnns","tacotron","transformer","utils","Distributed training","Adding new models","Adding new data layer","Adding new decoder","Adding new encoder","Adding new loss","Getting started","Speech Recognition","Machine Translation","Text-To-Speech","In-depth tutorials","Internal structure","Using existing models","OpenSeq2Seq","Installation instructions","Installation","Interactive Infer Mode","Machine Translation","ConvS2S","Getting Started","GNMT","Transformer","Mixed precision training","Speech Recognition","DeepSpeech2","Speech Recognition","Wave2Letter+","Speech Synthesis","Text-To-Speech","Tacotron 2"],titleterms:{"new":[19,20,21,22,23],Adding:[19,20,21,22,23],Using:30,add:[32,33],adventur:[26,37],api:9,attention_lay:16,attention_wn_lay:13,attention_wrapp:14,automat:40,automatic_loss_scal:10,beam_search:16,being:30,bleu:[26,35],bpe:26,build:[25,43],clean:26,cnn:12,cnn_encod:6,common:16,comput:[26,35],config:30,conv_block:12,conv_wn_lay:13,convs2:[13,36],convs2s_decod:5,convs2s_encod:6,creat:26,cross_entropy_loss:7,ctc:[32,33],ctc_loss:7,data:[0,20,34,35,41,45],data_lay:0,dataset:[25,27,43,46],decod:[5,21,32,33],deepspeech2:42,depth:28,descript:47,detail:40,distribut:18,document:9,download:[32,33],ds2_encod:6,embedding_lay:16,enabl:[34,40],encod:[6,22],encoder_decod:8,english:26,evalu:41,exampl:34,exist:30,fc_decod:5,feel:[26,37],ffn_layer:16,ffn_wn_layer:13,flstm:14,func:17,gener:[32,33],german:26,get:[24,35,37,41,45],glstm:14,gnmt:[14,38],gpu:47,hook:17,horovod:[32,33],how:[25,27,30,32,33,34,40,43,46],image2label:[1,8],imagenet_preprocess:1,implement:40,infer:[26,34,35,41,45],instal:[32,33],instruct:32,interact:34,intern:29,introduct:34,jupyt:34,languag:[25,32,33,43],layer:[20,34],librispeech:[25,43],ljspeech:[27,46],log:30,loss:[7,23,40],lr_polici:10,machin:[26,35],mix:[36,38,39,40,42,44,47],mode:34,model:[8,19,25,27,30,32,33,35,36,38,39,41,42,43,44,45,46,47],mp_wrapper:10,multi:47,notebook:34,openseq2seq:[31,32,33],optim:[10,40],own:[25,43],paramet:30,part:11,pre:42,precis:[36,38,39,40,42,44,47],prerequisit:40,recognit:[25,32,33,41,43],regular:40,resnet_block:6,resnet_encod:6,revers:[26,37],rnn:14,rnn_beam_search_decod:14,rnn_decod:5,rnn_encod:6,run:[26,30,32,33,34],scale:40,score:[26,35],segment:26,sequenc:[26,37],sequence_loss:7,slstm:14,speech2text:[2,8],speech:[25,27,32,33,41,43,45,46],speech_util:[2,3],start:[24,35,37,41,45],structur:29,synthesi:45,t2t:4,tacotron2_decod:5,tacotron2_encod:6,tacotron:[15,47],tacotron_decod:15,tacotron_help:15,tacotron_loss:7,task:[26,37],tensorflow:[32,33],test:[32,33],text2speech:[3,8],text2text:[4,8],text:[27,46],tip:47,toi:[26,37],token:4,train:[18,25,27,32,33,35,36,38,39,40,41,42,43,44,45,46,47],transform:[16,39],transformer_decod:5,transformer_encod:6,translat:[26,35],trick:47,tutori:28,util:[0,14,16,17],w2l_encod:6,wave2lett:44,what:30,your:[25,43],zoneout:14}})
\ No newline at end of file
diff --git a/docs/html/speech-recognition.html b/docs/html/speech-recognition.html
index a484ed24c..f575f871b 100644
--- a/docs/html/speech-recognition.html
+++ b/docs/html/speech-recognition.html
@@ -194,12 +194,12 @@ <h2>Models<a class="headerlink" href="#models" title="Permalink to this headline
 <tbody valign="top">
 <tr class="row-even"><td><a class="reference internal" href="speech-recognition/deepspeech2.html"><span class="doc">DeepSpeech2</span></a></td>
 <td>6.71</td>
-<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus_mp.py">ds2_large_mp</a></td>
+<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/ds2_large_8gpus_mp.py">ds2_large_mp</a></td>
 <td><a class="reference external" href="https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX">link</a></td>
 </tr>
-<tr class="row-odd"><td><a class="reference internal" href="speech-recognition/wave2letter.html"><span class="doc">Wavel2Letter</span></a></td>
+<tr class="row-odd"><td><a class="reference internal" href="speech-recognition/wave2letter.html"><span class="doc">Wavel2Letter+</span></a></td>
 <td>6.67</td>
-<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2lplus_large_8gpus_mp.py">w2l_plus_large_mp</a></td>
+<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/w2lplus_large_8gpus_mp.py">w2l_plus_large_mp</a></td>
 <td><a class="reference external" href="https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing">link</a></td>
 </tr>
 </tbody>
@@ -209,7 +209,7 @@ <h2>Models<a class="headerlink" href="#models" title="Permalink to this headline
 For the evaluation we used <code class="docutils literal notranslate"><span class="pre">batch_size_per_gpu</span> <span class="pre">=</span> <span class="pre">1</span></code>
 to eliminate the effect of <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/issues/69">cudnn padding issue</a>.</p>
 <p>For more details about model and training parameters,
-have a look at the <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text">configuration files</a> and specific model’s documentation.</p>
+have a look at the <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text">configuration files</a> and specific model’s documentation.</p>
 <div class="toctree-wrapper compound">
 </div>
 </div>
diff --git a/docs/html/speech-recognition/deepspeech2.html b/docs/html/speech-recognition/deepspeech2.html
index 5410986c8..146f28d30 100644
--- a/docs/html/speech-recognition/deepspeech2.html
+++ b/docs/html/speech-recognition/deepspeech2.html
@@ -237,7 +237,7 @@ <h2>Pre-trained model<a class="headerlink" href="#pre-trained-model" title="Perm
 <tbody valign="top">
 <tr class="row-even"><td><a class="reference internal" href="#"><span class="doc">DeepSpeech2</span></a></td>
 <td>6.71</td>
-<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus_mp.py">ds2_large_8gpus_mp</a></td>
+<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/ds2_large_8gpus_mp.py">ds2_large_8gpus_mp</a></td>
 <td><a class="reference external" href="https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX">link</a></td>
 </tr>
 </tbody>
diff --git a/docs/html/speech-recognition/wave2letter.html b/docs/html/speech-recognition/wave2letter.html
index 6e18c9505..f7c5b1dff 100644
--- a/docs/html/speech-recognition/wave2letter.html
+++ b/docs/html/speech-recognition/wave2letter.html
@@ -227,7 +227,7 @@ <h2>Training<a class="headerlink" href="#training" title="Permalink to this head
 </tbody>
 </table>
 <p>We used Open SLR language model while decoding with beam search using a beam width of 2048.</p>
-<p>The checkpoint for the model trained using the configuration <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2lplus_large_8gpus_mp.py">w2l_plus_large_mp</a> can be found at <a class="reference external" href="https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing">Checkpoint</a>.</p>
+<p>The checkpoint for the model trained using the configuration <a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/w2lplus_large_8gpus_mp.py">w2l_plus_large_mp</a> can be found at <a class="reference external" href="https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing">Checkpoint</a>.</p>
 <p>Our best model was trained for 200 epochs on 8 GPUs. We use:</p>
 <ul class="simple">
 <li>SGD with momentum = 0.9</li>
diff --git a/docs/html/speech-synthesis.html b/docs/html/speech-synthesis.html
index 80f791e34..e365f92e4 100644
--- a/docs/html/speech-synthesis.html
+++ b/docs/html/speech-synthesis.html
@@ -189,7 +189,7 @@ <h2>Models<a class="headerlink" href="#models" title="Permalink to this headline
 </thead>
 <tbody valign="top">
 <tr class="row-even"><td><a class="reference internal" href="speech-synthesis/tacotron-2.html"><span class="doc">Tacotron-2</span></a></td>
-<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float.py">tacotron_LJ_float.py</a></td>
+<td><a class="reference external" href="https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2speech/tacotron_LJ_float.py">tacotron_LJ_float.py</a></td>
 <td>To be added</td>
 </tr>
 </tbody>
diff --git a/docs/sources/source/machine-translation.rst b/docs/sources/source/machine-translation.rst
index 804935b2d..12a1da2c8 100644
--- a/docs/sources/source/machine-translation.rst
+++ b/docs/sources/source/machine-translation.rst
@@ -19,15 +19,15 @@ Currently we support following models:
      - Checkpoint
    * - :doc:`Transformer </machine-translation/transformer>`
      - 26.4
-     - `transformer-big.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/transformer-big.py>`_     
+     - `transformer-base.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/transformer-base.py>`_     
      - TBD
    * - :doc:`ConvS2S </machine-translation/convs2s>`
      - 25.0
-     - `en-de-convs2s.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-convs2s.py>`_
+     - `en-de-convs2s-8-gpu.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-convs2s-8-gpu.py>`_
      - TBD
    * - :doc:`GNMT </machine-translation/gnmt>`
      - 23.0
-     - `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_
+     - `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_
      - TBD
 
 The model specification and training parameters can be found in the corresponding config file. We measure BLEU scores using SacreBLEU.
diff --git a/docs/sources/source/machine-translation/gnmt.rst b/docs/sources/source/machine-translation/gnmt.rst
index 3c1176086..ba5aedb35 100644
--- a/docs/sources/source/machine-translation/gnmt.rst
+++ b/docs/sources/source/machine-translation/gnmt.rst
@@ -6,12 +6,12 @@ GNMT
 Model
 ~~~~~
 We have 2 models based on RNNs:
-  * small NMT (config `en-de-nmt-small.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-nmt-small.py>`_ ) model:
+  * small NMT (config `en-de-nmt-small.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-nmt-small.py>`_ ) model:
 
     - the embedding size for source and target is 512
     - 2 birectional LSTM layers in encoder, and 2 LSTM layers in decoder  with state 512
     - the attention mechanism with size 512
-  * GNMT-like model based on `Google NMT <https://ai.google/research/pubs/pub45610>`_  (config `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_ ):
+  * GNMT-like model based on `Google NMT <https://ai.google/research/pubs/pub45610>`_  (config `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_ ):
 
     - the embedding size for source and target is 1024
     - 8 LSTM layers in encoder, and 8 LSTM layers in decoder with state 1024
diff --git a/docs/sources/source/models-and-recipes.rst b/docs/sources/source/models-and-recipes.rst
deleted file mode 100644
index e98a2679d..000000000
--- a/docs/sources/source/models-and-recipes.rst
+++ /dev/null
@@ -1,173 +0,0 @@
-.. _models_and_recipes:
-
-Models and recipes
-==================
-
-
-.. note::
-    Currently OpenSeq2Seq has model implementations for machine translation and
-    automatic speech recognition.
-    All models work both in float32 and mixed precision.
-    We recommend you use :ref:`mixed precision training <mixed_precision>`
-    when training on Volta GPUs.
-
-
-To train models you can use the following commands (don't forget to substitute
-valid config_file path there and number of GPUs if using Horovod).
-
-With Horovod (highly recommended when using multiple GPUs)::
-
-    mpiexec --allow-run-as-root -np <num_gpus> python run.py --config_file=... --mode=train_eval --use_horovod=True --enable_logs
-
-Without Horovod::
-
-    python run.py --config_file=... --mode=train_eval --enable_logs
-
-The description of implemented models is available in the next sections:
-
-Machine translation
--------------------
-
-The table below contains description and results of
-machine translation models available in OpenSeq2Seq.
-Currently, we have GNMT-based model, Transformer-based models and
-ConvS2S-based models.
-
-We measure BLEU score on newstest2014.tok.de file using ``multi-bleu.perl`` script from Mosses.
-For more details about model descriptions and training setup,
-have a look at the `configuration files <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de>`_.
-
-
-.. list-table::
-   :widths: 1 1 1 1 1
-   :header-rows: 1
-
-   * - Config file
-     - BLEU
-     - Training setup and additional comments
-     - Short description of the model
-     - Checkpoint
-   * - `en-de-nmt-small.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-nmt-small.py>`_
-     - 20.23
-     - This model should train on a single GPU such as 1080Ti. It is trained using Adam optimizer.
-     - RNN-based. Bi-directional encoder with 2 layers and. GNMT-like decoder with 2 layers and attention. Uses LSTM cells of size 512.
-     - `link <https://drive.google.com/file/d/1Ty9hiOQx4V28jJmIbj7FWUyw7LVA39SF/view?usp=sharing>`_
-   * - `en-de-gnmt-like-4GPUs.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-gnmt-like-4GPUs.py>`_
-     - 23.89
-     - This model was trained on 4 GPUs with Adam optimizer and learning rate decay.
-     - RNN-based. This is GNMT-like model which tries to match the one described in https://arxiv.org/abs/1609.08144 as close as possible.
-     - `link <https://drive.google.com/file/d/1HVc4S8-wv1-AZK1JeWgn6YNITSFAMes_/view?usp=sharing>`_
-   * - `transformer-big.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/transformer-big.py>`_
-     - 26.17
-     - This model was trained on 4 GPUs with Adam optimizer and learning rate decay.
-     - Transformer "big" model. This model does not have any RNN layers
-     - `link <https://drive.google.com/file/d/151R6iCCtehRLpnH3nBmhEi_nhNO2mXW8/view?usp=sharing>`_
-   * - `en-de-convs2s.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2text/en-de/en-de-convs2s.py>`_
-     - xx.xx
-     - This model was trained on 4 GPUs with Adam optimizer, learning rate decay and warm-up.
-     - This is an implementation of the ConvS2S model proposed in https://arxiv.org/abs/1705.03122.
-     - Coming soon.
-
-GNMT model description: https://arxiv.org/abs/1609.08144.
-
-Transformer model description: https://arxiv.org/abs/1706.03762.
-
-ConvS2S model description: https://arxiv.org/abs/1705.03122.
-
-Speech recognition
-------------------
-
-The table below contains description and results of
-speech recognition models available in OpenSeq2Seq.
-Currently, we have DeepSpeech2-based models and Wav2Letter-based models.
-
-WER is the word error rate obtained on a dev-clean subset of LibriSpeech using
-greedy decoder (``decoder_params/use_language_model = False``).
-For the final evaluation we used ``batch_size_per_gpu = 1``
-to eliminate the effect of `cudnn padding issue <https://github.com/NVIDIA/OpenSeq2Seq/issues/69>`_.
-For more details about model descriptions and training setup,
-have a look at the `configuration files <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text>`_.
-
-.. list-table::
-   :widths: 1 1 1 1 1
-   :header-rows: 1
-
-   * - Config file
-     - WER
-     - Training setup and additional comments
-     - Short description of the model
-     - Checkpoint
-   * - `w2l_large_8gpus_mp.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2l_large_8gpus_mp.py>`_
-     - 7.19%
-     - This model was trained for 200 epochs using SGD with Momentum and LARC on
-       the full LibriSpeech in three days on eight GPUs using mixed precision.
-     - The model has 17 convolutional layers (256--1024 units, 11--29 kernel size).
-       We use batch norm between all layers.
-     - `link <https://drive.google.com/file/d/140edZXuzehCCaOxgEixJEesvo97EB5i1/view?usp=sharing>`_
-   * - `ds2_large_8gpus.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus.py>`_
-     - 9.28%
-     - This model was trained for 50 epochs using SGD with Momentum and LARC on
-       the full LibriSpeech in a few days using Horovod on eight GPUs.
-     - This model has 2 convolutional layers and 5 bidirectional
-       GRU layers with 800 units.
-     - `link <https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX>`_
-   * - `ds2_medium_4gpus.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_medium_4gpus.py>`_
-     - 22.60%
-     - This model was trained for 50 epochs using Adam on the full
-       LibriSpeech in a few days using Horovod on four GPUs.
-     - This model has 3 convolutional layers and 3 unidirectional
-       GRU layers with 1024 units.
-     - `link <https://drive.google.com/file/d/1XpnyZzMaO38RE4dSOJZkcaJ3T8B0lxKe/view?usp=sharing>`_
-   * - `ds2_small_1gpu.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_small_1gpu.py>`_
-     - 39.08%
-     - This model was trained for 12 epochs using Adam on a "clean" subset of
-       LibriSpeech in less than a day using a single GPU.
-     - This model has 2 convolutional layers and 2 bidirectional
-       GRU layers with 512 units.
-     - `link <https://drive.google.com/file/d/1-OEvxyg7rCogZhejen7pNuKkgvuwCdbk/view?usp=sharing>`_
-
-
-Deep Speech 2 model description: https://arxiv.org/abs/1512.02595.
-
-Wav2Letter model description: https://arxiv.org/abs/1609.03193, https://arxiv.org/abs/1712.09444.
-
-Text To Speech
----------------
-
-The table below contains description and results of
-text-to-speech models available in OpenSeq2Seq.
-Currently, we have a Tacotron2-based model.
-
-.. list-table::
-   :widths: 1 1 1 1 1
-   :header-rows: 1
-
-   * - Config file
-     - Samples
-     - Training setup and additional comments
-     - Short description of the model
-     - Checkpoint
-   * - `tacotron_LJ_float.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float.py>`_
-     - Coming soon.
-     - Learns magnitude spectrograms. Trained on 1 gpu for 100,000 steps with ADAM.
-     - Model tries to match the model description in https://arxiv.org/abs/1712.05884.
-       The only difference is that the stop token projection layer is placed after
-       the spectrogram projection layer.
-     - Coming soon.
-   * - `tacotron_LJ_float_8gpu.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float_8gpu.py>`_
-     - Coming soon.
-     - Learns magnitude spectrograms. Trained on 8 gpus for 30,000 steps with ADAM and larc.
-     - Model tries to match the model description in https://arxiv.org/abs/1712.05884.
-       The only difference is that the stop token projection layer is placed after
-       the spectrogram projection layer.
-     - Coming soon.
-   * - `tacotron_LJ_mixed.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_mixed.py>`_
-     - Coming soon.
-     - Learns magnitude spectrograms. Trained on 1 gpu for 100,000 steps with ADAM and larc.
-     - Model tries to match the model description in https://arxiv.org/abs/1712.05884.
-       The only difference is that the stop token projection layer is placed after
-       the spectrogram projection layer.
-     - Coming soon.
-
-
-Tacotron 2 model description: https://arxiv.org/abs/1712.05884.
diff --git a/docs/sources/source/speech-recognition.rst b/docs/sources/source/speech-recognition.rst
index c5923c636..fd0ef6931 100644
--- a/docs/sources/source/speech-recognition.rst
+++ b/docs/sources/source/speech-recognition.rst
@@ -21,12 +21,12 @@ Currently we support following models:
 
    * - :doc:`DeepSpeech2 </speech-recognition/deepspeech2>`
      - 6.71
-     - `ds2_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus_mp.py>`_
+     - `ds2_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/ds2_large_8gpus_mp.py>`_
      - `link <https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX>`_
 
-   * - :doc:`Wavel2Letter </speech-recognition/wave2letter>`
+   * - :doc:`Wavel2Letter+ </speech-recognition/wave2letter>`
      - 6.67
-     - `w2l_plus_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2lplus_large_8gpus_mp.py>`_
+     - `w2l_plus_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/w2lplus_large_8gpus_mp.py>`_
      - `link <https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing>`_
 
 
@@ -36,7 +36,7 @@ For the evaluation we used ``batch_size_per_gpu = 1``
 to eliminate the effect of `cudnn padding issue <https://github.com/NVIDIA/OpenSeq2Seq/issues/69>`_.
 
 For more details about model and training parameters,
-have a look at the `configuration files <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text>`_ and specific model's documentation.
+have a look at the `configuration files <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text>`_ and specific model's documentation.
 
 .. toctree::
    :hidden:
diff --git a/docs/sources/source/speech-recognition/deepspeech2.rst b/docs/sources/source/speech-recognition/deepspeech2.rst
index b31d79c41..53845183c 100644
--- a/docs/sources/source/speech-recognition/deepspeech2.rst
+++ b/docs/sources/source/speech-recognition/deepspeech2.rst
@@ -80,7 +80,7 @@ Here is a pre-trained model which was trained for 200 epochs in a mixed precisio
 
    * - :doc:`DeepSpeech2 </speech-recognition/deepspeech2>`
      - 6.71
-     - `ds2_large_8gpus_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/ds2_large_8gpus_mp.py>`_
+     - `ds2_large_8gpus_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/ds2_large_8gpus_mp.py>`_
      - `link <https://drive.google.com/open?id=1EDvL9wMCO2vVE-ynBvpwkFTultbzLNQX>`_
 
 
diff --git a/docs/sources/source/speech-recognition/wave2letter.rst b/docs/sources/source/speech-recognition/wave2letter.rst
index 0ad7c052f..6d7df92ef 100644
--- a/docs/sources/source/speech-recognition/wave2letter.rst
+++ b/docs/sources/source/speech-recognition/wave2letter.rst
@@ -53,7 +53,7 @@ We achieved a WER of 6.58 (the WER in the paper is 6.7) on the librispeech test-
 
 We used Open SLR language model while decoding with beam search using a beam width of 2048.
 
-The checkpoint for the model trained using the configuration `w2l_plus_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/speech2text/w2lplus_large_8gpus_mp.py>`_ can be found at `Checkpoint <https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing>`_.
+The checkpoint for the model trained using the configuration `w2l_plus_large_mp <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/speech2text/w2lplus_large_8gpus_mp.py>`_ can be found at `Checkpoint <https://drive.google.com/file/d/10EYe040qVW6cfygSZz6HwGQDylahQNSa/view?usp=sharing>`_.
 
 Our best model was trained for 200 epochs on 8 GPUs. We use:
 
@@ -70,4 +70,4 @@ Mixed Precision
 
 To use mixed precision (float16) during training we made a few minor changes to the model. Tensorflow by default calls Keras Batch Normalization on 3D input (BxTxC) and cuDNN on 4D input (BxHxWxC). In order to use cuDNN's BN we added an extra dimension to the 3D input to make it a 4D tensor (BxTx1xC). 
 
-The mixed precison model reached the same WER for the same number of steps as float32. The training time decreased by ~1.5x on 8-GPU DGX1 system, and by ~3x on 1-GPU and 4-GPUs when using Horovod.
\ No newline at end of file
+The mixed precison model reached the same WER for the same number of steps as float32. The training time decreased by ~1.5x on 8-GPU DGX1 system, and by ~3x on 1-GPU and 4-GPUs when using Horovod.
diff --git a/docs/sources/source/speech-synthesis.rst b/docs/sources/source/speech-synthesis.rst
index e83f98b42..f6752246f 100644
--- a/docs/sources/source/speech-synthesis.rst
+++ b/docs/sources/source/speech-synthesis.rst
@@ -17,7 +17,7 @@ Currently we support following models:
      - Config file
      - Checkpoint
    * - :doc:`Tacotron-2 </speech-synthesis/tacotron-2>`
-     - `tacotron_LJ_float.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/master/example_configs/text2speech/tacotron_LJ_float.py>`_
+     - `tacotron_LJ_float.py <https://github.com/NVIDIA/OpenSeq2Seq/blob/18.09/example_configs/text2speech/tacotron_LJ_float.py>`_
      - To be added
 
 The model specification and training parameters can be found in the corresponding config file.
@@ -79,4 +79,4 @@ one audio sample per line and save the audio sample inside your ``log_dir``.
 Change ``dataset_files`` under ``infer_params`` to point to your newly created
 csv. Lastly, run ::
 
-    python run.py --config_file=example_configs/text2speech/tacotron_LJ_float.py --mode=infer --infer_output_file=unused
\ No newline at end of file
+    python run.py --config_file=example_configs/text2speech/tacotron_LJ_float.py --mode=infer --infer_output_file=unused