qnamqj
diff --git a/‎deepctr/estimator/feature_column.py
+3-4 b/‎deepctr/estimator/feature_column.py
+3-4
diff --git a/‎deepctr/estimator/inputs.py
+16-24 b/‎deepctr/estimator/inputs.py
+16-24
diff --git a/‎deepctr/estimator/models/afm.py
+5-2 b/‎deepctr/estimator/models/afm.py
+5-2
diff --git a/‎deepctr/estimator/models/autoint.py
+5-2 b/‎deepctr/estimator/models/autoint.py
+5-2
diff --git a/‎deepctr/estimator/models/ccpm.py
+7-3 b/‎deepctr/estimator/models/ccpm.py
+7-3
diff --git a/‎deepctr/estimator/models/dcn.py
+5-2 b/‎deepctr/estimator/models/dcn.py
+5-2
diff --git a/‎deepctr/estimator/models/deepfm.py
+6-2 b/‎deepctr/estimator/models/deepfm.py
+6-2
diff --git a/‎deepctr/estimator/models/fibinet.py
+5-2 b/‎deepctr/estimator/models/fibinet.py
+5-2
diff --git a/‎deepctr/estimator/models/fnn.py
+5-2 b/‎deepctr/estimator/models/fnn.py
+5-2
diff --git a/‎deepctr/estimator/models/fwfm.py
+5-2 b/‎deepctr/estimator/models/fwfm.py
+5-2
diff --git a/‎deepctr/estimator/models/nfm.py
+5-2 b/‎deepctr/estimator/models/nfm.py
+5-2
@@ -22,7 +22,7 @@ def get_linear_logit(features, linear_feature_columns, l2_reg_linear=0):
 
             if l2_reg_linear > 0:
                 for var in get_collection(get_GraphKeys().TRAINABLE_VARIABLES, LINEAR_SCOPE_NAME)[:-1]:
-                    get_losses().add_loss(tf.nn.l2_loss(var, name=var.name.split(":")[0] + "_l2loss"),
+                    get_losses().add_loss(l2_reg_linear * tf.nn.l2_loss(var, name=var.name.split(":")[0] + "_l2loss"),
                                           get_GraphKeys().REGULARIZATION_LOSSES)
     return linear_logits
 
@@ -35,7 +35,7 @@ def input_from_feature_columns(features, feature_columns, l2_reg_embedding=0.0):
             sparse_emb = tf.expand_dims(input_layer(features, [feat]), axis=1)
             sparse_emb_list.append(sparse_emb)
             if l2_reg_embedding > 0:
-                get_losses().add_loss(tf.nn.l2_loss(sparse_emb, name=feat.name + "_l2loss"),
+                get_losses().add_loss(l2_reg_embedding * tf.nn.l2_loss(sparse_emb, name=feat.name + "_l2loss"),
                                       get_GraphKeys().REGULARIZATION_LOSSES)
 
         else:
@@ -49,5 +49,4 @@ def is_embedding(feature_column):
         from tensorflow.python.feature_column.feature_column_v2 import EmbeddingColumn
     except:
         EmbeddingColumn = _EmbeddingColumn
-    return isinstance(feature_column, (_EmbeddingColumn,EmbeddingColumn))
-
+    return isinstance(feature_column, (_EmbeddingColumn, EmbeddingColumn))
@@ -1,36 +1,27 @@
 import tensorflow as tf
-from ..layers.utils import combined_dnn_input
 
-def input_fn_pandas(df, features, label=None, batch_size=256, num_epochs=1, shuffle=False, queue_capacity=2560,
+
+def input_fn_pandas(df, features, label=None, batch_size=256, num_epochs=1, shuffle=False, queue_capacity_factor=10,
                     num_threads=1):
-    """
-
-    :param df:
-    :param features:
-    :param label:
-    :param batch_size:
-    :param num_epochs:
-    :param shuffle:
-    :param queue_capacity:
-    :param num_threads:
-    :return:
-    """
     if label is not None:
         y = df[label]
     else:
         y = None
     if tf.__version__ >= "2.0.0":
         return tf.compat.v1.estimator.inputs.pandas_input_fn(df[features], y, batch_size=batch_size,
                                                              num_epochs=num_epochs,
-                                                             shuffle=shuffle, queue_capacity=queue_capacity,
+                                                             shuffle=shuffle,
+                                                             queue_capacity=batch_size * queue_capacity_factor,
                                                              num_threads=num_threads)
 
     return tf.estimator.inputs.pandas_input_fn(df[features], y, batch_size=batch_size, num_epochs=num_epochs,
-                                               shuffle=shuffle, queue_capacity=queue_capacity, num_threads=num_threads)
+                                               shuffle=shuffle, queue_capacity=batch_size * queue_capacity_factor,
+                                               num_threads=num_threads)
 
 
-def input_fn_tfrecord(filenames, feature_description, label=None, batch_size=256, num_epochs=1, shuffle=False,
-                      num_parallel_calls=10):
+def input_fn_tfrecord(filenames, feature_description, label=None, batch_size=256, num_epochs=1, num_parallel_calls=8,
+                      shuffle_factor=10, prefetch_factor=1,
+                      ):
     def _parse_examples(serial_exmp):
         features = tf.parse_single_example(serial_exmp, features=feature_description)
         if label is not None:
@@ -40,16 +31,17 @@ def _parse_examples(serial_exmp):
 
     def input_fn():
         dataset = tf.data.TFRecordDataset(filenames)
-        dataset = dataset.map(_parse_examples, num_parallel_calls=num_parallel_calls).prefetch(
-            buffer_size=batch_size * 10)
-        if shuffle:
-            dataset = dataset.shuffle(buffer_size=batch_size * 10)
+        dataset = dataset.map(_parse_examples, num_parallel_calls=num_parallel_calls)
+        if shuffle_factor > 0:
+            dataset = dataset.shuffle(buffer_size=batch_size * shuffle_factor)
 
         dataset = dataset.repeat(num_epochs).batch(batch_size)
+
+        if prefetch_factor > 0:
+            dataset = dataset.prefetch(buffer_size=batch_size * prefetch_factor)
+
         iterator = dataset.make_one_shot_iterator()
 
         return iterator.get_next()
 
     return input_fn
-
-
@@ -20,7 +20,7 @@
 def AFMEstimator(linear_feature_columns, dnn_feature_columns, use_attention=True, attention_factor=8,
                  l2_reg_linear=1e-5, l2_reg_embedding=1e-5, l2_reg_att=1e-5, afm_dropout=0, seed=1024,
                  task='binary', model_dir=None, config=None, linear_optimizer='Ftrl',
-                 dnn_optimizer='Adagrad'):
+                 dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the Attentional Factorization Machine architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -41,6 +41,8 @@ def AFMEstimator(linear_feature_columns, dnn_feature_columns, use_attention=True
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
 
     """
@@ -62,6 +64,7 @@ def _model_fn(features, labels, mode, config):
 
         logits = linear_logits + fm_logit
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks=training_chief_hooks)
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)
@@ -23,7 +23,7 @@ def AutoIntEstimator(linear_feature_columns, dnn_feature_columns, att_layer_num=
                      dnn_hidden_units=(256, 256), dnn_activation='relu', l2_reg_linear=1e-5,
                      l2_reg_embedding=1e-5, l2_reg_dnn=0, dnn_use_bn=False, dnn_dropout=0, seed=1024,
                      task='binary', model_dir=None, config=None, linear_optimizer='Ftrl',
-                     dnn_optimizer='Adagrad'):
+                     dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the AutoInt Network architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -49,6 +49,8 @@ def AutoIntEstimator(linear_feature_columns, dnn_feature_columns, att_layer_num=
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
 
     """
@@ -89,6 +91,7 @@ def _model_fn(features, labels, mode, config):
 
         logits = linear_logits + final_logit
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks=training_chief_hooks)
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)
@@ -21,7 +21,7 @@
 def CCPMEstimator(linear_feature_columns, dnn_feature_columns, conv_kernel_width=(6, 5), conv_filters=(4, 4),
                   dnn_hidden_units=(256,), l2_reg_linear=1e-5, l2_reg_embedding=1e-5, l2_reg_dnn=0, dnn_dropout=0,
                   seed=1024, task='binary', model_dir=None, config=None, linear_optimizer='Ftrl',
-                  dnn_optimizer='Adagrad'):
+                  dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the Convolutional Click Prediction Model architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -43,6 +43,8 @@ def CCPMEstimator(linear_feature_columns, dnn_feature_columns, conv_kernel_width
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
 
     """
@@ -79,11 +81,13 @@ def _model_fn(features, labels, mode, config):
 
             flatten_result = tf.keras.layers.Flatten()(pooling_result)
             dnn_out = DNN(dnn_hidden_units, l2_reg=l2_reg_dnn,
-                          dropout_rate=dnn_dropout)(flatten_result, training=train_flag)
+                          dropout_rate=dnn_dropout, seed=seed)(flatten_result, training=train_flag)
             dnn_logit = tf.keras.layers.Dense(1, use_bias=False)(dnn_out)
 
         logits = linear_logits + dnn_logit
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks=training_chief_hooks
+                                )
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)
@@ -20,7 +20,7 @@ def DCNEstimator(linear_feature_columns, dnn_feature_columns, cross_num=2, dnn_h
                  l2_reg_embedding=1e-5,
                  l2_reg_cross=1e-5, l2_reg_dnn=0, seed=1024, dnn_dropout=0, dnn_use_bn=False,
                  dnn_activation='relu', task='binary', model_dir=None, config=None, linear_optimizer='Ftrl',
-                 dnn_optimizer='Adagrad'):
+                 dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the Deep&Cross Network architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -43,6 +43,8 @@ def DCNEstimator(linear_feature_columns, dnn_feature_columns, cross_num=2, dnn_h
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
 
     """
@@ -81,6 +83,7 @@ def _model_fn(features, labels, mode, config):
 
         logits = linear_logits + final_logit
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks=training_chief_hooks)
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)
@@ -21,7 +21,7 @@ def DeepFMEstimator(linear_feature_columns, dnn_feature_columns, dnn_hidden_unit
                     l2_reg_linear=0.00001, l2_reg_embedding=0.00001, l2_reg_dnn=0, seed=1024, dnn_dropout=0,
                     dnn_activation='relu', dnn_use_bn=False, task='binary', model_dir=None, config=None,
                     linear_optimizer='Ftrl',
-                    dnn_optimizer='Adagrad'):
+                    dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the DeepFM Network architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -44,6 +44,8 @@ def DeepFMEstimator(linear_feature_columns, dnn_feature_columns, dnn_hidden_unit
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
 
     """
@@ -68,6 +70,8 @@ def _model_fn(features, labels, mode, config):
 
         logits = linear_logits + fm_logit + dnn_logit
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks
+                                =training_chief_hooks)
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)
@@ -21,7 +21,7 @@ def FiBiNETEstimator(linear_feature_columns, dnn_feature_columns, bilinear_type=
                      dnn_hidden_units=(128, 128), l2_reg_linear=1e-5,
                      l2_reg_embedding=1e-5, l2_reg_dnn=0, seed=1024, dnn_dropout=0, dnn_activation='relu',
                      task='binary', model_dir=None, config=None, linear_optimizer='Ftrl',
-                     dnn_optimizer='Adagrad'):
+                     dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the Feature Importance and Bilinear feature Interaction NETwork architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -44,6 +44,8 @@ def FiBiNETEstimator(linear_feature_columns, dnn_feature_columns, bilinear_type=
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
     """
 
@@ -73,6 +75,7 @@ def _model_fn(features, labels, mode, config):
 
         logits = linear_logits + dnn_logit
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks=training_chief_hooks)
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)
@@ -17,7 +17,7 @@
 def FNNEstimator(linear_feature_columns, dnn_feature_columns, dnn_hidden_units=(128, 128),
                  l2_reg_embedding=1e-5, l2_reg_linear=1e-5, l2_reg_dnn=0, seed=1024, dnn_dropout=0,
                  dnn_activation='relu', task='binary', model_dir=None, config=None, linear_optimizer='Ftrl',
-                 dnn_optimizer='Adagrad'):
+                 dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the Factorization-supported Neural Network architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -38,6 +38,8 @@ def FNNEstimator(linear_feature_columns, dnn_feature_columns, dnn_hidden_units=(
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
 
     """
@@ -58,6 +60,7 @@ def _model_fn(features, labels, mode, config):
 
         logits = linear_logits + dnn_logit
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks=training_chief_hooks)
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)
@@ -23,7 +23,7 @@ def FwFMEstimator(linear_feature_columns, dnn_feature_columns, dnn_hidden_units=
                   l2_reg_linear=0.00001, l2_reg_embedding=0.00001, l2_reg_field_strength=0.00001, l2_reg_dnn=0,
                   seed=1024, dnn_dropout=0, dnn_activation='relu', dnn_use_bn=False, task='binary', model_dir=None,
                   config=None, linear_optimizer='Ftrl',
-                  dnn_optimizer='Adagrad'):
+                  dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the DeepFwFM Network architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -48,6 +48,8 @@ def FwFMEstimator(linear_feature_columns, dnn_feature_columns, dnn_hidden_units=
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
 
     """
@@ -77,6 +79,7 @@ def _model_fn(features, labels, mode, config):
 
         logits = add_func(final_logit_components)
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks=training_chief_hooks)
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)
@@ -19,7 +19,7 @@ def NFMEstimator(linear_feature_columns, dnn_feature_columns, dnn_hidden_units=(
                  l2_reg_embedding=1e-5, l2_reg_linear=1e-5, l2_reg_dnn=0, seed=1024, bi_dropout=0,
                  dnn_dropout=0, dnn_activation='relu', task='binary', model_dir=None, config=None,
                  linear_optimizer='Ftrl',
-                 dnn_optimizer='Adagrad'):
+                 dnn_optimizer='Adagrad', training_chief_hooks=None):
     """Instantiates the Neural Factorization Machine architecture.
 
     :param linear_feature_columns: An iterable containing all the features used by linear part of the model.
@@ -41,6 +41,8 @@ def NFMEstimator(linear_feature_columns, dnn_feature_columns, dnn_hidden_units=(
         the linear part of the model. Defaults to FTRL optimizer.
     :param dnn_optimizer: An instance of `tf.Optimizer` used to apply gradients to
         the deep part of the model. Defaults to Adagrad optimizer.
+    :param training_chief_hooks: Iterable of `tf.train.SessionRunHook` objects to
+        run on the chief worker during training.
     :return: A Tensorflow Estimator  instance.
 
     """
@@ -66,6 +68,7 @@ def _model_fn(features, labels, mode, config):
 
         logits = linear_logits + dnn_logit
 
-        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer)
+        return deepctr_model_fn(features, mode, logits, labels, task, linear_optimizer, dnn_optimizer,
+                                training_chief_hooks=training_chief_hooks)
 
     return tf.estimator.Estimator(_model_fn, model_dir=model_dir, config=config)