tf.data.Dataset: Argument `batch_size` nie może być określony dla danego typu danych wejściowych

10

Korzystam z Talos i Google colab TPU, aby uruchomić dostrajanie hiperparametrów modelu Keras . Zauważ, że używam Tensorflow 1.15.0 i Keras 2.2.4-tf.

import os
import tensorflow as tf
import talos as ta
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import train_test_split

def iris_model(x_train, y_train, x_val, y_val, params):

    # Specify a distributed strategy to use TPU
    resolver = tf.contrib.cluster_resolver.TPUClusterResolver(tpu='grpc://' + os.environ['COLAB_TPU_ADDR'])
    tf.contrib.distribute.initialize_tpu_system(resolver)
    strategy = tf.contrib.distribute.TPUStrategy(resolver)

    # Use the strategy to create and compile a Keras model
    with strategy.scope():
      model = Sequential()
      model.add(Dense(32, input_shape=(4,), activation=tf.nn.relu, name="relu"))
      model.add(Dense(3, activation=tf.nn.softmax, name="softmax"))
      model.compile(optimizer=Adam(learning_rate=0.1), loss=params['losses'])

    # Convert data type to use TPU
    x_train = x_train.astype('float32')
    x_val = x_val.astype('float32')

    dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train))
    dataset = dataset.cache()
    dataset = dataset.shuffle(1000, reshuffle_each_iteration=True).repeat()
    dataset = dataset.batch(params['batch_size'], drop_remainder=True)

    # Fit the Keras model on the dataset
    out = model.fit(dataset, batch_size=params['batch_size'], epochs=params['epochs'], validation_data=[x_val, y_val], verbose=0, steps_per_epoch=2)

    return out, model

# Load dataset
X, y = ta.templates.datasets.iris()

# Train and test set
x_train, x_val, y_train, y_val = train_test_split(X, y, test_size=0.30, shuffle=False)

# Create a hyperparameter distributions 
p = {'losses': ['logcosh'], 'batch_size': [128, 256, 384, 512, 1024], 'epochs': [10, 20]}

# Use Talos to scan the best hyperparameters of the Keras model
scan_object = ta.Scan(x_train, y_train, params=p, model=iris_model, experiment_name='test', x_val=x_val, y_val=y_val, fraction_limit=0.1)

Po przekonwertowaniu zestawu pociągów na zestaw danych przy użyciu pojawia tf.data.Datasetsię następujący błąd podczas dopasowywania modelu out = model.fit:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-3-c812209b95d0> in <module>()
      8 
      9 # Use Talos to scan the best hyperparameters of the Keras model
---> 10 scan_object = ta.Scan(x_train, y_train, params=p, model=iris_model, experiment_name='test', x_val=x_val, y_val=y_val, fraction_limit=0.1)

8 frames
/usr/local/lib/python3.6/dist-packages/tensorflow_core/python/keras/engine/training.py in _validate_or_infer_batch_size(self, batch_size, steps, x)
   1813             'The `batch_size` argument must not be specified for the given '
   1814             'input type. Received input: {}, batch_size: {}'.format(
-> 1815                 x, batch_size))
   1816       return
   1817 

ValueError: The `batch_size` argument must not be specified for the given input type. Received input: <DatasetV1Adapter shapes: ((512, 4), (512, 3)), types: (tf.float32, tf.float32)>, batch_size: 512

Następnie, jeśli wykonam te instrukcje i nie ustawię argumentu wielkości partii na model.fit. Otrzymuję kolejny błąd w:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-3-c812209b95d0> in <module>()
      8 
      9 # Use Talos to scan the best hyperparameters of the Keras model
---> 10 scan_object = ta.Scan(x_train, y_train, params=p, model=iris_model, experiment_name='test', x_val=x_val, y_val=y_val, fraction_limit=0.1)

8 frames
/usr/local/lib/python3.6/dist-packages/tensorflow_core/python/keras/engine/training.py in _distribution_standardize_user_data(self, x, y, sample_weight, class_weight, batch_size, validation_split, shuffle, epochs, allow_partial_batch)
   2307             strategy) and not drop_remainder:
   2308           dataset_size = first_x_value.shape[0]
-> 2309           if dataset_size % batch_size == 0:
   2310             drop_remainder = True
   2311 

TypeError: unsupported operand type(s) for %: 'int' and 'NoneType'

— Sami Belkacem
źródło

Byłoby pomocne dla tego ostatniego błędu, gdybyś mógł opublikować ślad całego stosu, ponieważ ta funkcja wydaje się być wywoływana w wielu miejscach w tym pliku, więc nie mogę powiedzieć, gdzie jesteś: github.com/tensorflow/tensorflow /blob/r1.15/tensorflow/python/…

— mdaoust

Właśnie edytowałem pytanie, możesz sprawdzić ślad stosu, dziękuję za poświęcony czas i uwagę.

— Sami Belkacem

0

z kodu github :

ValueError zostanie podniesiony, jeśli xjest generatorem lub Sequenceinstancją i batch_sizejest określony, ponieważ oczekujemy, że użytkownicy dostarczą partie zestawów danych.

Spróbuj użyć batch_size = None

— Ioannis Nasios
źródło

Otrzymuję kolejny błąd w _distribution_standardize_user_data (self, x, y, sample_weight, class_weight, batch_size, validation_split, shuffle, epochs, allow_partial_batch) TypeError: nieobsługiwane typy operandów dla *: „NoneType” i „int

— Sami Belkacem

powinieneś także ustawić steps_per_epoch = None

— Ioannis Nasios

To nie działa, pojawia się kolejny błąd: Błąd: Próba konwersji wartości (Brak) z nieobsługiwanym typem (<klasa „NoneType”>) na Tensor. Myślę, że można łatwo odtworzyć błąd, kopiując krótki program

— Sami Belkacem,

0

Nie jestem pewien, czy poniższe będą pasować do rachunku, ale warto spróbować. Wszystko, co zrobiłem, jest zdjęte z repeat () z zestawu danych i batch_size = params ['batch_size'] z modelu.fit

Jeśli powyższe nie jest tym, co jesteś gotowy poświęcić, zignoruj post.

import os
import tensorflow as tf
import talos as ta
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

def iris_model(x_train, y_train, x_val, y_val, params):

    # Specify a distributed strategy to use TPU
    resolver = tf.distribute.cluster_resolver.TPUClusterResolver(tpu='grpc://' + os.environ['COLAB_TPU_ADDR'])
    tf.config.experimental_connect_to_host(resolver.master())
    tf.tpu.experimental.initialize_tpu_system(resolver)
    strategy = tf.distribute.experimental.TPUStrategy(resolver)

    with strategy.scope():
        model = Sequential()
        model.add(Dense(32, input_dim=4, activation=params['activation']))
        model.add(Dense(3, activation='softmax'))
        model.compile(optimizer=params['optimizer'], loss=params['losses'])

    # Convert the train set to a Dataset to use TPU
    dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train))
    dataset = dataset.cache().shuffle(1000, reshuffle_each_iteration=True).batch(params['batch_size'], drop_remainder=True)

    out = model.fit(dataset, epochs=params['epochs'], validation_data=[x_val, y_val], verbose=0)

    return out, model

x, y = ta.templates.datasets.iris()

p = {'activation': ['relu', 'elu'],
       'optimizer': ['Nadam', 'Adam'],
       'losses': ['logcosh'],
       'batch_size': (20, 50, 5),
       'epochs': [10, 20]}

scan_object = ta.Scan(x, y, model=iris_model, params=p, fraction_limit=0.1, experiment_name='first_test')

— Amit
źródło

Nie działa: TypeError: nieobsługiwane typy operandów dla *: „NoneType” i „int”

— Sami Belkacem,

0

Ten drugi błąd _distribution_standardize_user_datapojawia się, gdy nie spełniasz batch_sizewymagań.

Kod, który uruchamiasz dla tej funkcji, znajduje się tutaj:

https://github.com/tensorflow/tensorflow/blob/r1.15/tensorflow/python/keras/engine/training.py#L2192

Nie opublikowałeś śledzenia wstecznego, ale założę się, że nie działa on na linii 2294 , ponieważ jest to jedyne miejsce, w którym batch_sizecoś się pomnaża.

if shuffle:
          # We want a buffer size that is larger than the batch size provided by
          # the user and provides sufficient randomness. Note that larger
          # numbers introduce more memory usage based on the size of each
          # sample.
          ds = ds.shuffle(max(1024, batch_size * 8))

Wygląda na to, że możesz go wyłączyć, ustawiając shuffle=False.

fit(ds, shuffle=False,...)

Czy to działa?

— mdaoust
źródło

Dzięki, ale wciąż pojawia się ten sam błąd z shuffle = False. Nie działa na linii 2309, a nie 2294.

— Sami Belkacem

@SamiBelkacem, że '

— mdaoust

0

Czy możesz usunąć te wiersze ze swojego kodu i spróbować:

    dataset = dataset.cache()
    dataset = dataset.shuffle(1000, reshuffle_each_iteration=True).repeat()
    dataset = dataset.batch(params['batch_size'], drop_remainder=True)
WITH THESE:
    dataset = dataset.repeat()
    dataset = dataset.batch(128, drop_remainder=True)
    dataset = dataset.prefetch(1)

W przeciwnym razie to, co napisałeś, tf.data.Dataset.from_tensor_slicesma coś wspólnego z błędem.

— Rishabh Sahrawat
źródło

Wciąż nie działa. Jak powiedziałeś, tf.data.Dataset ma coś wspólnego z błędem. Ale dokumentacja mówi, że konieczne jest uwzględnienie go podczas korzystania z chmury TPU tensorflow.org/guide/tpu#input_datasets

— Sami Belkacem