【发布时间】:2020-11-25 08:57:51
【问题描述】:
我正在使用tf.keras 来构建我的模型。通常我使用tf.keras.layers.Embedding 层来处理分类数据。例如,如果输入列之一采用以下格式
应用
脸书
whatsapp
Instagram
使用上面的数据,我对数据进行标记编码,并通过如下的嵌入层传递。
inp = tf.keras.Input(shape=(1,), name="app_input")
emb_layer = tf.keras.layers.Embedding(vocab_size, embedding_size, input_length=1, name="emb_" + feature)(inp)
但是如果我的列在每一行中有多个值怎么办?例如,数据采用以下格式:
应用程序
[脸书,whatsapp]
[whatsapp, instagram, fb]
我不能使用 one-hot 编码,因为独特的应用程序数量巨大。我想为这些应用生成嵌入,但不确定如何处理上述数据。
【问题讨论】:
标签: tensorflow machine-learning keras deep-learning tf.keras