【问题标题】:How do I store and find the data?如何存储和查找数据?
【发布时间】:2019-12-27 11:24:03
【问题描述】:

我有一个 2048 维的 numpy 数组。我想存储在postgresql中并找到。

我尝试了多维数据集数据类型(我将大小增加到 2048 维),但我收到“行太大”错误,因为大小很大

我尝试将其保留为文本,但无法获得余弦相似度。

如何存储和查找这些数据?它可以在不同的数据库或方法中。我愿意接受各种建议

【问题讨论】:

    标签: postgresql numpy


    【解决方案1】:

    您可以将它保存在这样的表格中:

    VectorId   Index    value
    1          0        0.5
    1          1        2.5
    ...        ...      ...
    1          2048     3.0
    2          0        1.5
    2          1        4.5
    ...        ...      ...
    2          2048     0.0
    3          0        1.3
    ...        ...      ...
    

    不过,这是很多“不必要的”元数据。 但如果你没有太多的向量,那应该不是问题。

    这是一个帖子,其中数据以相同的方式保存,问题是关于仅使用 sql 计算余弦相似度。

    SQL Computation of Cosine Similarity

    顺便说一句:你有一个长度为 2048 的一维数组/向量,这在问题中有点不清楚。

    【讨论】:

    • 我想我不太清楚自己想要什么。我有一个 2 numpy 数组(2048 维)。 [2.5203​​197.3983448,0.0014629656,0.0.0.0,0.0,5.29537777777]。我想存储数据库并通过查询在数据库上查找余弦相似度
    • 你能发布你的 numpy 数组的形状吗?它的形状是 (2048) 还是 (a1, a2, ..., a2048)?
    • like (a1, a2, a3 .... a2048) 它们都是浮点值。我想存储它们并找到它们(具有余弦相似度)
    猜你喜欢
    • 2022-08-05
    • 1970-01-01
    • 2013-04-30
    • 1970-01-01
    • 2010-12-20
    • 1970-01-01
    • 1970-01-01
    • 2015-08-20
    • 1970-01-01
    相关资源
    最近更新 更多