【问题标题】:Partial Date Match with Hibernate Search部分日期匹配与 Hibernate 搜索
【发布时间】:2026-02-27 01:50:02
【问题描述】:

我们有以下要求

作为搜索的一部分,用户可以搜索某人的出生日期。一般来说,用户从前端的日期选择器中选择它可以正常工作,并且搜索按预期工作。

但是我们现在有一个要求,用户可能不知道确切的出生日期,例如他们可能只知道出生年份。

我尝试过的

@Basic
@Field
@Field(name = "dob_string", bridge = @FieldBridge(impl = CustomDateStringBridge.class) 
,analyzer = @Analyzer(definition = "dob_string_analyzer"))
@Column(name = "date_of_birth")
private Date dateOfBirth;

CustomDateStringBridge 类只是将日期作为字符串返回,例如 19780418,它按预期工作。

问题是当我们尝试查询 dob_string 字段时

我们将以下内容作为整体查询的一部分

             partialDOB = DIGIT_ONLY_PATTERN.matcher(partialDOB).replaceAll("");
             bool.must(queryBuilder.keyword()
            .wildcard()
            .onField("datesOfBirth.dob_string")
            .ignoreFieldBridge()
            .ignoreAnalyzer()
            .matching("*"+partialDOB+"*")
            .createQuery());

但是这会导致以下错误

"type": "parse_exception",
    "reason": "failed to parse date field [*1979*] with format [ 
strict_date_optional_time||epoch_millis]"

我尝试不使用 ignoreAnalyzer 和 ignoreFieldBridge,但最终出现不同的错误

只是想知道是否可以在日期上进行这种类型的通配符搜索?如果有人知道如何做到这一点。

谢谢

【问题讨论】:

  • 我遇到了类似的问题(我的用户输入是年或月+年),但我的方法是解析应用程序中的输入,然后只使用 sql 函数 month()year()

标签: hibernate elasticsearch hibernate-search


【解决方案1】:

首先,我推荐一种不同的方法,因为通配符查询,尤其是带有前导通配符的查询,可能会执行得非常糟糕。

相反,保留一个日期字段,并利用数字查询。

  • 移除你的桥,让日期保持为日期
  • 依靠range queries 查找特定年份、月份或日期内的日期。

例如,要搜索给定的年份:

// Input
int yearAsInteger = ...;

// Replace this with the user timezone if your Date instances
// are created for a user timezone different from the system default
ZoneId timezone = ZoneId.systemDefault();
Year year = Year.of( yearAsInteger );
Date startOfYear = Date.from( year.atDay( 1 ).atStartOfDay( timezone ).toInstant() );
Date startOfNextYear = Date.from( year.plusYear( 1L ).atDay( 1 ).atStartOfDay( timezone ).toInstant() );

bool.must(queryBuilder.range()
            .onField("datesOfBirth.dateOfBirth")
            .from(startOfYear)
            .to(startOfNextYear).excludeLimit()
            .createQuery());

现在,如果您真的想使用字符串字段...问题出在您的 Elasticsearch 映射中。字段 dob_string 在 Elasticsearch 的映射中注册为“日期”字段,而您希望它是一个字符串。

您应该能够通过在您的网桥中实现 MetadataProvidingFieldBridge 并以这种方式提供字段类型来告诉 Hibernate Search 它是一个字符串字段:

  @Override
  public void configureFieldMetadata(String name, FieldMetadataBuilder builder) {
      builder.field( name, FieldType.STRING );
  }

不要忘记在此更改后删除并重新创建 Elasticsearch 索引。

或者,您也可以转到Hibernate Search 6。它处于测试阶段,但它很稳定,即将发布,并且 Elasticsearch 支持更好(不再是实验性的)。但是,API 不同,因此如果您已经拥有扩展的代码库,则需要进行大量迁移工作。我正在写迁移指南。

【讨论】: