【问题标题】:Extract file name from Java URL (file: and http/https protocol)?从 Java URL(文件:和 http/https 协议)中提取文件名?
【发布时间】:2021-11-17 19:27:14
【问题描述】:

我有各种这样的网址:

String a = "file:./bla/file.txt"; // Valid, see See [RFC 3986][1], path - rootless definition
String b = "file:.file.txt";      // Valid, see See [RFC 3986][1], path - rootless definition
String c = "file:./file.txt";     // Valid, see See [RFC 3986][1], path - rootless definition
String d = "file:///file.txt";
String e = "file:///folder/file.txt";
String f = "http://example.com/file.txt";
String g = "https://example.com/file.txt";

这些都是有效的 URL,我可以将它们转换为 java 中的 URL 而不会出错:

URL url = new URL(...);

我想从上面的每个示例中提取文件名,所以我只剩下:

file.txt

我尝试了以下方法,但这不起作用,例如上面的b(这是一个有效的 URL):

b.substring(path.lastIndexOf('/') + 1); // Returns file:.file.txt

我可以编写一些自定义代码来检查斜杠,只是想知道是否有更好更健壮的方法来做到这一点?

【问题讨论】:

  • 你可以使用 Path.of(urlstring).getFileName();
  • @MirekPluta 谢谢,但这不起作用例如 b
  • 即使 URI 类也无法解析它。它不能是正确的 URI,否则你会发现 JDK 中的错误
  • 示例 b 不代表当前目录中的隐藏文件吗?即./.file.txt我不希望文件名是file.txt

标签: java parsing url uri


【解决方案1】:

URI 类可以正确解析 URI 的各个部分。对于大多数 URL,您需要 URI 的 path。对于没有斜杠的 URI,不会对部分进行任何解析,因此您必须依赖整个 scheme-specific part

URI uri = new URI(b);
String path = uri.getPath();
if (path == null) {
    path = uri.getSchemeSpecificPart();
}
String filename = path.substring(path.lastIndexOf('/') + 1);

以上内容应该适用于您的所有网址。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-03-19
    • 1970-01-01
    • 2011-05-29
    • 2020-05-08
    • 1970-01-01
    • 2016-01-15
    • 2015-08-05
    • 1970-01-01
    相关资源
    最近更新 更多