【问题标题】:Eclipse CDT parsing C/C++ header file returns empty ASTEclipse CDT 解析 C/C++ 头文件返回空 AST
【发布时间】:2019-07-29 08:35:38
【问题描述】:

我在一个独立的 Java 应用程序中使用 Eclipse CDT 作为 C/C++ 头文件的解析器,其想法是从头文件中代码生成 JNI/JNA 绑定。

下载了 JAR 文件(很难找到,这个库没有 maven!)并解析了一个简单的头文件,它工作得很好。

但是,当我尝试真正的头文件时,结果有些随机:返回的 AST 没有孩子,只有一些预处理器声明存在,最奇怪的是只检测到两个 cmets。

这里是删减代码:

    final FileContent content = FileContent.createForExternalFileLocation("C:/VulkanSDK/1.1.101.0/Include/vulkan/vulkan.h");
    final Map<String, String> definedMacros = new HashMap<>();
    definedMacros.put("__cplusplus", "1");
    final String[] includePaths = new String[0];
    final IScannerInfo info = new ScannerInfo(definedMacros, includePaths);
    final IncludeFileContentProvider emptyIncludes = IncludeFileContentProvider.getEmptyFilesProvider();
    final IIndex index = EmptyCIndex.INSTANCE;
    final int options = 0;
    final IParserLogService log = new DefaultLogService();
    final IASTTranslationUnit unit = GPPLanguage.getDefault().getASTTranslationUnit(content, info, emptyIncludes, index, options, log);
    System.out.println("len="+unit.getChildren().length);

我要解析的头文件是针对 Vulkan 图形库的,它非常大,所以这里是 link,这是文件的前几位:

#ifndef VULKAN_H_
#define VULKAN_H_ 1

#ifdef __cplusplus
extern "C" {
#endif

/*
** Copyright (c) 2015-2017 The Khronos Group Inc.
**
** Licensed under the Apache License, Version 2.0 (the "License");
** you may not use this file except in compliance with the License.
** You may obtain a copy of the License at
**
**     http://www.apache.org/licenses/LICENSE-2.0
**
** Unless required by applicable law or agreed to in writing, software
** distributed under the License is distributed on an "AS IS" BASIS,
** WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
** See the License for the specific language governing permissions and
** limitations under the License.
*/

/*
** This header is generated from the Khronos Vulkan XML API Registry.
**
*/


#define VK_VERSION_1_0 1
#include "vk_platform.h"

getComments() 返回的两个 cmets 是文件顶部的第一个大注释块,奇怪的是:

// VULKAN_H_

即似乎已经决定预处理器语句是注释!?

虽然解析器接受了一个日志回调,但它并没有告诉我任何信息,也没有报告任何问题。我怀疑我对 CDT 和预处理器语句有一些不理解的地方,但我找不到任何类似的问题被发布(CDT 是一个非常小众的工具)。

我已经修改了代码中我能想到的所有内容,包括各种选项参数,但我每次都得到相同的结果。正如我所说,解析其他更简单的头文件就可以了。

有什么想法吗?建议?

【问题讨论】:

  • 我的建议是:A) 如果 eclipse-cdt 的人有论坛或邮件列表并在那里提问,那么只有当利基人监视相应的标签时,SO 才对利基有好处 B) 小心用于其他工具
  • @GhostCat 面向 C/C++ 开发人员的 Eclipse IDE 每天从 eclipse.org 下载大约 1,500 次,这还不包括许多基于 Eclipse CDT 的应用程序和其他分发渠道。我不会称其为利基市场。使用 CDT 解析器有什么问题?
  • @howlger 是我(OP)使用了术语niche - 实际上Eclipse/CDT 绝对不是小众,但是在Java 应用程序中使用CDT 工具中的底层C/C++ 解析器是小众.
  • @stridecolossus 我也对此表示怀疑(例如,参见this GitHub projectthis question)。您是否使用 AST 访问者来查找 cmets?你得到的完整 AST 是多少?
  • 症状听起来可能是解析器认为包含保护宏VULKAN_H_已经定义,因此除了包含保护本身之外的所有文件内容都被跳过。

标签: java eclipse eclipse-cdt


【解决方案1】:

所以我是个白痴!

认为我解析的不是实际的头文件,而是我设法加载了“超级”头文件,然后#includes 我真正想要的文件。这个超级标头包括在平台上切换的各种其他标头等等,这是一种标准方法。我发布的代码没有递归到#included 文件,因此结果正确为空!一旦我将代码指向正确的标头,那么 AST 就会按预期构建。

然而,这并不能解释看似随机的 cmets 和奇怪注释掉的标头保护 - 我已经向 Eclipse CDT 开发人员提出了一个问题(尽管我很愚蠢)结果完全让我失望。

对于任何有兴趣从标头生成 JNA 结构和枚举的代码的人来说效果很好(尽管 CDT 本身并不是一个“真正的”库)。

这是一个从 C typedef enum 生成的示例枚举类:

package org.sarge.jove.platform.vulkan;

/**
 * HEADER COMMENT
 */
public enum VkBorderColor {
    VK_BORDER_COLOR_FLOAT_TRANSPARENT_BLACK(0),     
    VK_BORDER_COLOR_INT_TRANSPARENT_BLACK(1),   
    VK_BORDER_COLOR_FLOAT_OPAQUE_BLACK(2),  
    VK_BORDER_COLOR_INT_OPAQUE_BLACK(3),    
    VK_BORDER_COLOR_FLOAT_OPAQUE_WHITE(4),  
    VK_BORDER_COLOR_INT_OPAQUE_WHITE(5),    
    VK_BORDER_COLOR_BEGIN_RANGE(0),     
    VK_BORDER_COLOR_END_RANGE(5),   
    VK_BORDER_COLOR_RANGE_SIZE(6),  
    VK_BORDER_COLOR_MAX_ENUM(2147483647);   

    private final int value;

    private VkBorderColor(int value) {
        this.value = value;
    }

    /**
     * @return Enum literal
     */
    public int value() {
        return value;
    }
}

使用实际的 C/C++ 解析器意味着我可以访问实际的枚举值,甚至是表达式。

这是一个从 C struct 生成的 JNA 结构:

package org.sarge.jove.platform.vulkan;

import com.sun.jna.Structure;
import com.sun.jna.Structure.FieldOrder;
import com.sun.jna.Pointer;
import org.sarge.jove.platform.vulkan.VkStructureType;

/**
 * HEADER COMMENT
 */
@FieldOrder({
    "sType",
    "pNext",
    "physicalDeviceCount",
    "physicalDevices",
    "subsetAllocation"
})
public class VkPhysicalDeviceGroupProperties extends Structure {
    public static class ByValue extends VkPhysicalDeviceGroupProperties implements Structure.ByValue { }
    public static class ByReference extends VkPhysicalDeviceGroupProperties implements Structure.ByReference { }

    public final int sType = VkStructureType.VK_STRUCTURE_TYPE_PHYSICAL_DEVICE_GROUP_PROPERTIES.value();
    public Pointer pNext;
    public int physicalDeviceCount;
    public Pointer[] physicalDevices = new Pointer[32];
    public int subsetAllocation;
}

许多 Vulkan 结构都有一个 sType 字段来标识结构的类型 (!),因此我可以自动将该字段初始化为相应的生成枚举 - 很好。

再次使用 CDT 还意味着我可以处理 C 数组类型的映射和初始化数组字段(JNA 内存管理的要求)。

所以最终 CDT 运行良好。

故事的寓意:记住你是个白痴。

【讨论】:

  • 很高兴你解决了它! “奇怪地注释掉的标题保护”看起来像经常写在文件末尾的#endif 之后的注释,以记录它关闭的#ifndef。如果您仍然发现解析包装标头的结果出乎意料,我建议发布其确切内容。
猜你喜欢
  • 2012-06-12
  • 2012-08-05
  • 1970-01-01
  • 1970-01-01
  • 2011-07-29
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-11-30
相关资源
最近更新 更多