【问题标题】:Question About VC Dimension关于VC维度的问题
【发布时间】:2010-12-05 20:10:07
【问题描述】:

如果我有 (1,2,....999) 的输入空间。我有一个概念类 C,有 10 个概念:C0、C1、C2...C9。

给定一个输入,如果该输入包含数字 i,则该输入是 ci 的一个元素。例如,数字 123 是 c1 和 c2 和 c3 的一个元素。

这个概念类C的VC Dimension是什么?

【问题讨论】:

  • 对我来说听起来像是家庭作业......

标签: computer-science machine-learning


【解决方案1】:

这个答案真的正确吗?

粉碎意味着对于您选择的一组数据点,例如。 (14,24,3),对于它的每一个可能的标签,在集合中都存在一个与该标签一致的概念。

但是考虑给定的示例 (14,24,3),这里列出了这三个点的所有可能的真/假标签,以及哪些类与它们一致:

0 0 0 C_5、C_6、C_7、C_8、C_9、C_0都与此一致

0 0 1 仅限 C_3(因为第三个数字是三,并且只有类 C_3 包含它)

0 1 0 C_2 和 C_4(因为“24”包含 2 和 4)

0 1 1 C_2、C_4 和 C_3

1 0 0 C_1 和 C_4

1 0 1 没有一致的类(因为“14”和“3”不共享任何数字)

1 1 0 C_4(因为“14”和“24”都包含一个4)

1 1 1 没有一致的类

所以类集不会破坏这个数据集。 (还是我误解了定义中的某些内容?)

【讨论】:

    【解决方案2】:

    我不想在这里发布整个解决方案,但这里有一些东西......

    查找 VC 维度涉及在输入空间中查找点集,这些点可以是 C 的shattered

    我可以很容易地找到一组可以被 C 破碎的三个点,(14, 24, 3)。

    很难找到一组可以被 C 粉碎的四个点,但是 (157, 256, 367, 4) 有效。

    很难找到可以被 C 粉碎的五个点,这强烈表明 C 的 VC 维数(给定输入空间)是 4。然而,棘手的部分是证明不可能找到 任意五个可以粉碎的点。


    实际上,这个问题可能有些模棱两可。这取决于概念类在什么意义上可以“正确分类”一组点。即 C1 是否正确分类 (1, 2),其中 1 被赋予负类标签,2 被赋予正类标签(因为它正确划分它),还是只能 C2 这样做?我认为它可以,因为这样问题会更有趣。

    【讨论】:

    • 你能解释为什么(157, 256, 367, 4) 有效吗?我看到了四个不同的概念——这会让使用直线对它们进行分类变得困难吗? (除非它们被排在数字线上……是吗?)你能澄清一下
    猜你喜欢
    • 2022-01-17
    • 1970-01-01
    • 2018-09-11
    • 2019-10-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多