【问题标题】:What do these Linux Kernel Oops fields mean?这些 Linux Kernel Oops 字段是什么意思?
【发布时间】:2013-04-24 13:55:19
【问题描述】:

我在开发人员的生活中已经遇到过一些 Oops,虽然我熟悉可以从这些 Oops 中检索到的一些信息,但仍有一些信息我无法理解,因此无法用于解决问题.

您将在下面找到一个糟糕的示例,我将描述我可以从中推断出的内容。然后,我会问剩下的信息可以教我什么。

[  716.485951] BUG: unable to handle kernel paging request at fc132158
[  716.485973] IP: [<fc1936e7>] ubi_change_vtbl_record+0x87/0x1c0 [ubi]
[  716.485986] *pdpt = 00000000019e6001 *pde = 000000002c558067 *pte = 0000000000000000 
[  716.485997] Oops: 0002 [#1] SMP 
[  716.486004] Modules linked in: ubi(O) mtdchar nandsim nand mtd nand_ids nand_bch bch nand_ecc bnep rfcomm bluetooth parport_pc ppdev lp parport nfsd nfs_acl auth_rpcgss nfs fscache lockd sunrpc binfmt_misc dm_crypt snd_hda_codec_hdmi snd_hda_codec_analog kvm_intel snd_hda_intel snd_hda_codec snd_hwdep kvm snd_pcm snd_seq_midi snd_rawmidi snd_seq_midi_event hid_generic snd_seq cdc_acm snd_timer snd_seq_device mei tpm_tis snd mac_hid serio_raw soundcore lpc_ich snd_page_alloc microcode coretemp usbhid hid nouveau usb_storage ttm drm_kms_helper drm floppy e1000e i2c_algo_bit mxm_wmi video wmi
[  716.486128] Pid: 3994, comm: ubimkvol Tainted: G           O 3.8.0-rc3+ #3 LENOVO 6239AS8/LENOVO
[  716.486136] EIP: 0060:[<fc1936e7>] EFLAGS: 00010246 CPU: 0
[  716.486144] EIP is at ubi_change_vtbl_record+0x87/0x1c0 [ubi]
[  716.486151] EAX: 000000ac EBX: eb5ea000 ECX: 0000002b EDX: 00000000
[  716.486157] ESI: eb4d1d74 EDI: fc132158 EBP: eb4d1d40 ESP: eb4d1d20
[  716.486164]  DS: 007b ES: 007b FS: 00d8 GS: 00e0 SS: 0068
[  716.486170] CR0: 8005003b CR2: fc132158 CR3: 27542000 CR4: 000407f0
[  716.486176] DR0: 00000000 DR1: 00000000 DR2: 00000000 DR3: 00000000
[  716.486183] DR6: ffff0ff0 DR7: 00000400
[  716.486188] Process ubimkvol (pid: 3994, ti=eb4d0000 task=ec01d9b0 task.ti=eb4d0000)
[  716.486195] Stack:
[  716.486199]  e755f000 eb4d1d2c c11cad11 eb4d1d34 eb543c00 eb5ea000 00000000 eb4d1e20
[  716.486215]  eb4d1e30 fc195412 e755f000 fc1adf01 eb5ea26c 00000002 0000009e eb5ea480
[  716.486232]  00000002 e755f22c e755f2ac e755f000 eb4d1d74 2a000000 01000000 00000000
[  716.486248] Call Trace:
[  716.486257]  [<c11cad11>] ? sysfs_create_file+0x21/0x30
[  716.486266]  [<fc195412>] ubi_create_volume+0x4b2/0x790 [ubi]
[  716.486277]  [<fc19967a>] ubi_cdev_ioctl+0x5da/0xac0 [ubi]
[  716.486285]  [<c117202a>] ? link_path_walk+0x5a/0x7d0
[  716.486294]  [<fc1990a0>] ? vol_cdev_ioctl+0x440/0x440 [ubi]
[  716.486842]  [<c1177e12>] do_vfs_ioctl+0x82/0x5b0
[  716.487703]  [<c1171ced>] ? final_putname+0x1d/0x40
[  716.488564]  [<c1171ced>] ? final_putname+0x1d/0x40
[  716.489422]  [<c1171ced>] ? final_putname+0x1d/0x40
[  716.489891]  [<c1171eb4>] ? putname+0x24/0x40
[  716.489891]  [<c1167239>] ? do_sys_open+0x169/0x1d0
[  716.489891]  [<c11783b0>] sys_ioctl+0x70/0x80
[  716.489891]  [<c16205cd>] sysenter_do_call+0x12/0x38
[  716.489891] Code: ac 00 00 00 03 bb c8 04 00 00 f7 c7 01 00 00 00 0f 85 ee 00 00 00 f7 c7 02 00 00 00 0f 85 ca 00 00 00 89 c1 31 d2 c1 e9 02 a8 02 <f3> a5 74 0b 0f b7 16 66 89 17 ba 02 00 00 00 a8 01 74 07 0f b6
[  716.489891] EIP: [<fc1936e7>] ubi_change_vtbl_record+0x87/0x1c0 [ubi] SS:ESP 0068:eb4d1d20
[  716.489891] CR2: 00000000fc132158
[  716.516453] ---[ end trace 473b15a7780e19ea ]---

似乎内核想要访问错误的页面。现在,

  • 糟糕的代码 0002 告诉我它是在尝试以用户模式读取内容时发生的。
  • 指令指针位于ubi_change_vtbl_record,这意味着违规指令位于此函数中。
  • 我可以从 调用跟踪(从进程 ubimkvol 启动的 ioctl)

从那里,“堆栈”是任务原始堆栈的转储吗?我可以看到提到的一些值也是调用跟踪中的函数地址。然后,我得到了像 EAXEBX ... DR7 这样的漂亮值。我认为它们是 CPU 寄存器,但我仍然不知道它们到底是什么。

最后,下面这行让我迷失了:

[  716.485986] *pdpt = 00000000019e6001 *pde = 000000002c558067 *pte = 0000000000000000

什么是 pdpt、pde 和 pte ?我觉得它们是有关页面错误的信息,但经过一番谷歌搜索后,我无法检索到更多信息。

【问题讨论】:

    标签: linux-kernel panic


    【解决方案1】:

    是的,EAX 等是 32 位 x86 处理器寄存器。 pdpt(页目录指针表)、pde(页目录项)、pte(页表项)都是分页结构。

    IP(也适用于 32 位处理器的 EIP 或 64 位处理器的 RIP)是 Oops 时的指令指针。

    堆栈是此处理器的原始堆栈。每个处理器都有自己的堆栈。请注意,在此架构中,堆栈会向下增长(地址以 0xfxxxxxx 开头)。

    【讨论】:

    • 如果您能提供更多有关寄存器和分页信息的详细信息,您将不胜感激。我能够检索到一些信息,但如果这些知识可以直接在这里获得,它也会对其他人有所帮助:)
    • 在这种情况下,PDPT 是 PGD 值,PDE 是 Linux 术语中的 PMD?
    • @Rerito PDPT 更多的是 x86 术语。其他操作系统也使用这些。其他操作系统有自己的报告崩溃数据的方式(例如,“蓝屏死机”)。关于寻呼信息,我没有比网上更好的解释了。我发现英特尔的分页和内存管理令人困惑:-/。在 x86 寄存器上,每个寄存器都有自己的用途。有些用于累加,有些用于指向堆栈,有些用于函数返回值,有些可以互换使用。其他架构将有更多的寄存器和更少的指令。
    【解决方案2】:

    如果我错了,请纠正我,但是, OOPS 0002 表示在内核模式下写入时找不到页面:

    bit 0 == 0 means no page found, 1 means a protection fault
    bit 1 == 0 means read, 1 means write
    bit 2 == 0 means kernel, 1 means user-mode
    

    【讨论】:

      猜你喜欢
      • 2015-09-12
      • 2013-05-09
      • 2018-05-25
      • 1970-01-01
      • 1970-01-01
      • 2013-08-20
      • 2014-12-24
      • 2020-09-25
      • 1970-01-01
      相关资源
      最近更新 更多