【发布时间】:2011-03-18 23:34:36
【问题描述】:
我正在尝试编写一个使用 netlink 与用户进程通信的 linux 内核模块。我正在使用 netlink,因为我想与之通信的用户程序仅使用套接字进行通信,我无法将其更改为添加 ioctl() 或任何内容。
问题是我不知道该怎么做。我已经用谷歌搜索了,但我发现的所有示例都是旧的,例如 this one,并且对于当前的内核版本不再有效。我还查看了this SO question,但这里的示例使用libnl 进行套接字操作,但我想坚持使用标准套接字函数(由sys/socket.h 定义)。所以有人可以在这里指导我一些教程或指南或一些可以帮助我理解netlink接口和用法的东西。我非常感谢一个工作示例,没有什么花哨的,只是一个非常基本的示例,说明如何建立从用户程序中的套接字到内核中的套接字的连接,然后将数据从用户进程发送到内核并从内核接收。
另外请不要告诉我看内核代码。我已经在做,但这需要很多时间,而且我已经没有多少时间了。
更新:
经过大量试验和错误后,我有以下代码将消息从用户程序发送到内核,但从内核到用户程序的消息,即使用netlink_unicast() 不起作用。它不仅不工作,呼叫挂起系统,然后我必须重新启动机器。有人可以看看并告诉我我做错了什么。 netlink_unicast() 调用在以下代码中进行了注释。内核到用户程序的消息应该取消注释。
用户程序
#include <sys/socket.h>
#include <linux/netlink.h>
#define NETLINK_USER 31
#define MAX_PAYLOAD 1024 /* maximum payload size*/
struct sockaddr_nl src_addr, dest_addr;
struct nlmsghdr *nlh = NULL;
struct iovec iov;
int sock_fd;
struct msghdr msg;
void main()
{
sock_fd=socket(PF_NETLINK, SOCK_RAW, NETLINK_USER);
if(sock_fd<0)
return -1;
memset(&src_addr, 0, sizeof(src_addr));
src_addr.nl_family = AF_NETLINK;
src_addr.nl_pid = getpid(); /* self pid */
/* interested in group 1<<0 */
bind(sock_fd, (struct sockaddr*)&src_addr,
sizeof(src_addr));
memset(&dest_addr, 0, sizeof(dest_addr));
memset(&dest_addr, 0, sizeof(dest_addr));
dest_addr.nl_family = AF_NETLINK;
dest_addr.nl_pid = 0; /* For Linux Kernel */
dest_addr.nl_groups = 0; /* unicast */
nlh = (struct nlmsghdr *)malloc(
NLMSG_SPACE(MAX_PAYLOAD));
memset(nlh, 0, NLMSG_SPACE(MAX_PAYLOAD));
nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);
nlh->nlmsg_pid = getpid();
nlh->nlmsg_flags = 0;
strcpy(NLMSG_DATA(nlh), "Hello");
iov.iov_base = (void *)nlh;
iov.iov_len = nlh->nlmsg_len;
msg.msg_name = (void *)&dest_addr;
msg.msg_namelen = sizeof(dest_addr);
msg.msg_iov = &iov;
msg.msg_iovlen = 1;
printf("Sending message to kernel\n");
sendmsg(sock_fd,&msg,0);
printf("Waiting for message from kernel\n");
/* Read message from kernel */
recvmsg(sock_fd, &msg, 0);
printf(" Received message payload: %s\n",
NLMSG_DATA(nlh));
close(sock_fd);
}
内核代码
#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/init.h>
#include <net/sock.h>
#include <linux/socket.h>
#include <linux/net.h>
#include <asm/types.h>
#include <linux/netlink.h>
#include <linux/skbuff.h>
#define NETLINK_USER 31
struct sock *nl_sk = NULL;
static void hello_nl_recv_msg(struct sk_buff *skb)
{
struct nlmsghdr *nlh;
int pid;
printk(KERN_INFO "Entering: %s\n", __FUNCTION__);
nlh=(struct nlmsghdr*)skb->data;
printk(KERN_INFO "Netlink received msg payload: %s\n",
(char*)NLMSG_DATA(nlh));
pid = nlh->nlmsg_pid; /*pid of sending process */
NETLINK_CB(skb).dst_group = 0; /* not in mcast group */
NETLINK_CB(skb).pid = 0; /* from kernel */
//NETLINK_CB(skb).groups = 0; /* not in mcast group */
//NETLINK_CB(skb).dst_pid = pid;
printk("About to send msg bak:\n");
//netlink_unicast(nl_sk,skb,pid,MSG_DONTWAIT);
}
static int __init hello_init(void)
{
printk("Entering: %s\n",__FUNCTION__);
nl_sk=netlink_kernel_create(&init_net, NETLINK_USER, 0,
hello_nl_recv_msg, NULL, THIS_MODULE);
if(!nl_sk)
{
printk(KERN_ALERT "Error creating socket.\n");
return -10;
}
return 0;
}
static void __exit hello_exit(void)
{
printk(KERN_INFO "exiting hello module\n");
netlink_kernel_release(nl_sk);
}
module_init(hello_init);
module_exit(hello_exit);
【问题讨论】:
-
怎么可能有 10 个人将其标记为收藏,但只有 5 人点赞?
-
我知道有点晚了,但这本书(第 2 章)也讨论了 netlink 套接字:amazon.com/Linux-Kernel-Networking-Implementation-Experts/dp/…
-
只要在全局范围内定义了
struct msghdr msg;,这个用户程序就可以工作。但是,一旦我将其移入函数(例如 main),用户程序就不再工作,sendmsg返回 -1 并且 errno 设置为错误 105(ENOBUFS - 没有可用的缓冲区空间)。谁能解释为什么msghdr仅在此程序中全局定义时才有效?
标签: c linux-kernel linux-device-driver netlink