阻塞和非阻塞IO

阻塞式

当应用程序对设备驱动进行操作的时候,如果不能获取到设备资源,那么阻塞式 IO 就会将应用程序对应的线程挂起,直到设备资源可以获取为止。

非阻塞式

对于非阻塞 IO,应用程序对应的线程不会挂
起,它要么一直轮询等待,直到设备资源可以使用,要么就直接放弃。

等待队列

等待队列头

阻塞式的好处就是,当无法获取资源的时候进程进入休眠状态,让出cpu来干别的事情,可以操作的时候再进行唤醒(一般在中断里唤醒)。

Linux内核提供了等待队列来实现阻塞进程的唤醒工作,首先要创建并初始化一个等待队列头,等待队列头使用结构体wait_queue_head_t表示。

1
2
3
4
5
6
7
struct __wait_queue_head{
spinlock_t lock;
struct list_head task_list;
}
typedef struct __wait_queue_head wait_queue_head_t;
//使用init_waitqueue_head初始化等待队列头
void init_waitqueue_head(wait_queue_head_t *q)//q为初始化的等待队列头

等待队列项

每个访问设备的进程都是一个队列项,当设备不可用的时候就要将这些进程对应的等待队列项添加到等待队列里面。

1
2
3
4
5
6
7
8
9
struct __wait_queue{
unsigned int flags;
void *private;
wait_queue_func_t func;
struct list_head task_list;
};
typedef struct __wait_queue wait_queue_t;
//使用宏DECLARE_WAITQUEUE定义初始化一个等待队列项
DECLARE_WAITQUEUE(name, tsk)//name等待队列项的名字,tsk表示等待队列项属于哪个进程

添加或移除等待队列头

当设备不可访问的时候就需要将进程对应的等待队列项添加到前面创建的等待队列头中,只有添加到等待队列头中以后进程才能进入休眠态。当设备可以访问以后再将进程对应的等待队列项从等待队列头中移除即可 。

1
2
void add_wait_queue(wait_queue_head_t *q, wait_queue_t	*wait)
void remove_wait_queue(wait_queue_head_t *q, wait_queue_t *wait)

等待唤醒

当设备可以使用的时候就要唤醒进入休眠态的进程

1
2
void wake_up(wait_queue_head_t *q)
void wake_up_interruptible(wait_queue_head_t *q)

两个函数会将这个等待队列头中的所有进程都唤醒。wake_up 函数可以唤醒处于 TASK_INTERRUPTIBLE 和 TASK_UNINTERRUPTIBLE 状态的进程,而 wake_up_interruptible 函数只能唤醒处于 TASK_INTERRUPTIBLE 状态的进程。

等待事件

除了主动唤醒以外,也可以设置等待队列等待某个事件,当这个事件满足以后就自动唤醒等待队列中的进程

函数 描述
wait_event(wq, condition) 等待以 wq 为等待队列头的等待队列被唤醒,前提是 condition 条件必须满足(为真),否则一直阻塞 此 函 数 会 将 进 程 设 置 为TASK_UNINTERRUPTIBLE 状态
wait_event_timeout(wq,condition,timeout) 功能和 wait_event 类似,但是此函数可以添加超时时间,以 jiffies 为单位。此函数有返回值,如果返回 0 的话表示超时时间到,而且 condition为假。为 1 的话表示 condition 为真,也就是条件满足了。
wait_event_interruptible(wq, condition) 与 wait_event 函数类似,但是此函数将进程设置为 TASK_INTERRUPTIBLE,就是可以被信号打断。
wait_event_interruptible_timeout(wq,condition, timeout) 与 wait_event_timeout 函数类似,此函数也将进程设置为 TASK_INTERRUPTIBLE,可以被信号打断

轮询

如果用户应用程序以非阻塞的方式访问设备,设备驱动程序就要提供非阻塞的处理方式,也就是轮询。 poll、 epoll 和 select 可以用于处理轮询,应用程序通过 select、 epoll 或 poll 函数来查询设备是否可以操作,如果可以操作的话就从设备读取或者向设备写入数据。

select函数

1
2
3
4
5
int select(int nfds,
fd_set *readfds,
fd_set *writefds,
fd_set *exceptfds,
struct timeval *timeout)

nfds: 所要监视的这三类文件描述集合中, 最大文件描述符加 1。

readfds、 writefds 和 exceptfds :readfds 用于监视指定描述符集的读变化,也就是监视这些文件是否可以读取,只要这些集合里面有一个文件可以读取那么 seclect 就会返回一个大于 0 的值表示文件可以读取。如果没有文件可以读取,那么就会根据 timeout 参数来判断是否超时。可以将 readfs设置为 NULL,表示不关心任何文件的读变化。

exceptfds 用于监视这些文件的异常

1
2
3
4
void FD_ZERO(fd_set *set)				//所有位清零
void FD_SET(int fd, fd_set *set) //将某个位置1,也就是向 fd_set 添加一个文件描述符
void FD_CLR(int fd, fd_set *set) //将某个位清0,也就是将一个文件描述符从 fd_set 中删除
int FD_ISSET(int fd, fd_set *set) //用于测试一个文件是否属于某个集合

timeout:超时时间,调用select等待某些文件描述符可以设置超时时间

1
2
3
4
struct	timeval{
long tv_sec ; //秒
long tv_usec; //微秒
};

返回值: 0,表示的话就表示超时发生,但是没有任何文件描述符可以进行操作; -1,发生错误;其他值,可以进行操作的文件描述符个数。

select系统阻塞状态判断

1、timeout传入NULL,则select为阻塞状态,即需要等到监视文件描述符集合中某个文件描述符发生变化才会返回;相当于无穷大的时间,一直等
2、timeout置为0秒、0微秒,则select为非阻塞状态,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回0,有变化返回一个正值;
3、timeout置为大于0的值,即等待的超时时间,select在timeout时间内阻塞,超时时间之内有事件到来就返回,否则在超时后不管怎样一定返回,返回值同上述。

使用 select 函数对某个设备驱动文件进行读非阻塞访问的操作

1
2
3
4
5
6
7
8
9
10
11
12
void main(void)
{
int ret,fd;
fd_set readfd;

fd = open("dev_xx", O_RDWR|)_NONBLOCK);//非阻塞打开
if(fd < 0)
{
printf("can't open file\r\n");
}
FD_ZERO(readfd);
}

Poll函数

在单个线程中,select 函数能够监视的文件描述符数量有最大的限制,一般为 1024,但是 poll 函数没有最大文件描述符限制。

1
2
3
int poll(struct pollfd *fds,
nfds_t nfds,
int timeout)

fds: 要监视的文件描述符集合以及要监视的事件,为一个数组,数组元素都是结构体 pollfd类型的, pollfd 结构体如下所示:

1
2
3
4
5
struct pollfd {
int fd; /* 文件描述符 */
short events; /* 请求的事件 */
short revents; /* 返回的事件 */
};

fd 是要监视的文件描述符,如果 fd 无效的话那么 events 监视事件也就无效,并且 revents返回 0。 events 是要监视的事件。

1
2
3
4
5
6
7
8
可监视事件
POLLIN 有数据可以读取。
POLLPRI 有紧急的数据需要读取。
POLLOUT 可以写数据。
POLLERR 指定的文件描述符发生错误。
POLLHUP 指定的文件描述符挂起。
POLLNVAL 无效的请求。
POLLRDNORM 等同于 POLLIN

revents 是返回参数,也就是返回的事件, 由 Linux 内核设置具体的返回事件

nfds: poll 函数要监视的文件描述符数量。
timeout: 超时时间,单位为 ms。

返回值:返回 revents 域中不为 0 的 pollfd 结构体个数,也就是发生事件或错误的文件描述符数量; 0,超时; -1,发生错误,并且设置 errno 为错误类型。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
void main(void)
{
int ret;
int fd; /* 要监视的文件描述符 */
struct pollfd fds;

fd = open(filename, O_RDWR | O_NONBLOCK); /* 非阻塞式访问 */

/* 构造结构体 */
fds.fd = fd;
fds.events = POLLIN; /* 监视数据是否可以读取 */
ret = poll(&fds, 1, 500); /* 轮询文件是否可操作,超时 500ms */
if (ret) { /* 数据有效 */
......
/* 读取数据 */
......
} else if (ret == 0) { /* 超时 */
......
} else if (ret < 0) { /* 错误 */
......
}
}

epoll函数

epoll 就是为处理大并发而准备的,一般常常在网络编程中使用 epoll 函数。应用程序需要先使用 epoll_create 函数创建一个 epoll 句柄 。

1
int epoll_create(int size)

size: 从 Linux2.6.8 开始此参数已经没有意义了,随便填写一个大于 0 的值就可以。
返回值: epoll 句柄,如果为-1 的话表示创建失败。

epoll 句柄创建成功以后使用 epoll_ctl 函数向其中添加要监视的文件描述符以及监视的事件

1
2
3
4
int epoll_ctl(int epfd,
int op,
int fd,
struct epoll_event *event)

epfd: 要操作的 epoll 句柄,也就是使用 epoll_create 函数创建的 epoll 句柄。
op: 表示要对 epfd(epoll 句柄)进行的操作,可以设置为:

1
2
3
EPOLL_CTL_ADD 向 epfd 添加文件参数 fd 表示的描述符。
EPOLL_CTL_MOD 修改参数 fd 的 event 事件。
EPOLL_CTL_DEL 从 epfd 中删除 fd 描述符。

fd:要监视的文件描述符。
event: 要监视的事件类型,为 epoll_event 结构体类型指针

1
2
3
4
struct epoll_event {
uint32_t events; /* epoll 事件 */
epoll_data_t data; /* 用户数据 */
};

结构体 epoll_event 的 events 成员变量表示要监视的事件

1
2
3
4
5
6
7
8
EPOLLIN 有数据可以读取。
EPOLLOUT 可以写数据。
EPOLLPRI 有紧急的数据需要读取。
EPOLLERR 指定的文件描述符发生错误。
EPOLLHUP 指定的文件描述符挂起。
EPOLLET 设置 epoll 为边沿触发,默认触发模式为水平触发。
EPOLLONESHOT 一次性的监视,当监视完成以后还需要再次监视某个 fd,那么就需要将
fd 重新添加到 epoll 里面。

上面这些事件可以进行“或”操作,也就是说可以设置监视多个事件。

返回值: 0,成功; -1,失败,并且设置 errno 的值为相应的错误码。

一切都设置好以后应用程序就可以通过 epoll_wait 函数来等待事件的发生,类似 select 函数。

1
2
3
4
int epoll_wait(int epfd,
struct epoll_event *events,
int maxevents,
int timeout)

epfd: 要等待的 epoll。

events: 指向 epoll_event 结构体的数组,当有事件发生的时候 Linux 内核会填写 events,调
用者可以根据 events 判断发生了哪些事件。
maxevents: events 数组大小,必须大于 0。
timeout: 超时时间,单位为 ms。
返回值: 0,超时; -1,错误;其他值,准备就绪的文件描述符数量。

Linux 驱动下的 poll 操作函数

当应用程序调用 select 或 poll 函数来对驱动程序进行非阻塞访问的时候,驱动程序file_operations 操作集中的 poll 函数就会执行。所以驱动程序的编写者需要提供对应的 poll 函数。

1
2
3
4
5
6
7
//poll函数原型
unsigned int(*poll)(struct file *filp, struct poll_table_struct *wait)
//filp要打开的设备文件
//wait结构体 poll_table_struct 类型指针, 由应用程序传递进来的。一般将此参数传递给poll_wait 函数
void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p)
//poll_wait 函数不会引起阻塞,只是将应用程序添加到 poll_table 中
//参数 wait_address 是要添加到 poll_table 中的等待队列头,参数 p 就是 poll_table

poll函数的返回值:向应用程序返回设备或者资源状态

1
2
3
4
5
6
7
POLLIN 有数据可以读取。
POLLPRI 有紧急的数据需要读取。
POLLOUT 可以写数据。
POLLERR 指定的文件描述符发生错误。
POLLHUP 指定的文件描述符挂起。
POLLNVAL 无效的请求。
POLLRDNORM 等同于 POLLIN,普通数据可读