发布网友 发布时间:2022-10-09 06:45
共1个回答
热心网友 时间:2023-12-15 01:15
为了保护操作系统安全,操作系统按照特权等级将将虚拟空间划分为两个部分,内核空间与用户空间。内核空间(Ring 0)是操作系统内核访问的区域,具有最高权限,可以直接访问所有资源。用户空间(Ring 3)是普通应用程序可访问的内存区域,只能访问受限资源,不能直接访问内存等硬件设备,必须通过系统调用陷入到内核中,才能访问这些特权资源。只能访问用户空间也就是运行在Ring 3上的程序我们称为用户程序,而运行在Ring 0上的程序我们称为内核程序。
用户程序不能访问内核空间,如果想要调用内核程序进行IO操作,必须从用户态切换为内核态,等到内核处理完之后再切换为用户态。
用户程序进行IO操作时需要进行两次状态切换:用户态->内核态->用户态,具体流程如下:
用户程序每进行一次系统调用都会进行两次状态切换,频繁的状态切换会影响程序运行效率,缓冲区的作用就是为了减少系统调用。缓冲区分为两种:内核缓冲区与用户缓冲区:
用户程序进行IO读写操作会发起系统调用,操作系统内核将磁盘数据读取到内核缓冲区,然后从内核缓冲区拷贝到用户缓冲区,流程如下:
举例来说,如果要读取一个文件并通过网络发送它,传统方式下每个读/写周期都需要复制两次数据和切换两次上下文,而数据的复制都需要依靠CPU。通过零复制技术完成相同的操作,上下文切换减少到两次,并且不需要CPU复制数据。
不使用零拷贝
不适用零拷贝需要经历四次数据拷贝+三次状态切换
mmap + write
mmap + write方式减少了一次CPU拷贝
sendfile
sendfile方式不涉及CPU拷贝
在讲解IO模型前,先了解下几个概念:阻塞与非阻塞、同步与异步:
阻塞IO
用户进程发起系统调用,如果数据还未准备完成,用户进程一直等待,直到数据准备完成,从内核缓冲区拷贝到用户缓冲区才返回成功提示,此次IO操作,称之为阻塞IO。缺点:如果数据没有准备好,则用户进程一直处于阻塞状态,如果想要同时处理很多请求,则需要为每个请求分配线程进行处理,系统开销较大。
非阻塞IO
用户进程发起系统调用,如果数据还未准备好,立刻返回状态标识,用户进程后续可以通过轮询的方式查看结果。缺点:虽然用户进程不阻塞了,但需要频繁的轮询获取结果,这样会导致频繁的系统调用,消耗大量的CPU资源。
IO多路复用
将IO事件注册到IO多路复用器(select/poll/epoll)上,select调用进程将一直阻塞直至注册在其上的任意一个IO时间数据准备完成时,才会返回。
信号驱动IO
用户进程发起系统调用,会向内核注册一个信号处理函数,然后进程返回不阻塞;当内核数据就绪时会发送一个信号给进程,进程便在信号处理函数中调用IO读取数据。
异步IO
用户进程发起系统调用后直接返回,等到处理完成,主动通知进程结果。
对本文做个回顾:
用户进程运行在用户空间,只能访问受限资源,如果需要访问磁盘等硬件设备需要发起系统调用,从用户态切换为用户态;
为了减少频繁的系统调用,降低CPU消耗,讲解了内核缓冲区与用户缓冲区的作用;
IO读写流程,需要经历两次状态切换与两次数据拷贝;
零拷贝原理;
阻塞与非阻塞、同步与异步概念,四种同步IO模型,一种异步IO模型。