深圳幻海软件技术有限公司 欢迎您!

Netty学习之I/O 模型和Java NIO 编程

2023-02-28

一、简介1)Java共支持3种网络编程模型/IO模式:BIO、NIO、AIO2)JavaBIO:同步并阻塞(传统阻塞型),服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销3)JavaNIO:同步非阻塞,服务器实现

一、简介

1)Java 共支持 3 种网络编程模型/IO 模式: BIO、 NIO、 AIO

2)Java BIO : 同步并阻塞(传统阻塞型), 服务器实现模式为一个连接一个线程, 即客户端有连接请求时服务器端就需要启动一个线程进行处理, 如果这个连接不做任何事情会造成不必要的线程开销

3)Java NIO : 同步非阻塞, 服务器实现模式为一个线程处理多个请求(连接), 即客户端发送的连接请求都会注册到多路复用器上, 多路复用器轮询到连接有 I/O 请求就进行处理。

4)Java AIO(NIO.2) : 异步非阻塞, AIO 引入异步通道的概念, 采用了 Proactor 模式, 简化了程序编写, 有效的请求才启动线程, 它的特点是先由操作系统完成后才通知服务端程序启动线程去处理, 一般适用于连接数较多且连接时间较长的应用。

二、适用场景

1)BIO 方式适用于连接数目比较小且固定的架构, 这种方式对服务器资源要求比较高, 并发局限于应用中, JDK1.4以前的唯一选择, 但程序简单易理解。

2)NIO 方式适用于连接数目多且连接比较短(轻操作) 的架构, 比如聊天服务器, 弹幕系统, 服务器间通讯等。编程比较复杂, JDK1.4 开始支持。

  1. AIO 方式使用于连接数目多且连接比较长(重操作) 的架构, 比如相册服务器, 充分调用 OS 参与并发操作,编程比较复杂, JDK7 开始支持。

三、Java NIO 编程

3.1 Java NIO 基本介绍

  1. Java NIO 全称 java non-blocking IO, 是指 JDK 提供的新 API。 从 JDK1.4 开始, Java 提供了一系列改进的输入/输出的新特性, 被统称为 NIO(即 New IO), 是同步非阻塞的。
  2. NIO 相关类都被放在 java.nio 包及子包下, 并且对原 java.io 包中的很多类进行改写。
  3. NIO 有三大核心部分: Channel(通道), Buffer(缓冲区), Selector(选择器)
  4. NIO 是 面向缓冲区 , 或者面向 块 编程的。 数据读取到一个它稍后处理的缓冲区, 需要时可在缓冲区中前后移动, 这就增加了处理过程中的灵活性, 使用它可以提供非阻塞式的高伸缩性网络
  5. Java NIO 的非阻塞模式, 使一个线程从某通道发送请求或者读取数据, 但是它仅能得到目前可用的数据, 如果目前没有数据可用时, 就什么都不会获取, 而不是保持线程阻塞, 所以直至数据变的可以读取之前, 该线程可以继续做其他的事情。 非阻塞写也是如此, 一个线程请求写入一些数据到某通道, 但不需要等待它完全写入,这个线程同时可以去做别的事情。

3.2 NIO 和 BIO 的比较

  1. BIO 以流的方式处理数据,而 NIO 以块的方式处理数据,块 I/O 的效率比流 I/O 高很多
  2. BIO 是阻塞的, NIO 则是非阻塞的
  3. BIO 基于字节流和字符流进行操作, 而 NIO 基于 Channel(通道)和 Buffer(缓冲区)进行操作, 数据总是从通道读取到缓冲区中, 或者从缓冲区写入到通道中。Selector(选择器)用于监听多个通道的事件(比如: 连接请求,数据到达等) , 因此使用单个线程就可以监听多个客户端通道

3.3 NIO三大核心原理图

3.3.1 Selector 、 Channel 和 Buffer 的关系图

每个 channel 都会对应一个 Buffer

  1. Selector 对应一个线程, 一个线程对应多个 channel(连接)
  2. 该图反应了有三个 channel 注册到 该 selector //程序
  3. 程序切换到哪个 channel 是由事件决定的, Event 就是一个重要的概念
  4. Selector 会根据不同的事件, 在各个通道上切换
  5. Buffer 就是一个内存块 , 底层是有一个数组
  6. 数据的读取写入是通过 Buffer, 这个和 BIO , BIO 中要么是输入流, 或者是

输出流, 不能双向, 但是 NIO 的 Buffer 是可以读也可以写, 需要 flip 方法切换

channel 是双向的, 可以返回底层操作系统的情况, 比如 Linux , 底层的操作系统

通道就是双向的

3.4 缓冲区(Buffer)

3.4.1基本介绍

缓冲区(Buffer) : 缓冲区本质上是一个可以读写数据的内存块, 可以理解成是一个容器对象(含数组), 该对象提供了一组方法, 可以更轻松地使用内存块,缓冲区对象内置了一些机制, 能够跟踪和记录缓冲区的状态变化情况。 Channel 提供从文件、 网络读取数据的渠道, 但是读取或写入的数据都必须经由 Buffer, 如图:

3.4.2 Buffer 类及其子类

  1. Buffer 类定义了所有的缓冲区都具有的四个属性来提供关于其所包含的数据元素的信息:

2)Buffer 类相关方法一览

3.4.3 ByteBuffer

3.5 通道(Channel)

基本介绍

  1. NIO 的通道类似于流, 但有些区别如下:

 通道可以同时进行读写, 而流只能读或者只能写

 通道可以实现异步读写数据

 通道可以从缓冲读数据, 也可以写数据到缓冲:

  1. 常 用 的 Channel 类 有 : FileChannel 、 DatagramChannel 、ServerSocketChannel 和 SocketChannel 。
  2. FileChannel 用于文件的数据读写, DatagramChannel 用于 UDP 的数据读写, ServerSocketChannel 和SocketChannel 用于 TCP 的数据读写。

3.6 Selector(选择器)

3.6.1 基本介绍

  1. Java 的 NIO, 用非阻塞的 IO 方式。 可以用一个线程, 处理多个的客户端连接, 就会使用到 Selector(选择器)
  2. Selector 能够检测多个注册的通道上是否有事件发生(注意:多个 Channel 以事件的方式可以注册到同一个Selector), 如果有事件发生, 便获取事件然后针对每个事件进行相应的处理。
  3. 只有在 连接/通道 真正有读写事件发生时, 才会进行读写, 就大大地减少了系统开销, 并且不必为每个连接都创建一个线程, 不用去维护多个线程
  4. 避免了多线程之间的上下文切换导致的开销

3.6.2 Selector 示意图

  1. Netty 的 IO 线程 NioEventLoop 聚合了 Selector(选择器, 也叫多路复用器), 可以同时并发处理成百上千个客户端连接。
  2. 当线程从某客户端 Socket 通道进行读写数据时, 若没有数据可用时, 该线程可以进行其他任务。
  3. 线程通常将非阻塞 IO 的空闲时间用于在其他通道上执行 IO 操作, 所以单独的线程可以管理多个输入和输出通道。
  4. 由于读写操作都是非阻塞的, 这就可以充分提升 IO 线程的运行效率, 避免由于频繁 I/O 阻塞导致的线程挂起。
  5. 一个 I/O 线程可以并发处理 N 个客户端连接和读写操作, 这从根本上解决了传统同步阻塞 I/O 一连接一线程模型, 架构的性能、 弹性伸缩能力和可靠性都得到了极大的提升。

3.6.3 Selector方法

public static Selector open():得到一个选择器对象

public int select(long timeout):监控所有注册的通道,当其中IO操作可以进行时,将对应的SelectionKey加入到内部集合中返回,参数为超时时间

public Set<SlectionKey> selectedKeys():从内部集合中得到所有的SlectionKey

selector.select() //阻塞

selector.select(1000) //阻塞1000s

selector.wakeup(); //唤醒 selector

selector.selectNow(); //不阻塞, 立马返还

3.7 NIO 非阻塞 网络编程原理分析图

NIO 非阻塞 网络编程相关的(Selector、 SelectionKey、 ServerScoketChannel 和 SocketChannel) 关系梳理图

  1. 当客户端连接时, 会通过 ServerSocketChannel 得到 SocketChannel
  2. Selector 进行监听 select 方法, 返回有事件发生的通道的个数.
  3. 将 socketChannel 注册到 Selector 上, register(Selector sel, int ops), 一个 selector 上可以注册多个 SocketChannel
  4. 注册后返回一个 SelectionKey, 会和该 Selector 关联(集合)
  5. 进一步得到各个 SelectionKey (有事件发生)
  6. 在通过 SelectionKey 反向获取 SocketChannel , 方法 channel()
  7. 可以通过 得到的 channel , 完成业务处理

3.8 SelectionKey

SelectionKey, 表示 Selector 和网络通道的注册关系, 共四种:

int OP_ACCEPT: 有新的网络连接可以 accept, 值为 16

int OP_CONNECT: 代表连接已经建立, 值为 8

int OP_READ: 代表读操作, 值为 1

int OP_WRITE: 代表写操作, 值为 4

3.9 ServerSocketChannel

ServerSocketChannel 在服务器端监听新的客户端 Socket 连接

3.10 SocketChannel

SocketChannel,网络 IO 通道,具体负责进行读写操作。NIO 把缓冲区的数据写入通道, 或者把通道里的数据读到缓冲区。

3.11 NIO 与零拷贝

3.11.1 基本介绍

  1. 在 Java 程序中, 常用的零拷贝有 mmap(内存映射) 和 sendFile。
  2. 所谓零拷贝,是从操作系统角度来看没有CPU拷贝。

3.11.2 传统IO模型

DMA: direct memory access 直接内存拷贝(不使用 CPU)

3.11.4 mmap 优化

  1. mmap 通过内存映射, 将文件映射到内核缓冲区, 同时, 用户空间可以共享内核空间的数据。

3.11.5 sendFile 优化

  1. Linux 2.1 版本 提供了 sendFile 函数, 其基本原理如下: 数据根本不经过用户态, 直接从内核缓冲区进入到Socket Buffer,同时,由于和用户态完全无关,就减少了一次上下文切换。

系统调用:需要进行线程上下文切换,但不是进程上下文切换

3.11.6 sendFile改进

Linux 在 2.4 版本中, 做了一些修改, 避免了从内核缓冲区拷贝到 Socket buffer 的操作, 直接拷贝到协议栈,从而再一次减少了数据拷贝。

这里还是有一次少量数据的CPU拷贝

kernel buffer → socket buffer

拷贝的信息很少,比如length,offset等,消耗很低,可以忽略。