最近在总结数据湖(Hudi/Iceberg/Paimon) On Kubernetes 的笔记～ [图片]

哥哥立志成为 Apache Commit～

痛苦的学习源码中～

Hadoop-组件-HDFS-源码学习-数据读写-读文件-零拷贝读

发表于2021-01-18|更新于2022-01-27|Hadoop

|阅读量:

一、概述

二、理论笔记

三、实现

DFSInputStream.read() 首先调用 tryReadZeroCopy() 方法尝试以零拷贝模式读取数据块，如果当前配置或者数据块的状态不支持零拷贝，则调用 ByteBufferUtil.fallbackRead() 退化为一个普通的读取操作。

在传统的文件 I/O 操作中，都是调用操作系统提供的系统调用函数 read() 或 write() 来执行读写操作的，此时调用此函数的进程会由用户态切换到内核态，然后操作系统的内核代码负责将相应的文件数据读取到内核的 I/O 缓冲区，最后再把数据从内核 IO 缓冲区拷贝到进程的私有地址空间中，完成一次 IO 操作。

3.1. 校验

3.1.1. 同一个数据块

首先确保读取是在同一个数据块之内

3.1.2. 映射数据 <= 2GB

确保读取映射数据没有超过 2GB

3.2. 获取数据块文件在内存中的映射对象

tryReadZeroCopy() 会通过调用 blockReader.getclientMmap(）将文件映射到内存中，并返回 ClientMmap对象。这个对象当中
包含了 MappedByteBuffer 对象

BlockReader.getClientMmap

文章作者: 周小丑

文章链接: http://example.com/2021/01/18/Hadoop-%E7%BB%84%E4%BB%B6-HDFS-%E6%BA%90%E7%A0%81%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE%E8%AF%BB%E5%86%99-%E8%AF%BB%E6%96%87%E4%BB%B6-%E9%9B%B6%E6%8B%B7%E8%B4%9D%E8%AF%BB/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Joker！

源码 Hadoop HDFS

打赏

微信
支付宝

相关推荐

Hadoop-组件-HDFS-理论笔记-HDFS 架构设计-DataNode 架构-数据层-DataStorage

Hadoop-组件-HDFS-理论笔记-HDFS 架构设计-DataNode 架构-数据层-数据块以及元数据管理

Hadoop-组件-HDFS-理论笔记-HDFS 架构设计-DataNode 架构-数据层-磁盘存储目录管理

Hadoop-组件-HDFS-理论笔记-HDFS 架构设计-DataNode 架构-数据层设计

Hadoop-组件-HDFS-理论笔记-HDFS 架构设计-DataNode 架构-服务层设计-Http 服务

Hadoop-组件-HDFS-理论笔记-HDFS 架构设计-DataNode 架构-服务层设计-IPCServer

评论

ValineTwikoo

播放音乐

数据库加载中

全屏显示阅读模式添加书签

立志成为 Commiter 👏