面试官:字节流可以处理一切文件为什么还需要字符流呢?

· 浏览次数 : 0

小编点评

在计算机领域中,百分之九十以上的程序都拥有与外部设备交互的功能,这就是我们常说的IO(Input/Output:输入/输出)。输入是指外部数据导入计算机内存的过程,而输出则是将内存或程序中的数据导入到外部存储中,如数据库、文件以及其他本地磁盘等。 IO流是一种输入输出操作,它遵循先进先出(FIFO)的原则,就像水流一样。根据数据流向,IO流可以分为输入流和输出流。输入流是从数据源(如文件、数据库等)读取数据,而输出流是将数据从程序发送到外部存储(如文件、数据库等)。 在Java中,IO流分为字节流和字符流。字节流是基于字节操作的,一次可以读写8位二进制数据;而字符流是基于字符操作的,一次可以读写16位二进制数据。JDK中,后缀为Stream的是字节流,后缀为Reader和Writer的是字符流。 Java.io包中有40多个与IO流相关的类,它们的基类包括InputStream、OutputStream、Reader和Writer。这些类涵盖了各种输入输出场景,如文件读写、网络通信等。 总之,IO流是计算机领域中不可或缺的一部分,它们使得程序能够与外部设备进行有效的数据交换。了解IO流的基本概念、分类和实现方式,对于成为一名优秀的程序员至关重要。

正文

一、写在开头

在计算机领域中百分之九十以上的程序拥有着和外部设备交互的功能,这就是我们常说的IO(Input/Output:输入/输出),所谓输入就是外部数据导入计算机内存中的过程,输出则是将内存或者说程序中的数据导入到外部存储中,如数据库、文件以及其他本地磁盘等。

二、什么是IO流

这种输入输出往往遵循着先入先出,顺序存取的特点,像水流一般,因此我们称这样的操作为流(Stream),如下我们根据不同的标准,将IO流分为几个门类:
image

根据数据流向:

  1. 输入流:数据流向程序
  2. 输出流:数据从程序流出。

根据处理单位:

  1. 字节流:一次读入或读出是8位二进制;
  2. 字符流:一次读入或读出是16位二进制
  3. JDK 中后缀是 Stream 是字节流;后缀是 Reader,Writer 是字符流。

根据功能点:

  1. 节点流:直接与数据源相连,读入或写出;
  2. 处理流:与节点流一块使用,在节点流的基础上,再套接一层。

三、输入与输出

在java.io包中多达40多个类,它们的基类来源于InputStream、OutputStream、Reader、Writer这四个,我们一一看过。

3.1 InputStream(字节输入流)

InputStream作为所有字节输入流的父类,主要作用是将外部数据读取到内存中,主要方法如下(JDK8):

  1. read():返回输入流中下一个字节的数据。返回的值介于 0 到 255 之间。如果未读取任何字节,则代码返回 -1 ,表示文件结束。
  2. read(byte b[ ]) : 从输入流中读取一些字节存储到数组 b 中。如果数组 b 的长度为零,则不读取。如果没有可用字节读取,返回 -1。如果有可用字节读取,则最多读取的字节数最多等于 b.length , 返回读取的字节数。这个方法等价于 read(b, 0, b.length)。
  3. read(byte b[], int off, int len):在read(byte b[ ]) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. skip(long n):忽略输入流中的 n 个字节 ,返回实际忽略的字节数。
  5. available():返回输入流中可以读取的字节数。
  6. close():关闭输入流释放相关的系统资源。
  7. markSupported() :该输入流是否支持mark()和reset()方法。
  8. mark(int readlimit) :标志输入流的当前位置,随后调用reset()方法将该流重新定位到最近标记的位置;参数readlimit表示:在标记位置失效前可以读取字节的最大限制。
  9. reset() :将此流重新定位到最后一次对此输入流调用 mark 方法时的位置。

image

我们使用FileInputStream(文件字节输入流)进行如上方法的使用测试:

public class Test {
    public static void main(String[] args) throws IOException {
        try (InputStream fis = new FileInputStream("E:\\input.txt")) {
            System.out.println("可读取字节数:"
                    + fis.available());
            int content;
            long skip = fis.skip(3);
            System.out.println("忽略字节数:" + skip);
            System.out.print("剩余全量字节:");
            while ((content = fis.read()) != -1) {
                System.out.print((char) content);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

image

输出:

可读取字节数:20
忽略字节数:3
剩余全量字节:name is JavaBuild

3.2 OutputStream(字节输出流)

outputstream作为所有字节输出流的父类,主要则是将内存或者说程序中的数据以字节流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。它的使用方法相比较字节输入流要少:

  1. write(int b):将特定字节写入输出流。
  2. write(byte b[ ]) : 将数组b 写入到输出流,等价于 write(b, 0, b.length) 。
  3. write(byte[] b, int off, int len) : 在write(byte b[ ]) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. flush():刷新此输出流并强制写出所有缓冲的输出字节。
  5. close():关闭输出流释放相关的系统资源。

image

我们同样以FileOutputStream为例进行上述方法的测试:

public class Test {
    public static void main(String[] args) throws IOException {
        try (FileOutputStream output = new FileOutputStream("E://output.txt")) {
            byte[] array = "JavaBuild".getBytes();
            //将一个字节数组写入本地E盘的外部文件output.txt中
            output.write(array);

            //换行方式1:Windows下的换行符为"\r\n"
            output.write("\r\n".getBytes());
            //换行方式2:推荐使用,具有良好的跨平台性
            String newLine = System.getProperty("line.separator");
            output.write(newLine.getBytes());

            //输出字节,这里的数字会被转为asicc码中对应的字符
            output.write(64);
            output.write(56);
            output.write(56);
            output.write(56);
            //关闭输出流
            output.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

效果:
image

这里可以直接输出单字节数据,也可以输出指定的字节数组。输出字节时以int类型输出,最终根据ASCII表转为字符。如十进制64的转为@符号。

3.3 Reader(字符输入流)

在讲解字符流之前,我们来解释一个面试问题:“为什么有了字节流了还需要使用更耗时的字符流”

确实,字节作为信息存储的最小单元,我们可以通过字节流实现所有信息的输入与输出,但有时候会存在一些问题,比如中文输入时的编码问题,将上述3.1中的测试代码稍微改一下,执行结果如下,中文在控制台输出时乱码了。当然我们可以通过设置编码来规避这个问题,但有时候不晓得编码时,乱码真的会带来潜在风险!
image

字符流与字节流的区别:

  • 字节流一般用来处理图像、视频、音频、PPT、Word等类型的文件。字符流一般用于处理纯文本类型的文件,如TXT文件等,但不能处理图像视频等非文本文件。
  • 字节流本身没有缓冲区,缓冲字节流相对于字节流,效率提升非常高。而字符流本身就带有缓冲区,缓冲字符流相对于效率提升不明显。

说了这么多,我们现在来看一下Reader这个字符输入流提供的主要方法吧,其实和InputStream差不多,只不过一个是以字节为单位的读取,一个是以字符为单位。

  1. read() : 从输入流读取一个字符。
  2. read(char[] cbuf) : 从输入流中读取一些字符,并将它们存储到字符数组 cbuf中,等价于 read(cbuf, 0, cbuf.length) 。
  3. read(char[] cbuf, int off, int len):在read(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. skip(long n):忽略输入流中的 n 个字符 ,返回实际忽略的字符数。
  5. close() : 关闭输入流并释放相关的系统资源。

image

我们将上述3.1中的测试代码稍作加工,采用FileReader流进行输入,打印结果:

image

可以看到即便有中文,输出在控制台也没有乱码,因为字符流默认采用的是 Unicode 编码。

那么字符流是如何实现txt文件读取的呢?通过FileReader类的继承关系我们可以看到它继承了InputStreamReader,这是一个字节转字符输入流,所以说从根本上,字符流底层依赖的还是字节流!

// 字节流转换为字符流的桥梁
public class InputStreamReader extends Reader {
}
// 用于读取字符文件
public class FileReader extends InputStreamReader {
}

3.4 Writer(字符输出流)

writer是将内存或者说程序中的数据以字符流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。
常用方法也和OutputStream相似:

  1. write(int c) : 写入单个字符。
  2. write(char[] cbuf):写入字符数组 cbuf,等价于write(cbuf, 0, cbuf.length)。
  3. write(char[] cbuf, int off, int len):在write(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. write(String str):写入字符串,等价于 write(str, 0, str.length()) 。
  5. write(String str, int off, int len):在write(String str) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  6. append(CharSequence csq):将指定的字符序列附加到指定的 Writer 对象并返回该 Writer 对象。
  7. append(char c):将指定的字符附加到指定的 Writer 对象并返回该 Writer 对象。
  8. flush():刷新此输出流并强制写出所有缓冲的输出字符。
  9. close():关闭输出流释放相关的系统资源。

我们同样以FileWriter为例,去测试一下:

public class Test {
    public static void main(String[] args) throws IOException {
        try (FileWriter fw = new FileWriter("E:\\outwriter.txt")) {
           fw.write("大家好!!!");
           fw.append("我是JavaBuild");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

image

结尾彩蛋

如果本篇博客对您有一定的帮助,大家记得留言+点赞+收藏呀。原创不易,转载请联系Build哥!
image

如果您想与Build哥的关系更近一步,还可以关注“JavaBuild888”,在这里除了看到《Java成长计划》系列博文,还有提升工作效率的小笔记、读书心得、大厂面经、人生感悟等等,欢迎您的加入!
image

与面试官:字节流可以处理一切文件为什么还需要字符流呢?相似的内容:

面试官:字节流可以处理一切文件为什么还需要字符流呢?

一、写在开头 在计算机领域中百分之九十以上的程序拥有着和外部设备交互的功能,这就是我们常说的IO(Input/Output:输入/输出),所谓输入就是外部数据导入计算机内存中的过程,输出则是将内存或者说程序中的数据导入到外部存储中,如数据库、文件以及其他本地磁盘等。 二、什么是IO流 这种输入输出往

什么是 Java 字节码?采用字节码的好处是什么?

在 Java 中,JVM 可以理解的代码就叫做字节码(即扩展名为 .class 的文件),它不面向任何特定的处理器,只面向虚拟机。Java 语言通过字节码的方式,在一定程度上解决了传统解释型语言执行效率低的问题,同时又保留了解释型语言可移植的特点。所以, Java 程序运行时相对来说还是高效的(不过

2.1万字,30张图详解操作系统常见面试题(收藏版)

耗时两周,新版的操作系统常见知识点/问题总结总算搞完了,手绘了30多张图。大家可以用来复习操作系统或者准备操作系统面试。对于大部分公司的面试来说基本够用了,不过,像腾讯、字节这种大厂的面试还是要适当深入一些。 这篇文章总结了一些我觉得比较重要的操作系统相关的问题比如 用户态和内核态、系统调用、进程和

字节面试:MySQL自增ID用完会怎样?

在一些中小型项目开发中,我们通常会使用自增 ID 来作为主键的生成策略,但随着时间的推移,数据库的信息也会越来越多,尤其是使用自增 ID 作为日志表的主键生成策略时,可能很快就会遇到 ID 被用完的情况,那么如果发生了这种情况,MySQL 又会怎样执行呢? PS:当然,在分库分表的场景中,我们通常会

[转帖]图解:什么是红黑树?

https://zhuanlan.zhihu.com/p/273829162 注:本文比较硬核但是很值得大家花心思看完,看完你一定会有所收获的 红黑树是面试中一个很经典也很有难度的知识点,网传字节跳动面试官最喜欢问这个问题。很多人会觉得这个知识点太难,不想花太多功夫去了解,也有人会认为这个数据结构在

研二学妹面试字节,竟倒在了ThreadLocal上,这是不要应届生还是不要女生啊?

一、写在开头 今天和一个之前研二的学妹聊天,聊及她上周面试字节的情况,着实感受到了Java后端现在找工作的压力啊,记得在18,19年的时候,研究生计算机专业的学生,背背八股文找个Java开发工作毫无问题,但现在即便你是应届生,问的考题也非常的深入和细节了,只会背八股,没有一定的代码量和项目积累,根本

字节面试:说说Java中的锁机制?

Java 中的锁(Locking)机制主要是为了解决多线程环境下,对共享资源并发访问时的同步和互斥控制,以确保共享资源的安全访问。 锁的作用主要体现在以下几个方面: 互斥访问:确保在任何时刻,只有一个线程能够访问特定的资源或执行特定的代码段。这防止了多个线程同时修改同一资源导致的数据不一致问题。 内

3年Java阿里跳字节的面试心得总结

中厂->阿里->字节,成都->杭州->成都 系列文章目录和关于我 0.前言 笔者在不足两年经验的时候从成都一家金融科技中厂跳槽到杭州阿里淘天集团,又于今年5月份从杭州淘天跳槽到成都字节。自认为自己在面试这方面有一点心得,处于记录和分享的目的便有了此文,此文纯主观,也许对3年社招的同学有所帮助。 本文

又跳槽!3年java经验offer收割机的面试心得

中厂->阿里->字节,成都->杭州->成都 系列文章目录和关于我 0.前言 笔者在不足两年经验的时候从成都一家金融科技中厂跳槽到杭州阿里淘天集团,又于今年5月份从杭州淘天跳槽到成都字节。自认为自己在面试这方面有一点心得,处于记录和分享的目的便有了此文,此文纯主观,也许对3年社招的同学有所帮助。 本文

又跳槽!3年Java经验收割成都大厂的面试心得(干货满满&文末有福利)

中厂->阿里->字节,成都->杭州->成都 系列文章目录和关于我 0.前言 笔者在不足两年经验的时候从成都一家金融科技中厂跳槽到杭州阿里淘天集团,又于今年5月份从杭州淘天跳槽到成都字节。自认为自己在面试这方面有一点心得,处于记录和分享的目的便有了此文,此文纯主观,也许对3年社招的同学有所帮助。 本文