Q: 二进制文件和文本文件有什么区别?
A: 所有文件都可以分类为两种文件格式之一-二进制或文本。 两种文件类型在表面上看起来可能相同,但是它们 编码 数据不同。 虽然两者 二进制 和文本文件包含以一系列位(1和0的二进制值)存储的数据, 位 文本文件中的字符表示字符,而二进制文件中的位表示自定义 数据.
二进制文件
二进制文件通常包含一系列 字节,或八种有序分组 位。 在为程序创建自定义文件格式时,开发人员会将这些字节排列为存储应用程序必需信息的格式。 二进制文件格式可以在同一文件中包括多种类型的数据,例如图像,视频和音频数据。 可以通过支持程序来解释此数据,但这些数据将在文本编辑器中显示为乱码。 下面是一个例子 PNG。 在图像查看器和文本编辑器中打开的图像文件。
图像浏览器 | 文本编辑器 |
---|---|
如您所见,图像查看器会识别二进制数据并显示图片。 在文本编辑器中打开图像时,二进制数据将转换为无法识别的文本。 但是,您可能会注意到某些文本是可读的。 这是因为PNG格式包括用于存储文本数据的小部分。 文本编辑器虽然不旨在读取此文件格式,但在打开文件时仍显示此文本。 许多其他二进制文件类型也包括可读文本部分。 因此,有可能通过在文本编辑器中打开有关未知二进制文件类型的信息来找到一些信息。
二进制文件通常包含标头,标头是标识文件内容的文件开头的数据字节。 标头通常包含文件类型和其他描述性信息。 例如,在上面的图像中,“ PNG”文本表示文件是PNG图像。 如果文件包含无效的头信息,则软件程序可能无法打开该文件,或者可能会报告该文件已损坏。
文本文件
文本文件比二进制文件更具限制性,因为它们只能包含文本数据。 但是,与二进制文件不同,它们不太可能损坏。 虽然二进制文件中的小错误可能会使它无法读取,但打开文件后,文本文件中的小错误可能会简单地显示出来。 这是Microsoft切换到基于压缩文本的原因之一 XML 的格式 Office 2007文件类型.
文本文件可以保存在 纯文本 (TXT。)格式和 富文本 (RTF。)格式。 一个典型的纯文本文件包含几行文本,每行后跟一个行尾(EOL)字符。 文件结束(EOF)标记位于最后一个字符之后,表示文件结束。 富文本文件使用类似的文件结构,但也可以包含文本样式(例如,粗体和斜体)以及页面格式信息。 纯文本文件和富文本文件都包含(字符编码|字符编码)方案,该方案确定如何解释字符以及可以显示哪些字符。
由于文本文件使用简单的标准格式,因此许多程序都可以读取和编辑文本文件。 共同 文字编辑器 包括与Windows捆绑在一起的Microsoft记事本和写字板,以及Mac OS X随附的Apple TextEdit。
未知文件
如果遇到未知的文件类型,请先查找 文件扩展名 在m33.wiki上。 如果文件没有扩展名或无法找到文件类型,则可以尝试在文本编辑器中打开文件。 如果该文件打开并显示完全可读的文本,则它是您已成功打开的文本文件。
如果文件打开并显示大部分乱码的文本,则它是一个二进制文件。 虽然并非一定要在文本编辑器中打开文件,但文本中可能有一些线索可以揭示有关文件类型的信息,例如上面的PNG示例。 这可以帮助您确定正确打开文件所需的程序。 最后,如果该文件无法在文本编辑器中打开,则它是一个二进制文件,只能由相应的程序打开。
更新:12月21,2011