今天我学了什么

ADoyle 的碎片化知识笔记。 博观而约取,厚积而薄发。

TagsRSSGithub

关系图谱

首页

❯

Linux

判断文件编码

创建时间:2018/12/29更新时间:2018/12/2968 个字1分钟读完

比如文件是用 utf-8 写的,还是 gb2312。

解决方案:

  1. 用 file -I 命令看文件字符集是什么
  2. 这个文档列举了很多文件编码的特定标识。可以读文件头里的二进制去分析。

现成的库:

  • https://github.com/chardet/chardet
  • https://github.com/aadsm/jschardet

关系图谱

Copyright 2016-Now ADoyle (adoyle.h@gmail.com). All Rights Reserved. ADoyle 保留所有权力。
转载本站文字需要注明署名和来源链接。版权归 ADoyle 所有。如有违反,虽远必诛。
本站源码 adoyle-h/Today-I-Learned。觉得好请点个 Star。
若有意见或问题,请你发到讨论区,并遵守我的交流规约。