unicode转中文

Unicode中文编码包括中日韩统一表意文字(汉字)的所有编码。基本汉字从 U+4E00 至 U+9FFF,另有扩展区A-F,主要是生辟字和甲骨文异体字等Unicode中文相关查看 Unicode中文编码范围 。Unicode编码基础知识查看unicode编码是什么?

结果:

使用说明:

Unicode编码: 将中文或其他字符根据所选“编码格式”转换为Unicode编码

Unicode解码: 将Unicode编码转换回原始文本,如果原文非Unicode编码则提示错误

支持格式: Unicode:\u6D4B (通用)、U+6D4B (十六进制)、27979 (十进制) 等多种格式

Unicode中文编码范围

  • 基本汉字:U+4E00 至 U+9FFF
  • 扩展A区:U+3400 至 U+4DBF; 扩展A区定义‌:称为 ‌CJK Unified Ideographs Extension A‌(中日韩统一表意文字扩展A区),主要收录 ‌《康熙字典》中的生僻字、方言字、异体字‌,以及部分日本、韩国专用汉字。特点‌:包含 ‌6,582个字符‌,覆盖 ‌U+3400–U+4DBF‌。首次发布于 Unicode 3.0(1999年),补充基本汉字区未覆盖的字符。‌常见示例‌:生僻字:㐀(U+3400)、㙉(U+3649)方言字:㑳(U+3473,粤语用字)古汉字:㐬(U+342C,古“流”字)
  • 扩展B-F区:U+20000 至 U+2FA1F; ‌1. 扩展B区(U+20000–U+2A6DF)‌收录 ‌42,711个字符‌(Unicode 3.1,2001年),包含:大型字典字(如《汉语大字典》未收录字)历史文献中的异体字(如甲骨文、金文隶定字)示例:𠀀(U+20000)、𪚥(U+2A6A5,四龙叠字)‌2. 扩展C区(U+2A700–U+2B73F)收录 ‌4,149个字符‌(Unicode 5.2,2009年),包括:古代姓氏、地名用字示例:𪜀(U+2A700)‌3. 扩展D-G区(U+2B740–U+2FA1F)‌逐步新增至 Unicode 13.0(2020年),包含:少数民族文字(如女书、西夏文补充字)古籍文献中的罕见异体字示例:𫝀(U+2B700)、你(U+2F804)

如何判定Unicode编码是中文还是日文?

官方有解释

Unicode中文汉字编码表,中文编码对照表

Unicode官方提供的中日韩汉字Unicode编码表: https://www.unicode.org/charts/PDF/U4E00.pdf

Unicode官方网站

home.unicode.org