打字猴:1.700443046e+09

1700443046

1700443047 for（String str：strs）{

1700443048

1700443049 System.out.println（（++i）+”、”+str）；

1700443050

1700443051 }

1700443052

1700443053 }

1700443054

1700443055 输出结果如下：

1700443056

1700443057 1、李四（L）

1700443058

1700443059 2、王五（W）

1700443060

1700443061 3、张三（Z）

1700443062

1700443063 这确实是我们期望的结果，应该举杯庆贺了吧！但是且慢，中国的汉字博大精深，Java是否都能精确的排序呢？最主要的一点是汉字中有象形文字，音形分离，是不是每个汉字都能按照拼音的顺序排列好呢？我们写一个复杂的汉字来看看：

1700443064

1700443065 public static void main（String[]args）throws Exception{

1700443066

1700443067 String[]strs={“犇（B）”，“鑫（X）”}；

1700443068

1700443069 Arrays.sort（strs, Collator.getInstance（Locale.CHINA））；

1700443070

1700443071 int i=0；

1700443072

1700443073 for（String str：strs）{

1700443074

1700443075 System.out.println（（++i）+”、”+str）；

1700443076

1700443077 }

1700443078

1700443079 }

1700443080

1700443081 三个牛“犇”读bēn，三个金“鑫”读xīn，这两个字经常出现在饭店和商店的名称上，我们来看排序的输出结果：

1700443082

1700443083 1、鑫（X）

1700443084

1700443085 2、犇（B）

1700443086

1700443087 输出结果又乱了！不要责怪Java，它已经尽量为我们考虑了，只是因为我们的汉字文化太博大精深了，要做好这个排序确实有点难为它。更深层次的原因是Java使用的是UNICODE编码，而中文UNICODE字符集是来源于GB18030的，GB18030又是从GB2312发展起来，GB2312是一个包含了7000多个字符的字符集，它是按照拼音排序，并且是连续的，之后的GBK、GB18030都是在其基础上扩充出来的，所以要让它们完整排序也就难上加难了。

1700443088

1700443089 如果是排序对象是经常使用的汉字，使用Collator类排序完全可以满足我们的要求，毕竟GB2312已经包含了大部分的汉字，如果需要严格排序，则要使用一些开源项目来自己实现了，比如pinyin4j可以把汉字转换为拼音，然后我们自己来实现排序算法，不过此时你也会发现要考虑诸如算法、同音字、多音字等众多问题。

1700443090

1700443091 注意　如果排序不是一个关键算法，使用Collator类即可。

1700443092

1700443093

1700443094

1700443095

[ 上一页 ] [ :1.700443046e+09 ] [ 下一页 ]