1 2BEGIN { 3 unless ("A" eq pack('U', 0x41)) { 4 print "1..0 # Unicode::Normalize " . 5 "cannot stringify a Unicode code point\n"; 6 exit 0; 7 } 8} 9 10BEGIN { 11 if ($ENV{PERL_CORE}) { 12 chdir('t') if -d 't'; 13 @INC = $^O eq 'MacOS' ? qw(::lib) : qw(../lib); 14 } 15} 16 17######################### 18 19use Test; 20use strict; 21use warnings; 22BEGIN { plan tests => 31 }; 23use Unicode::Normalize; 24ok(1); # If we made it this far, we're ok. 25 26sub _pack_U { Unicode::Normalize::pack_U(@_) } 27sub _unpack_U { Unicode::Normalize::unpack_U(@_) } 28 29######################### 30 31ok(NFC(""), ""); 32ok(NFD(""), ""); 33 34sub hexNFC { 35 join " ", map sprintf("%04X", $_), 36 _unpack_U NFC _pack_U map hex, split ' ', shift; 37} 38sub hexNFD { 39 join " ", map sprintf("%04X", $_), 40 _unpack_U NFD _pack_U map hex, split ' ', shift; 41} 42 43ok(hexNFC("0061 0315 0300 05AE 05C4 0062"), "00E0 05AE 05C4 0315 0062"); 44ok(hexNFC("00E0 05AE 05C4 0315 0062"), "00E0 05AE 05C4 0315 0062"); 45ok(hexNFC("0061 05AE 0300 05C4 0315 0062"), "00E0 05AE 05C4 0315 0062"); 46ok(hexNFC("0045 0304 0300 AC00 11A8"), "1E14 AC01"); 47ok(hexNFC("1100 1161 1100 1173 11AF"), "AC00 AE00"); 48ok(hexNFC("1100 0300 1161 1173 11AF"), "1100 0300 1161 1173 11AF"); 49 50ok(hexNFD("0061 0315 0300 05AE 05C4 0062"), "0061 05AE 0300 05C4 0315 0062"); 51ok(hexNFD("00E0 05AE 05C4 0315 0062"), "0061 05AE 0300 05C4 0315 0062"); 52ok(hexNFD("0061 05AE 0300 05C4 0315 0062"), "0061 05AE 0300 05C4 0315 0062"); 53ok(hexNFC("0061 05C4 0315 0300 05AE 0062"), "0061 05AE 05C4 0300 0315 0062"); 54ok(hexNFC("0061 05AE 05C4 0300 0315 0062"), "0061 05AE 05C4 0300 0315 0062"); 55ok(hexNFD("0061 05C4 0315 0300 05AE 0062"), "0061 05AE 05C4 0300 0315 0062"); 56ok(hexNFD("0061 05AE 05C4 0300 0315 0062"), "0061 05AE 05C4 0300 0315 0062"); 57ok(hexNFC("0000 0041 0000 0000"), "0000 0041 0000 0000"); 58ok(hexNFD("0000 0041 0000 0000"), "0000 0041 0000 0000"); 59 60ok(hexNFC("AC00 11A7"), "AC00 11A7"); 61ok(hexNFC("AC00 11A8"), "AC01"); 62ok(hexNFC("AC00 11A9"), "AC02"); 63ok(hexNFC("AC00 11C2"), "AC1B"); 64ok(hexNFC("AC00 11C3"), "AC00 11C3"); 65 66# Test Cases from Public Review Issue #29: Normalization Issue 67# cf. http://www.unicode.org/review/pr-29.html 68ok(hexNFC("0B47 0300 0B3E"), "0B47 0300 0B3E"); 69ok(hexNFC("1100 0300 1161"), "1100 0300 1161"); 70 71ok(hexNFC("0B47 0B3E 0300"), "0B4B 0300"); 72ok(hexNFC("1100 1161 0300"), "AC00 0300"); 73 74ok(hexNFC("0B47 0300 0B3E 0327"), "0B47 0300 0B3E 0327"); 75ok(hexNFC("1100 0300 1161 0327"), "1100 0300 1161 0327"); 76 77# NFC() should be unary. 78my $str11 = _pack_U(0x41, 0x0302, 0x0301, 0x62); 79my $str12 = _pack_U(0x1EA4, 0x62); 80ok(NFC $str11 eq $str12); 81 82# NFD() should be unary. 83my $str21 = _pack_U(0xE0, 0xAC00); 84my $str22 = _pack_U(0x61, 0x0300, 0x1100, 0x1161); 85ok(NFD $str21 eq $str22); 86 87