1
2BEGIN {
3    unless ("A" eq pack('U', 0x41)) {
4	print "1..0 # Unicode::Normalize " .
5	    "cannot stringify a Unicode code point\n";
6	exit 0;
7    }
8}
9
10BEGIN {
11    if ($ENV{PERL_CORE}) {
12        chdir('t') if -d 't';
13        @INC = $^O eq 'MacOS' ? qw(::lib) : qw(../lib);
14    }
15}
16
17#########################
18
19use Test;
20use strict;
21use warnings;
22BEGIN { plan tests => 31 };
23use Unicode::Normalize;
24ok(1); # If we made it this far, we're ok.
25
26sub _pack_U   { Unicode::Normalize::pack_U(@_) }
27sub _unpack_U { Unicode::Normalize::unpack_U(@_) }
28
29#########################
30
31ok(NFC(""), "");
32ok(NFD(""), "");
33
34sub hexNFC {
35  join " ", map sprintf("%04X", $_),
36  _unpack_U NFC _pack_U map hex, split ' ', shift;
37}
38sub hexNFD {
39  join " ", map sprintf("%04X", $_),
40  _unpack_U NFD _pack_U map hex, split ' ', shift;
41}
42
43ok(hexNFC("0061 0315 0300 05AE 05C4 0062"), "00E0 05AE 05C4 0315 0062");
44ok(hexNFC("00E0 05AE 05C4 0315 0062"),      "00E0 05AE 05C4 0315 0062");
45ok(hexNFC("0061 05AE 0300 05C4 0315 0062"), "00E0 05AE 05C4 0315 0062");
46ok(hexNFC("0045 0304 0300 AC00 11A8"), "1E14 AC01");
47ok(hexNFC("1100 1161 1100 1173 11AF"), "AC00 AE00");
48ok(hexNFC("1100 0300 1161 1173 11AF"), "1100 0300 1161 1173 11AF");
49
50ok(hexNFD("0061 0315 0300 05AE 05C4 0062"), "0061 05AE 0300 05C4 0315 0062");
51ok(hexNFD("00E0 05AE 05C4 0315 0062"),      "0061 05AE 0300 05C4 0315 0062");
52ok(hexNFD("0061 05AE 0300 05C4 0315 0062"), "0061 05AE 0300 05C4 0315 0062");
53ok(hexNFC("0061 05C4 0315 0300 05AE 0062"), "0061 05AE 05C4 0300 0315 0062");
54ok(hexNFC("0061 05AE 05C4 0300 0315 0062"), "0061 05AE 05C4 0300 0315 0062");
55ok(hexNFD("0061 05C4 0315 0300 05AE 0062"), "0061 05AE 05C4 0300 0315 0062");
56ok(hexNFD("0061 05AE 05C4 0300 0315 0062"), "0061 05AE 05C4 0300 0315 0062");
57ok(hexNFC("0000 0041 0000 0000"), "0000 0041 0000 0000");
58ok(hexNFD("0000 0041 0000 0000"), "0000 0041 0000 0000");
59
60ok(hexNFC("AC00 11A7"), "AC00 11A7");
61ok(hexNFC("AC00 11A8"), "AC01");
62ok(hexNFC("AC00 11A9"), "AC02");
63ok(hexNFC("AC00 11C2"), "AC1B");
64ok(hexNFC("AC00 11C3"), "AC00 11C3");
65
66# Test Cases from Public Review Issue #29: Normalization Issue
67# cf. http://www.unicode.org/review/pr-29.html
68ok(hexNFC("0B47 0300 0B3E"), "0B47 0300 0B3E");
69ok(hexNFC("1100 0300 1161"), "1100 0300 1161");
70
71ok(hexNFC("0B47 0B3E 0300"), "0B4B 0300");
72ok(hexNFC("1100 1161 0300"), "AC00 0300");
73
74ok(hexNFC("0B47 0300 0B3E 0327"), "0B47 0300 0B3E 0327");
75ok(hexNFC("1100 0300 1161 0327"), "1100 0300 1161 0327");
76
77# NFC() should be unary.
78my $str11 = _pack_U(0x41, 0x0302, 0x0301, 0x62);
79my $str12 = _pack_U(0x1EA4, 0x62);
80ok(NFC $str11 eq $str12);
81
82# NFD() should be unary.
83my $str21 = _pack_U(0xE0, 0xAC00);
84my $str22 = _pack_U(0x61, 0x0300, 0x1100, 0x1161);
85ok(NFD $str21 eq $str22);
86
87