]> the.earth.li Git - unicode-expand.git/commitdiff
Collect Unicode expansions together main
authorJonathan McDowell <noodles@earth.li>
Wed, 14 Aug 2019 19:05:51 +0000 (20:05 +0100)
committerJonathan McDowell <noodles@earth.li>
Wed, 14 Aug 2019 19:05:51 +0000 (20:05 +0100)
When multiple Unicode characters exist together expand them all at the
end rather than breaking up what might potentially be "Unicode art".

Fixes: #1
unicode-expand.pl

index d81948cadfa7efa27869d305625959ed6def15d4..a46f6b5813148fa902e29097986b28d60c3581d7 100644 (file)
@@ -55,19 +55,28 @@ sub expand_topic {
 }
 
 sub expand_char {
 }
 
 sub expand_char {
-    my ($char) = @_;
+    my ($string) = @_;
 
 
-    my $name = charnames::viacode(ord $1);
-    $name = sprintf("{%X}", ord $1) unless defined($name);
+    my $expansion = "";
 
 
-    return $name;
+    for my $c (split //,$string) {
+        my $name = charnames::viacode(ord $c);
+        $name = sprintf("{%X}", ord $c) unless defined($name);
+        if (length($expansion) == 0) {
+            $expansion .= $name;
+        } else {
+            $expansion .= "; " . $name;
+        }
+    }
+
+    return $expansion;
 }
 
 sub expand {
     my ($server, $target, $data) = @_;
 
     $data = decode_utf8($data);
 }
 
 sub expand {
     my ($server, $target, $data) = @_;
 
     $data = decode_utf8($data);
-    $data =~ s{([^\p{Letter}\p{Punctuation}\p{Control}\p{Space}\p{Sc}[:ascii:]])}{
+    $data =~ s{([^\p{Letter}\p{Punctuation}\p{Control}\p{Space}\p{Sc}[:ascii:]]+)}{
         "${1} [".expand_char($1)."]"
     }ge;
 
         "${1} [".expand_char($1)."]"
     }ge;