C# 透過 正則表達式(正規表示式) 計算 中英數字的實際寬度(中文算2個字)

C# 透過 正則表達式(正規表示式) 計算 中英數字的實際寬度(中文算2個字)

C# 透過 正則表達式(正規表示式) 計算 中英數字的實際寬度(中文算2個字)


資料來源: https://blog.typeart.cc/JavaScript%E8%A8%88%E7%AE%97%E5%90%AB%E4%B8%AD%E8%8B%B1%E6%96%87%E5%AD%97%E7%9A%84%E5%AD%97%E4%B8%B2%E9%95%B7%E5%BA%A6/


Code

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;

namespace ConsoleApplication1
{
    class Program
    {
        static void pause()
        {
            Console.WriteLine("\nPress any key to terminate...");
            Console.ReadKey();
        }

        static int Wlen(String str)
        {
            string result = Regex.Replace(str, "[^\x00-\xff]", "xx");
            //x00~xff: ASCII code(0~255)
            //^: 正則取反向
            //所以只要非英數和英數標點符號 都從一個字變成兩個字
            return result.Length;
        }

        static void Main(string[] args)
        {
            Console.WriteLine("中文abc000".Length);
            Console.WriteLine(Wlen("中文abc000"));
            
            pause();

            /*Ans:
            5
            7

            Press any key to terminate...
            */
        }
    }
}


PS.正規表示式/ 正規表達式教學

. 點,匹配任何字符
^ 開始錨,匹配字符串的開頭
$ 結束錨,匹配字符串的結尾
* 星號,匹配零個或多個(貪婪)
+ 加號,匹配一個或多個(貪婪)
? 問題,匹配零或一(非貪婪)
[abc] 字符類,如果{‘a’,’b’,’c’}中的一個匹配則匹配
[^abc] 反相的類,如果不是{‘a’,’b’,’c’}中的一個,則匹配。注意:此功能當前在某些字符範圍內無效!
[a-zA-Z] 字符範圍,範圍的字符集{a-z | A-Z}
\s 空格,\t \f \r \n \v和空格
\S 非空白
\w 字母數字,[a-zA-Z0-9_]
\W 非字母數字
\d 位數字,[0-9]
\D 非數字

. Dot, matches any character
^ Start anchor, matches beginning of string
$ End anchor, matches end of string
* Asterisk, match zero or more (greedy)
+ Plus, match one or more (greedy)
? Question, match zero or one (non-greedy)
[abc] Character class, match if one of {‘a’, ‘b’, ‘c’}
[^abc] Inverted class, match if NOT one of {‘a’, ‘b’, ‘c’} NOTE: This feature is currently broken for some usage of character ranges!
[a-zA-Z] Character ranges, the character set of the ranges { a-z | A-Z }
\s Whitespace, \t \f \r \n \v and spaces
\S Non-whitespace
\w Alphanumeric, [a-zA-Z0-9_]
\W Non-alphanumeric
\d Digits, [0-9]
\D Non-digits 

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *