我需要统计一下字符串的行数,因此我就写了一个超级没有技术含量的蛮力方法来统计了。
- staticlongLinesCount(strings)
- {
- longcount = 0;
- intposition = 0;
- while((position = s.IndexOf(' ', position)) != -1)
- {
- count++;
- position++; //Skip this occurance!
- }
- returncount;
- }
这个函数他呀,运行正常,写起来也快。
但是,我就像啊,这是不是也太没有技术含量了,难道就没有其他方法了?
当然有,我想出了两种方法:正则和Linq,我把这些方法都写出来
- staticlongLinesCountIndexOf(strings)
- {
- longcount = 0;
- intposition = 0;
- while((position = s.IndexOf(' ', position)) != -1)
- {
- count++;
- position++; //Skip this occurance!
- }
- returncount;
- }
- staticRegex r = newRegex(" ", RegexOptions.Multiline);
- staticlongLinesCountRegex(strings)
- {
- MatchCollection mc = r.Matches(s);
- returnmc.Count;
- }
- staticlongLinesCountLinq(strings)
- {
- return(fromch ins
- wherech== ' '
- selectch).Count();
- }
- staticlongLinesCountSplit(strings)
- {
- return(s.Split(newchar[] { ' '})).Length;
- }
然后呢,我又写了一个快速但混乱的毫无技术含量的测试程序来测试正确性
- strings = File.ReadAllText(@"D:TempMyLargeTextFile.txt");
- longindex = LinesCountIndexOf(s);
- longregex = LinesCountRegex(s);
- longlinq= LinesCountLinq(s);
- Console.WriteLine("{0}:{1}:{2}", index, regex, linq);
- Stopwatch si = newStopwatch();
- Stopwatch sd = newStopwatch();
- Stopwatch sl = newStopwatch();
- Stopwatch ss = newStopwatch();
- si.Start();
- for(inti = 0;i <100;i++)
- {
- index = LinesCountIndexOf(s);
- }
- si.Stop();
- ss.Start();
- for(inti = 0;i <100;i++)
- {
- index = LinesCountSplit(s);
- }
- ss.Stop();
- sd.Start();
- for(inti = 0;i <100;i++)
- {
- index = LinesCountRegex(s);
- }
- sd.Stop();
- sl.Start();
- for(inti = 0;i <100;i++)
- {
- index = LinesCountLinq(s);
- }
- sl.Stop();
输入的文件是1.64Mb,包含大约23K行。
测试结果显示是
22777:22777:22777
有意思的是这个执行时间的结果(ms计)
Test ElapsedMilliseconds
BF+I 181
Split 1089
Regex 2557
Linq 3590
我本来想着这正则要快的不是一点点啊。正则和Linq这么大的差异令我震惊了,最令我震惊的是BF+I竟然比他们两个都快,而分割则毫无疑问比Index要慢,因为在分割方法中.net一次要分配23k的字符串空间
为了完成任务,我把BF+I版本重写了一个类,并且判断了字符串只有一行的情况,如你期望的一样,不要一秒就完成了
- staticclassExtensionMethods
- {
- ///<summary>
- ///Returns the number of lines in a string///</summary>
- ///<param name="s"></param>
- ///<returns></returns>
- publicstaticlongLines(thisstrings)
- {
- longcount = 1;
- intposition = 0;
- while((position = s.IndexOf(' ', position)) != -1)
- {
- count++;
- position++; //Skip this occurance!
- }
- returncount;
- }
- }
注:count初始为1后,时间更短了一些。
Test ElapsedMilliseconds
BF+I 170
Split 1089
Regex 2063
Linq 3583
完成。。
原文链接:http://www.cnblogs.com/lazycoding/archive/2012/01/09/2317552.html
【编辑推荐】