WinRT開發(fā)的功能和效率
這里我選擇運行計算復(fù)雜度較高的算法作為測試方法,雖然不能代表全部,但 是很大程度上展示大家平時開發(fā)過程中所面臨的常見場景 和問題。考慮到演示和 理解,就選擇了查找100000以內(nèi)的所有素數(shù)的個數(shù)的算法作為演示。另外也順帶演 示如何在WinRT下實現(xiàn)多編程語言和技 術(shù)之間的協(xié)作吧。
關(guān)于基本知識和算法吧詳細的說明,請自行搜索各大引擎吧(關(guān)鍵 詞:prime、素數(shù)),這里我就列舉在各個語言下我的簡單實現(xiàn)吧,其中包括使用 普通算法和并 行計算的兩個版本。
***部分,從目前.NET主流來看吧,以C# 為例,普通版本,這個沒什么多說的,就是從前往后看某個數(shù)是不是素數(shù):
- private static int
- CountingInternal(int n)
- {
- var numprimes = 1;
- for (var i = 3; i <= n; i += 2)
- {
- var isPrime = true;
- var limit = Math.Ceiling(Math.Sqrt(i)) + 1;
- for (var j = 3; j < limit; j += 2)
- {
- if (i%j == 0)
- {
- isPrime = false;
- break;
- }
- }
- if (isPrime)
- {
- numprimes++;
- }
- }
- return numprimes;
- }
并行版本稍微復(fù)雜一點點,選擇Parallel.For來并行執(zhí)行一個從1至n/2的并行 循環(huán)(我這里偷懶了一下,沒有處理奇 偶數(shù)的情況,因為我的調(diào)用時傳入的都是 偶數(shù)),發(fā)現(xiàn)是素數(shù),使用Interlocked輔助方法給計數(shù)增加1。
- private static int
- CountingParallel(int n)
- {
- var numprimes = 1;
- Parallel.For(1, n/2, i =>
- {
- if (IsPrime(i*2 + 1))
- {
- Interlocked.Increment(ref numprimes);
- }
- });
- return numprimes;
- }
- public static bool IsPrime(int n)
- {
- if (n%2 == 0)
- return false;
- var limit = (int) (Math.Ceiling(Math.Sqrt(n)) + 1);
- for (var i = 3; i < limit; i += 2)
- {
- if (n%i == 0)
- {
- return false;
- }
- }
- return true;
- }
***種場景,直接嵌入算法到C# WinRT App工程,執(zhí)行結(jié)果如下(單位毫 秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 14.0299 | 9.0005 | 9.1825 | 8.0021 | 11.0181 |
并行 | 6.0008 | 2.0004 | 2.9993 | 2.0014 | 3.999 |
第二種場景,將C#算法包裝在一個類庫里(注意 是CLR類庫,只能在C#/VB直接通用),在C# WinRT App工程中調(diào)用這個類庫,執(zhí)行 結(jié)果如下(單位毫秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 12.0299 | 9.0019 | 10.003 | 9.0014 | 9.00017 |
并行 | 6.0008 | 2 | 3.0003 | 2.9997 | 1.9995 |
第三種場景,將C#算法包裝到一個Windows Runtime Component(WRC)中,在C# WinRT App工程中調(diào)用這個WRC類庫,執(zhí)行結(jié) 果如下(單位毫秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 11.9904 | 9.0032 | 9 | 9。0028 | 9.00149 |
并行 | 6.0008 | 1.9817 | 1.9985 | 1.9993 | 2 |
第四種場景,將C#算法包裝到一個Windows Runtime Component(WRC)中,在WinJS App工程中調(diào)用這個WRC類庫,執(zhí)行結(jié)果如 下(單位毫秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 11 | 9 | 8 | 9 | 8 |
并行 | 4 | 1 | 1 | 3 | 2 |
小結(jié):以上是從.NET角度來進行的比較,很容易 看出***次CLR加載在這里性能損耗表現(xiàn)的很明顯,完成加載之后性能將穩(wěn)定在一 定范 圍內(nèi)波動;另外,并行計算在純算法的應(yīng)用中有很明顯的性能優(yōu)勢。
第二部分,接下來我們回歸Native環(huán)境,這里我 依然使用普通和并行計算兩種來嘗試,普通的依然沒什么可說的(實際上和C#的沒 區(qū) 別,除了關(guān)鍵字不一樣)。
- static int CountingInternal(int n)
- {
- auto numprimes = 1;
- for (auto i = 3; i <= n; i += 2)
- {
- auto isPrime = true;
- auto limit = ceil(sqrt(i)) + 1;
- for (auto j = 3; j < limit; j += 2)
- {
- if (i%j == 0)
- {
- isPrime = false;
- break;
- }
- }
- if (isPrime)
- {
- numprimes++;
- }
- }
- return numprimes;
- }
- static bool IsPrime(int n)
- {
- if (n%2 == 0)
- return false;
- auto limit = (int) (ceil(sqrt(n)) + 1);
- for(auto i=3; i<limit; i+=2)
- {
- if(n%i == 0)
- {
- return false;
- }
- }
- return true;
- }
- static int CountingParallel(int n)
- {
- auto numprimes = 1;
- parallel_for(1, n/2, [&](int i)
- {
- if(IsPrime(i*2+1))
- {
- InterlockedIncrement((volatile unsigned long*)&numprimes);
- }
- });
- return numprimes;
- }
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 8.0019 | 7.9991 | 8.0209 | 8.9843 | 8.0181 |
并行 | 1.9794 | 1.998 | 1.9994 | 1.984 | 2.0003 |
第二種場景,將C++算法包裝在DLL中,在C++ WinRT App中使用,執(zhí)行結(jié)果如下(單位毫秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 9 | 9 | 9 | 8 | 9 |
并行 | 3 | 2 | 3 | 2 | 2 |
第三種場景,將C++算法包裝在動態(tài)連接庫Dll中,在C# WinRT App中通過 PInvoke來調(diào)用,執(zhí)行結(jié)果如下(單位毫秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 9 | 9 | 8 | 9 | 9 |
并行 | 3 | 2 | 3 | 2 | 3 |
第四種場景,將C++算法包裝在靜態(tài)鏈接庫Lib中,在C++ WinRT App中調(diào)用,執(zhí) 行結(jié)果如下(單位毫秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 8 | 8 | 8 | 9 | 9 |
并行 | 2 | 3 | 3 | 2 | 3 |
第五種場景,將C++算法包裝在Windows Runtime Component(WRC)中,在C# WinRT App中調(diào)用,執(zhí)行結(jié)果如下(單位毫秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 8.0014 | 8.0191 | 8.0293 | 8.0019 | 9.0291 |
并行 | 1.9994 | 1.9999 | 1.998 | 1.9994 | 2.99982 |
第六種場景,將Windows Runtime Component(WRC)中,在WinJS App中調(diào)用, 執(zhí)行結(jié)果如下(單位毫秒):
執(zhí)行次數(shù) | 1(啟動) | 2 | 3 | 4 | 5 |
普通 | 9 | 8 | 9 | 8 | 8 |
并行 | 2 | 2 | 3 | 2 | 3 |
第七種場景是將C++算法包裝在Windows Runtime Library(WRL,基于COM的底 層開發(fā))中,然后在任何一種WinRT App中調(diào)用,可以預(yù)見這是一種很強大的方 式,但同時也是最費解的一種方式,我成功的包裝了普通算法的COM版,但是嘗試 了很長時間不能成功實現(xiàn)并行運算 的版本,也就放棄在這里展示了,如果你知道 如何在WRL中實現(xiàn)并行計算并返回 IAsyncOperation<T>,請不吝賜教?!?/p>
小結(jié):基于C++的實現(xiàn)在適用性、穩(wěn)定性和執(zhí)行效率上無可挑剔,如果對于所有 細節(jié)(包括***次啟動)的效率考慮,C++是優(yōu)先 的;如果考慮到C++的復(fù)雜度, 如果項目對性能要求可以適當(dāng)放松但對進度要求很高的時候,選擇CLR會比較容易 控制的;如果原來已有的Web項目 向WinRT遷移,那么前段展示則可以考慮使用 WinJS+HTML來實現(xiàn),后臺算法根據(jù)需要選擇C++或者CLR。
第三部分,如果所有的算法全部運行在 JavaScript中,那么其性能如何呢?這里我先買個關(guān)子,留待你自己去探究和發(fā) 掘。
總結(jié),WinRT在編程語言的選擇性上有著非常好的 靈活性,在做選擇的時候需要充分考慮自己的要求,比如性能、比如工期、比如經(jīng) 驗等 等。對于全新項目,在有經(jīng)驗的情況下,追求***性能的首先首當(dāng)其沖是 C++,如果考慮到經(jīng)驗和掌控,可以選擇使用C++做底層,選擇相對容易上手 的 C#/VB或者HTML+JS做界面的方法;如果項目工期要求很緊,或者從老系統(tǒng)遷移,那 么這時候更多的考慮是使用已有資源,直到性能瓶頸的時 候才采取措 施——以C++重寫性能瓶頸來解決,當(dāng)然,如果沒有C++經(jīng)驗,也可以考 慮使用C#/VB來 實現(xiàn)WRC以包裝核心邏輯,從而提升運行效率。
附以上測試源代碼和測試工程,點擊這里下載。
原文鏈接:http://www.cnblogs.com/powertoolsteam/archive/2013/02/19/2916855.html