【问题标题】:Why does Mono run 1/3 slower on Linux and BSD?为什么 Mono 在 Linux 和 BSD 上运行速度要慢 1/3?
【发布时间】:2013-10-31 19:06:19
【问题描述】:

编辑:在第二篇文章中查看下面更好的基准!!!

我在(Win8.1、Linux、BSD 和 OSX)上使用 .NET 4.5 与 Mono 3.2.x 进行了一些性能测试。

注意:这些测试是使用 Mono x86 或 .NET x86 架构编译的。他们没有在 Virtual Box 中运行。测试计算机使用本地运行的“Win8/Linux/BSD”进行三次启动,Mac 使用“OSX/Win7”进行双重启动。另请注意,“WIN32”编译器指令仅在 Win8/Win7 上用于“TimeBeginPeriod”,以强制 Windows 中的秒表准确度。 Linux/BSD/OSX 不需要这个,但 windows 需要。

这里是测试代码

using System;
using System.Collections.Generic;
using System.Text;
using System.Threading.Tasks;
using System.Diagnostics;

using numf = System.Single;
using numi = System.Int32;

#if WIN32
using System.Runtime.InteropServices;
#endif

namespace Benchmarks
{
    struct Vector4
    {
        public numf X, Y, Z, W;

        public static Vector4 operator+(Vector4 p1, Vector4 p2)
        {
            p1.X += p2.X;
            p1.Y += p2.Y;
            p1.Z += p2.Z;
            p1.W += p2.W;
            return p1;
        }

        public static Vector4 operator-(Vector4 p1, Vector4 p2)
        {
            p1.X -= p2.X;
            p1.Y -= p2.Y;
            p1.Z -= p2.Z;
            p1.W -= p2.W;
            return p1;
        }

        public static Vector4 operator*(Vector4 p1, Vector4 p2)
        {
            p1.X *= p2.X;
            p1.Y *= p2.Y;
            p1.Z *= p2.Z;
            p1.W *= p2.W;
            return p1;
        }

        public static Vector4 operator/(Vector4 p1, Vector4 p2)
        {
            p1.X /= p2.X;
            p1.Y /= p2.Y;
            p1.Z /= p2.Z;
            p1.W /= p2.W;
            return p1;
        }

        public override string ToString()
        {
            return string.Format("{0}, {1}, {2}, {3}", X, Y, Z, W);
        }
    }

    class Program
    {
        #if WIN32
        [StructLayout(LayoutKind.Sequential)]
        public struct TimeCaps
        {
            public uint wPeriodMin;
            public uint wPeriodMax;
        }

        private static TimeCaps caps;

        [DllImport("winmm.dll", EntryPoint="timeGetDevCaps", SetLastError=true)]
        public static extern uint TimeGetDevCaps(ref TimeCaps timeCaps, uint sizeTimeCaps);

        [DllImport("winmm.dll", EntryPoint="timeBeginPeriod", SetLastError=true)]
        public static extern uint TimeBeginPeriod(uint uMilliseconds);

        [DllImport("winmm.dll", EntryPoint="timeEndPeriod", SetLastError=true)]
        public static extern uint TimeEndPeriod(uint uMilliseconds);

        public static void OptimizedMode()
        {
            caps = new TimeCaps();
            if (TimeGetDevCaps(ref caps, (uint)System.Runtime.InteropServices.Marshal.SizeOf(caps)) != 0)
            {
                Console.WriteLine("StopWatch: TimeGetDevCaps failed");
            }

            if (TimeBeginPeriod(caps.wPeriodMin) != 0)
            {
                Console.WriteLine("StopWatch: TimeBeginPeriod failed");
            }
        }

        public static void EndOptimizedMode()
        {
            if (TimeEndPeriod(caps.wPeriodMin) != 0)
            {
                Console.WriteLine("StopWatch: TimeEndPeriod failed");
            }
        }
        #endif

        static Random random;

        static void Main(string[] args)
        {
            #if WIN32
            OptimizedMode();
            #endif

            random = new Random();
            Console.WriteLine("Enter loop count:");
            Console.WriteLine("999999");
            string value = Console.ReadLine();
            int count;
            if (int.TryParse(value, out count))
            {
                runVector4Test(count);
            }
            else
            {
                Console.WriteLine("Invalide value: " + value);
            }

            #if WIN32
            EndOptimizedMode();
            #endif

            Console.WriteLine("DONE");
            Console.ReadLine();
        }

        static void runVector4Test(int count)
        {
            var values = new Vector4[count];
            const double range = .01;
            for (int i = 0; i != count; ++i)
            {
                values[i].X = (numf)(random.NextDouble() * range) + 1;
                values[i].Y = (numf)(random.NextDouble() * range) + 1;
                values[i].Z = (numf)(random.NextDouble() * range) + 1;
                values[i].W = (numf)(random.NextDouble() * range) + 1;
            }

            Console.WriteLine("Waiting for GC...");
            GC.Collect();
            System.Threading.Thread.Sleep(5000);
            Console.WriteLine("Starting Vector4 Test...");

            var time = new Stopwatch();
            long totalTime = 0;
            Vector4 totalValue = new Vector4();
            for (int i = 0; i != 100; ++i)
            {
                time.Restart();
                for (int i2 = 0; i2 < count-1; ++i2)
                {
                    Vector4 vec1 = values[i2];
                    Vector4 vec2 = values[i2+1];
                    totalValue += vec1;
                    totalValue -= vec2;
                    totalValue /= vec1;
                    totalValue *= vec2;
                }
                time.Stop();
                totalTime += time.ElapsedMilliseconds;
            }

            Console.WriteLine("Vector4 Time: " + (totalTime / 100d));
            Console.WriteLine("Vector4 Values: " + totalValue);
            Console.WriteLine();
        }
    }
}

以下是结果

<<< AMD Athlon 64 X2 Dual Core 4600+ 2.40GHz >>>
{
.NET 4.5 (Win8-Win32) = 39.9 mil

Mono 3.2.3 (Win8-Win32) = 99.49 mil
Mono 3.2.3 (PC-Linux) = 146.87 mil
Mono 3.2.1 (PC-BSD) = 144 mil
}


<<< Intel Core2 Duo P8600 2.40GHz >>>
{
Mono 3.2.3 (OSX 10.9) = 98.54 mil
.NET 4.5 (Win7-Win32) = 38.47 mil
}

为什么 Mono 在 Linux 和 BSD 上的运行速度比 Mono 在 Windows 和 OSX 上慢 1/3?

【问题讨论】:

  • 根据你的数字,OSX 比 windows 慢 2 倍。您需要考虑 linux 和 Freebsd 运行在与 OSX 不同的机器上这一事实。您可以看到 Win7 与 Win8 数字的差异。但是我明白你的意思,你的数字表明单声道在 Windows 下要快得多。您是否考虑过源代码的差异取决于操作系统?我的意思是,32 位机器(win 7 和 win 8)的目标代码与 linux、freebsd 和 OSX 的目标代码不同,我猜是 64 位。
  • 可以将其发布到 Mono 邮件列表之一:mono-project.com/Mailing_Lists
  • @Juan Carlos Brown 哎呀,那是 .NET 4.5。我忘了在那个 Intel CPU 上进行 Win7 Mono 测试。所有 CPU 和平台都使用相同的源代码。
  • @Juan Carlos Brown 测试均在 32 位 x86 下运行。 Windows 测试没有什么不同......所以我不知道你怎么说?
  • @zezba9000 我明白了,所以如果所有操作系统都针对 32 位,那么我看到的唯一会影响 posix 操作系统的单声道是“winmm.dll”。我的简短研究表明 winmm.dll 仅属于 Windows,并且很可能在 linux 和 OSX 下抛出异常(linklink)。除此之外,我找不到任何其他原因导致基准时间差异如此之大。

标签: .net linux macos mono bsd


【解决方案1】:

好吧,我做了一个更好的基准测试(RayTraceBenchmark):https://github.com/zezba9000/RayTraceBenchmark(随意做拉取请求以添加更多语言或发布端口[希望看到结果])

它渲染 3D 场景并保存 RAW 图像文件。您可以通过 Photoshop 或其他方式打开图像。图片分辨率为1280x720。

以下是测试的当前结果:https://github.com/zezba9000/RayTraceBenchmark/blob/master/C%23/Results.md

正如您所见,Linux/BSD 在同一台计算机上的运行速度仍然较慢?这不应该发生吗?

<<< AMD Athlon 64 X2 Dual Core 4600+ 2.40GHz >>>
.NET 4.5 (Win8-Win32)
(x86) = 1.179 sec
(x64) = 1.549 sec

Mono 3.2.3 (Win8-Win32)
(x86) = 2.059 sec
(x64) = 2.07 sec

Mono 3.2.3 (PC-Linux)
(x86) = 2.425
(x64) = 2.409

Mono 3.2.1 (PC-BSD)
(x86) = 2.536
(x64) = 2.509

<<< Intel Core2 Duo P8600 2.40GHz >>>
.NET 4.5 (Win7-Win32)
(x86) = 1.05 sec
(x64) = 1.132 sec

Mono 3.2.3 (Win7-Win32) 
(x86) = 1.692 sec
(x64) = 1.702 sec

Mono 3.2.3 (OSX 10.9)
(x86) = 1.675 sec
(x64) = 1.679 sec

【讨论】:

  • 对于为什么 Mono 运行速度如此之慢,仍然没有很好的答案。你有没有找到一个合理的答案?
  • 没有具体答案,但经过多次测试后,原因很可能是 Mono CLR 或 JIT 慢得多。但具体是哪一个或为什么我不知道。
  • zezba9000,大多数参考资料(通过 Google)似乎表明 Mono 的平均速度大约是 .NET 的一半。我知道微软在优化框架和 C# 编译器方面投入了大量精力。我可能会做出的一些(疯狂的)猜测是 1).NET 框架中的 C# 编译器在内联代码方面可能更好或更激进; 2)框架中的关键例程可能会更好地调整到Windows;并且(正如您所提到的)3)Mono JIT 可能不如 .NET 中的效率高。不过,纯属猜测。谢谢你的回答。
【解决方案2】:

我上次检查时,Mono 的编译器技术基于 iburg,这是 1983 年的热门技术(这是我在学校 - 大约 1984 年 - 由于 Davidson&Fraser&Hansen 学到的),但它基于固定(通常是乐观的)负载延迟和非流水线指令调度。从那时起,我们对这两种算法都有了新的算法(例如:http://pages.cs.wisc.edu/~fischer/cs701.f08/eggers.pdf - 一篇关于负载延迟的论文,大约在 1992 年,此外,例如,基于资源的 CPU 调度现在用于 clang 和 gcc 中的多个问题调度,其中, IIRC,好的论文大约在 2000 年开始出现)。所以这可能解释了那里可能有 5-30% 的性能。

此外,还有 GC 性能:mono 在这方面落后,而 microsoft 正在与非常擅长 JVM 的人(IBM、Sun)竞争。我的感觉是,尽管 mono 项目是一项伟大的工作,但它的工作量很大,只是为了跟上微软不断涌入的所有新东西(为编译器、GC 性能、VM 留下很少的时间......改进)。请记住,MS 的大部分新代码都是在 .Net 中编写的,并且对提高速度非常感兴趣(而且他们总是有不错的编译器)。

因此,性能可能不同的原因有很多。再说一次,它是开源的,如果人们足够关心,他们可以做出贡献。

【讨论】:

  • 问题是我在乎,但这不是我的领域,我现在可以把时间集中在哪里。虽然我最终可能会将 C# 的一个子集编译为 Nimrod 或 C++,然后它会从中获得性能。
猜你喜欢
  • 2019-01-11
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-08-02
  • 2021-10-28
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多