Интереснее собрать под win32/win64 компилятором от MS (VC10). Но это, очевидно, из области фантастики? Страшно даже представить то необходимое количество возвратно-поступательных движений напильником...
В общем случае собранный майкрософтовским компилятором код действительно довольно быстр (в отдельных случаях едва уступает коду, собранному Intel ICC). Однако, MinGW64 с последними снимками GCC генерирует вполне нормальный код, особенно с -O3 од 64-битную платформу. Но для сборки под Win64 пришлось просеять исходники хорошо, результат в виде дерева исходников адаптированного 0.4.4.4 лежит у меня на github.
Можно собрать c использованием CL.exe, и после небольшого дотачивания надфилем это получалось. Но слинкованный бинарник оказывался нерабочим, надо будет как-нибудь снова заняться этим. Похоже, CL.exe как-то по-своему трактует прагмы.
Меня больше интересует сборка интеловским компилятором, как-нибудь попробую.
P.S. Кстати смех-смехом, но у MS есть основанный на CL тулчейн под Unix-like системы. Но, естественно, он под жестким NDA.
Они используют его для сборки своих продуктов под MacOS X, в частности.