NaNてことだ SIMD化したら結果が変わるなんて
NOTE: こちらは以前Qiitaに投稿した記事のバックアップです。
処理をSIMD化してたらまれに計算結果が一致しないケースがあったので調査した。
注:SIMD化はあくまでこの問題を発見したきっかけであり、本稿のテーマとはさほど関係ありません。
結論
公式規格書は一応読んだけどクソザコイングリッシュ故読み違いあるかも。間違ってたら指摘してください。
- NaNにはQuiet NaN (QNaN)とSignaling NaN (SNaN)がある
- 仮数部は0以外何でも選べるし符号ビットも自由なのでビットパターンはそれぞれ$2^{52}$個くらいある。 『エラーコードっぽい使い方できるよ!』とのことらしい
IEEE 754では浮動小数点数に対するMin/Max演算を定義しているが、引数の一方がNaNであった場合の振る舞いが2008年版と2019年版で定義が異なる
- 2008年版ではQNaNとSNaNで異なる動作をする
- 2019年版では2通りのmin/maxが定義された
そうは言ってもこの仕様に対して律儀に従うかどうかは完全に実装依存であり、使うハードウェアやライブラリを切り替えると結果が変わったりする
- 交換法則さえ成り立たないのもあってつらい
$\scriptsize{\mathrm{max(0 , QNaN)}}$ | $\scriptsize{\mathrm{max(0 , SNaN)}}$ | $\scriptsize{\mathrm{max(QNaN, 0 )}}$ | $\scriptsize{\mathrm{max(SNaN, 0 )}}$ | $\scriptsize{\mathrm{max(QNaN, QNaN)}}$ | $\scriptsize{\mathrm{max(QNaN, SNaN)}}$ | $\scriptsize{\mathrm{max(SNaN, QNaN)}}$ | $\scriptsize{\mathrm{max(SNaN, SNaN)}}$ | ||
---|---|---|---|---|---|---|---|---|---|
定 義 |
IEEE-754:2088maxNum |
$\mathrm{0}$ | $\mathrm{QNaN}$ | $\mathrm{0}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ |
IEEE-754:2019maximum |
$\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | |
IEEE-754:2019maximumNumber |
$\mathrm{0}$ | $\mathrm{SNaN}$ | $\mathrm{0}$ | $\mathrm{SNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | |
H/W 実 装 |
SSE2_mm_max_pd |
$\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{0}$ | $\mathrm{0}$ | $\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{QNaN}$ | $\mathrm{SNaN}$ |
AVX_mm256_max_pd |
$\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{0}$ | $\mathrm{0}$ | $\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{QNaN}$ | $\mathrm{SNaN}$ | |
S/W 実 装 |
C++std::max |
$\mathrm{0}$ | $\mathrm{0}$ | $\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{SNaN}$ |
C#Math.Max |
$\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{QNaN}$ | $\mathrm{QNaN}$ | $\mathrm{SNaN}$ | $\mathrm{SNaN}$ |
他の環境の結果をご存知でしたら教えていただけると助かります。
補足:実験コード
C++
#include <algorithm>
#include <iostream>
#include <limits>
#include <math.h>
#include <emmintrin.h>
#include <immintrin.h>
std::string display(double x)
{
if(issignaling(x))
return "SNaN";
if(isnan(x))
return "QNaN";
return std::to_string(x);
}
int main()
{
constexpr auto qnan = std::numeric_limits<double>::quiet_NaN();
constexpr auto snan = std::numeric_limits<double>::signaling_NaN();
std::cout << "std : max(0.0 , QNaN) = " << display(std::max(0.0 , qnan)) << std::endl;
std::cout << "std : max(0.0 , SNaN) = " << display(std::max(0.0 , snan)) << std::endl;
std::cout << "std : max(QNaN, 0.0 ) = " << display(std::max(qnan, 0.0 )) << std::endl;
std::cout << "std : max(SNaN, 0.0 ) = " << display(std::max(snan, 0.0 )) << std::endl;
std::cout << "std : max(QNaN, QNaN) = " << display(std::max(qnan, qnan)) << std::endl;
std::cout << "std : max(QNaN, SNaN) = " << display(std::max(qnan, snan)) << std::endl;
std::cout << "std : max(SNaN, QNaN) = " << display(std::max(snan, qnan)) << std::endl;
std::cout << "std : max(SNaN, SNaN) = " << display(std::max(snan, snan)) << std::endl;
std::cout << std::endl;
std::cout << "SSE2: max(0.0 , QNaN) = " << display(_mm_max_pd(_mm_set1_pd(0.0 ), _mm_set1_pd(qnan))[0]) << std::endl;
std::cout << "SSE2: max(0.0 , SNaN) = " << display(_mm_max_pd(_mm_set1_pd(0.0 ), _mm_set1_pd(snan))[0]) << std::endl;
std::cout << "SSE2: max(QNaN, 0.0 ) = " << display(_mm_max_pd(_mm_set1_pd(qnan), _mm_set1_pd(0.0 ))[0]) << std::endl;
std::cout << "SSE2: max(SNaN, 0.0 ) = " << display(_mm_max_pd(_mm_set1_pd(snan), _mm_set1_pd(0.0 ))[0]) << std::endl;
std::cout << "SSE2: max(QNaN, QNaN) = " << display(_mm_max_pd(_mm_set1_pd(qnan), _mm_set1_pd(qnan))[0]) << std::endl;
std::cout << "SSE2: max(QNaN, SNaN) = " << display(_mm_max_pd(_mm_set1_pd(qnan), _mm_set1_pd(snan))[0]) << std::endl;
std::cout << "SSE2: max(SNaN, QNaN) = " << display(_mm_max_pd(_mm_set1_pd(snan), _mm_set1_pd(qnan))[0]) << std::endl;
std::cout << "SSE2: max(SNaN, SNaN) = " << display(_mm_max_pd(_mm_set1_pd(snan), _mm_set1_pd(snan))[0]) << std::endl;
std::cout << std::endl;
std::cout << "AVX : max(0.0 , QNaN) = " << display(_mm256_max_pd(_mm256_set1_pd(0.0 ), _mm256_set1_pd(qnan))[0]) << std::endl;
std::cout << "AVX : max(0.0 , SNaN) = " << display(_mm256_max_pd(_mm256_set1_pd(0.0 ), _mm256_set1_pd(snan))[0]) << std::endl;
std::cout << "AVX : max(QNaN, 0.0 ) = " << display(_mm256_max_pd(_mm256_set1_pd(qnan), _mm256_set1_pd(0.0 ))[0]) << std::endl;
std::cout << "AVX : max(SNaN, 0.0 ) = " << display(_mm256_max_pd(_mm256_set1_pd(snan), _mm256_set1_pd(0.0 ))[0]) << std::endl;
std::cout << "AVX : max(QNaN, QNaN) = " << display(_mm256_max_pd(_mm256_set1_pd(qnan), _mm256_set1_pd(qnan))[0]) << std::endl;
std::cout << "AVX : max(QNaN, SNaN) = " << display(_mm256_max_pd(_mm256_set1_pd(qnan), _mm256_set1_pd(snan))[0]) << std::endl;
std::cout << "AVX : max(SNaN, QNaN) = " << display(_mm256_max_pd(_mm256_set1_pd(snan), _mm256_set1_pd(qnan))[0]) << std::endl;
std::cout << "AVX : max(SNaN, SNaN) = " << display(_mm256_max_pd(_mm256_set1_pd(snan), _mm256_set1_pd(snan))[0]) << std::endl;
}
C#
using System;
using System.Runtime.CompilerServices;
namespace NaNTest
{
class Program
{
private const ulong SignalingNaNBit = 0x7FF0_0000_0000_0001uL;
private const ulong QuietNaNBit = 0x7FF8_0000_0000_0000uL;
public static double SNaN { get; } = Unsafe.As<ulong, double>(ref Unsafe.AsRef(SignalingNaNBit));
public static double QNaN { get; } = Unsafe.As<ulong, double>(ref Unsafe.AsRef(QuietNaNBit));
public static bool IsSignalingNaN(double value) => double.IsNaN(value) & (Unsafe.As<double, ulong>(ref value) & 0x0008_0000_0000_0000uL) == 0;
public static bool IsQuietNaN(double value) => double.IsNaN(value) & (Unsafe.As<double, ulong>(ref value) & 0x0008_0000_0000_0000uL) != 0;
static string Display(double value)
{
if(IsSignalingNaN(value))
return "SNaN";
if(IsQuietNaN(value))
return "QNaN";
return value.ToString();
}
static void Main(string[] args)
{
Console.WriteLine($"double.NaN is {Display(double.NaN)}");
Console.WriteLine($"System.Math: max(0.0 , qnan) = {Display(Math.Max(0.0 , QNaN))}");
Console.WriteLine($"System.Math: max(0.0 , snan) = {Display(Math.Max(0.0 , SNaN))}");
Console.WriteLine($"System.Math: max(qnan, 0.0 ) = {Display(Math.Max(QNaN, 0.0 ))}");
Console.WriteLine($"System.Math: max(snan, 0.0 ) = {Display(Math.Max(SNaN, 0.0 ))}");
Console.WriteLine($"System.Math: max(qnan, qnan) = {Display(Math.Max(QNaN, QNaN))}");
Console.WriteLine($"System.Math: max(qnan, snan) = {Display(Math.Max(QNaN, SNaN))}");
Console.WriteLine($"System.Math: max(snan, qnan) = {Display(Math.Max(SNaN, QNaN))}");
Console.WriteLine($"System.Math: max(snan, snan) = {Display(Math.Max(SNaN, SNaN))}");
}
}
}