d6/d23/qrgba64__p_8h_source.html

// Copyright (C) 2020 The Qt Company Ltd.

// SPDX-License-Identifier: LicenseRef-Qt-Commercial OR LGPL-3.0-only OR GPL-2.0-only OR GPL-3.0-only


#ifndef QRGBA64_P_H

#define QRGBA64_P_H


//

//  W A R N I N G

//  -------------

//

// This file is not part of the Qt API.  It exists purely as an

// implementation detail.  This header file may change from version to

// version without notice, or even be removed.

//

// We mean it.

//


#include "qrgba64.h"

#include "qdrawhelper_p.h"


#include <QtCore/private/qsimd_p.h>

#include <QtGui/private/qtguiglobal_p.h>


QT_BEGIN_NAMESPACE


inline QRgba64 combineAlpha256(QRgba64 rgba64, uint alpha256)

{

    return QRgba64::fromRgba64(rgba64.red(), rgba64.green(), rgba64.blue(), (rgba64.alpha() * alpha256) >> 8);

}


#if defined(__SSE2__)

static inline __m128i Q_DECL_VECTORCALL multiplyAlpha65535(__m128i rgba64, __m128i va)

{

    __m128i vs = rgba64;

    vs = _mm_unpacklo_epi16(_mm_mullo_epi16(vs, va), _mm_mulhi_epu16(vs, va));

    vs = _mm_add_epi32(vs, _mm_srli_epi32(vs, 16));

    vs = _mm_add_epi32(vs, _mm_set1_epi32(0x8000));

    vs = _mm_srai_epi32(vs, 16);

    vs = _mm_packs_epi32(vs, vs);

    return vs;

}

static inline __m128i Q_DECL_VECTORCALL multiplyAlpha65535(__m128i rgba64, uint alpha65535)

{

    const __m128i va = _mm_shufflelo_epi16(_mm_cvtsi32_si128(alpha65535), _MM_SHUFFLE(0, 0, 0, 0));

    return multiplyAlpha65535(rgba64, va);

}

#elif defined(__ARM_NEON__)

static inline uint16x4_t multiplyAlpha65535(uint16x4_t rgba64, uint16x4_t alpha65535)

{

    uint32x4_t vs32 = vmull_u16(rgba64, alpha65535); // vs = vs * alpha

    vs32 = vsraq_n_u32(vs32, vs32, 16); // vs = vs + (vs >> 16)

    return vrshrn_n_u32(vs32, 16); // vs = (vs + 0x8000) >> 16

}

static inline uint16x4_t multiplyAlpha65535(uint16x4_t rgba64, uint alpha65535)

{

    uint32x4_t vs32 = vmull_n_u16(rgba64, alpha65535); // vs = vs * alpha

    vs32 = vsraq_n_u32(vs32, vs32, 16); // vs = vs + (vs >> 16)

    return vrshrn_n_u32(vs32, 16); // vs = (vs + 0x8000) >> 16

}

#endif


static inline QRgba64 multiplyAlpha65535(QRgba64 rgba64, uint alpha65535)

{

#if defined(__SSE2__)

    const __m128i v = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&rgba64));

    const __m128i vr = multiplyAlpha65535(v, alpha65535);

    QRgba64 r;

    _mm_storel_epi64(reinterpret_cast<__m128i *>(&r), vr);

    return r;

#elif defined(__ARM_NEON__)

    const uint16x4_t v = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&rgba64)));

    const uint16x4_t vr = multiplyAlpha65535(v, alpha65535);

    QRgba64 r;

    vst1_u64(reinterpret_cast<uint64_t *>(&r), vreinterpret_u64_u16(vr));

    return r;

#else

    return QRgba64::fromRgba64(qt_div_65535(rgba64.red()   * alpha65535),

                               qt_div_65535(rgba64.green() * alpha65535),

                               qt_div_65535(rgba64.blue()  * alpha65535),

                               qt_div_65535(rgba64.alpha() * alpha65535));

#endif

}


#if defined(__SSE2__) || defined(__ARM_NEON__)

template<typename T>

static inline T Q_DECL_VECTORCALL multiplyAlpha255(T rgba64, uint alpha255)

{

    return multiplyAlpha65535(rgba64, alpha255 * 257);

}

#else

template<typename T>


static inline T multiplyAlpha255(T rgba64, uint alpha255)

{

    return QRgba64::fromRgba64(qt_div_255(rgba64.red()   * alpha255),

                               qt_div_255(rgba64.green() * alpha255),

                               qt_div_255(rgba64.blue()  * alpha255),

                               qt_div_255(rgba64.alpha() * alpha255));

}


#endif


#if defined __SSE2__

static inline __m128i Q_DECL_VECTORCALL interpolate255(__m128i x, uint alpha1, __m128i y, uint alpha2)

{

    return _mm_add_epi16(multiplyAlpha255(x, alpha1), multiplyAlpha255(y, alpha2));

}

#endif


#if defined __ARM_NEON__

inline uint16x4_t interpolate255(uint16x4_t x, uint alpha1, uint16x4_t y, uint alpha2)

{

    return vadd_u16(multiplyAlpha255(x, alpha1), multiplyAlpha255(y, alpha2));

}

#endif


static inline QRgba64 interpolate255(QRgba64 x, uint alpha1, QRgba64 y, uint alpha2)

{

#if defined(__SSE2__)

    const __m128i vx = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&x));

    const __m128i vy = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&y));

    const __m128i vr = interpolate255(vx, alpha1, vy, alpha2);

    QRgba64 r;

    _mm_storel_epi64(reinterpret_cast<__m128i *>(&r), vr);

    return r;

#elif defined(__ARM_NEON__)

    const uint16x4_t vx = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&x)));

    const uint16x4_t vy = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&y)));

    const uint16x4_t vr = interpolate255(vx, alpha1, vy, alpha2);

    QRgba64 r;

    vst1_u64(reinterpret_cast<uint64_t *>(&r), vreinterpret_u64_u16(vr));

    return r;

#else

    return QRgba64::fromRgba64(multiplyAlpha255(x, alpha1) + multiplyAlpha255(y, alpha2));

#endif

}


#if defined __SSE2__

static inline __m128i Q_DECL_VECTORCALL interpolate65535(__m128i x, uint alpha1, __m128i y, uint alpha2)

{

    return _mm_add_epi16(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}


static inline __m128i Q_DECL_VECTORCALL interpolate65535(__m128i x, __m128i alpha1, __m128i y, __m128i alpha2)

{

    return _mm_add_epi16(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}

#endif


#if defined __ARM_NEON__

inline uint16x4_t interpolate65535(uint16x4_t x, uint alpha1, uint16x4_t y, uint alpha2)

{

    return vadd_u16(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}

inline uint16x4_t interpolate65535(uint16x4_t x, uint16x4_t alpha1, uint16x4_t y, uint16x4_t alpha2)

{

    return vadd_u16(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}

#endif


static inline QRgba64 interpolate65535(QRgba64 x, uint alpha1, QRgba64 y, uint alpha2)

{

#if defined(__SSE2__)

    const __m128i vx = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&x));

    const __m128i vy = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&y));

    const __m128i vr = interpolate65535(vx, alpha1, vy, alpha2);

    QRgba64 r;

    _mm_storel_epi64(reinterpret_cast<__m128i *>(&r), vr);

    return r;

#elif defined(__ARM_NEON__)

    const uint16x4_t vx = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&x)));

    const uint16x4_t vy = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&y)));

    const uint16x4_t vr = interpolate65535(vx, alpha1, vy, alpha2);

    QRgba64 r;

    vst1_u64(reinterpret_cast<uint64_t *>(&r), vreinterpret_u64_u16(vr));

    return r;

#else

    return QRgba64::fromRgba64(multiplyAlpha65535(x, alpha1) + multiplyAlpha65535(y, alpha2));

#endif

}


static inline QRgba64 addWithSaturation(QRgba64 a, QRgba64 b)

{

#if defined(__SSE2__)

    const __m128i va = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&a));

    const __m128i vb = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&b));

    const __m128i vr = _mm_adds_epu16(va, vb);

    QRgba64 r;

    _mm_storel_epi64(reinterpret_cast<__m128i *>(&r), vr);

    return r;

#else

    return QRgba64::fromRgba64(qMin(a.red() + b.red(), 65535),

                               qMin(a.green() + b.green(), 65535),

                               qMin(a.blue() + b.blue(), 65535),

                               qMin(a.alpha() + b.alpha(), 65535));

#endif

}


#if QT_COMPILER_SUPPORTS_HERE(SSE2)

QT_FUNCTION_TARGET(SSE2)

static inline uint Q_DECL_VECTORCALL toArgb32(__m128i v)

{

    v = _mm_unpacklo_epi16(v, _mm_setzero_si128());

    v = _mm_add_epi32(v, _mm_set1_epi32(128));

    v = _mm_sub_epi32(v, _mm_srli_epi32(v, 8));

    v = _mm_srli_epi32(v, 8);

    v = _mm_packs_epi32(v, v);

    v = _mm_packus_epi16(v, v);

    return _mm_cvtsi128_si32(v);

}

#elif defined __ARM_NEON__

static inline uint toArgb32(uint16x4_t v)

{

    v = vsub_u16(v, vrshr_n_u16(v, 8));

    v = vrshr_n_u16(v, 8);

    uint8x8_t v8 = vmovn_u16(vcombine_u16(v, v));

    return vget_lane_u32(vreinterpret_u32_u8(v8), 0);

}

#endif


static inline uint toArgb32(QRgba64 rgba64)

{

#if defined __SSE2__

    __m128i v = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&rgba64));

    v = _mm_shufflelo_epi16(v, _MM_SHUFFLE(3, 0, 1, 2));

    return toArgb32(v);

#elif defined __ARM_NEON__

    uint16x4_t v = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&rgba64)));

#if Q_BYTE_ORDER == Q_LITTLE_ENDIAN

    const uint8x8_t shuffleMask = { 4, 5, 2, 3, 0, 1, 6, 7 };

    v = vreinterpret_u16_u8(vtbl1_u8(vreinterpret_u8_u16(v), shuffleMask));

#else

    v = vext_u16(v, v, 3);

#endif

    return toArgb32(v);

#else

    return rgba64.toArgb32();

#endif

}


static inline uint toRgba8888(QRgba64 rgba64)

{

#if defined __SSE2__

    __m128i v = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&rgba64));

    return toArgb32(v);

#elif defined __ARM_NEON__

    uint16x4_t v = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&rgba64)));

    return toArgb32(v);

#else

    return ARGB2RGBA(toArgb32(rgba64));

#endif

}


static inline QRgba64 rgbBlend(QRgba64 d, QRgba64 s, uint rgbAlpha)

{

    QRgba64 blend;

#if defined(__SSE2__)

    __m128i vd = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&d));

    __m128i vs = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&s));

    __m128i va =  _mm_cvtsi32_si128(rgbAlpha);

    va = _mm_unpacklo_epi8(va, va);

    va = _mm_shufflelo_epi16(va, _MM_SHUFFLE(3, 0, 1, 2));

    __m128i vb = _mm_xor_si128(_mm_set1_epi16(-1), va);


    vs = _mm_unpacklo_epi16(_mm_mullo_epi16(vs, va), _mm_mulhi_epu16(vs, va));

    vd = _mm_unpacklo_epi16(_mm_mullo_epi16(vd, vb), _mm_mulhi_epu16(vd, vb));

    vd = _mm_add_epi32(vd, vs);

    vd = _mm_add_epi32(vd, _mm_srli_epi32(vd, 16));

    vd = _mm_add_epi32(vd, _mm_set1_epi32(0x8000));

    vd = _mm_srai_epi32(vd, 16);

    vd = _mm_packs_epi32(vd, vd);


    _mm_storel_epi64(reinterpret_cast<__m128i *>(&blend), vd);

#elif defined(__ARM_NEON__)

    uint16x4_t vd = vreinterpret_u16_u64(vmov_n_u64(d));

    uint16x4_t vs = vreinterpret_u16_u64(vmov_n_u64(s));

    uint8x8_t va8 = vreinterpret_u8_u32(vmov_n_u32(ARGB2RGBA(rgbAlpha)));

    uint16x4_t va = vreinterpret_u16_u8(vzip_u8(va8, va8).val[0]);

    uint16x4_t vb = vdup_n_u16(0xffff);

    vb = vsub_u16(vb, va);


    uint32x4_t vs32 = vmull_u16(vs, va);

    uint32x4_t vd32 = vmull_u16(vd, vb);

    vd32 = vaddq_u32(vd32, vs32);

    vd32 = vsraq_n_u32(vd32, vd32, 16);

    vd = vrshrn_n_u32(vd32, 16);

    vst1_u64(reinterpret_cast<uint64_t *>(&blend), vreinterpret_u64_u16(vd));

#else

    const int mr = qRed(rgbAlpha);

    const int mg = qGreen(rgbAlpha);

    const int mb = qBlue(rgbAlpha);

    blend = qRgba64(qt_div_255(s.red()   * mr + d.red()   * (255 - mr)),

                    qt_div_255(s.green() * mg + d.green() * (255 - mg)),

                    qt_div_255(s.blue()  * mb + d.blue()  * (255 - mb)),

                    s.alpha());

#endif

    return blend;

}


static inline void blend_pixel(QRgba64 &dst, QRgba64 src)

{

    if (src.isOpaque())

        dst = src;

    else if (!src.isTransparent()) {

#if defined(__SSE2__)

        const __m128i vd = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&dst));

        const __m128i vs = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&src));

        const __m128i via = _mm_xor_si128(_mm_set1_epi16(-1), _mm_shufflelo_epi16(vs, _MM_SHUFFLE(3, 3, 3, 3)));

        const __m128i vr = _mm_add_epi16(vs, multiplyAlpha65535(vd, via));

        _mm_storel_epi64(reinterpret_cast<__m128i *>(&dst), vr);

#else

        dst = src + multiplyAlpha65535(dst, 65535 - src.alpha());

#endif

    }

}


static inline void blend_pixel(QRgba64 &dst, QRgba64 src, const int const_alpha)

{

    if (const_alpha == 255)

        return blend_pixel(dst, src);

    if (!src.isTransparent()) {

#if defined(__SSE2__)

        const __m128i vd = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&dst));

        __m128i vs = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&src));

        vs = multiplyAlpha255(vs, const_alpha);

        const __m128i via = _mm_xor_si128(_mm_set1_epi16(-1), _mm_shufflelo_epi16(vs, _MM_SHUFFLE(3, 3, 3, 3)));

        const __m128i vr = _mm_add_epi16(vs, multiplyAlpha65535(vd, via));

        _mm_storel_epi64(reinterpret_cast<__m128i *>(&dst), vr);

#else

        src = multiplyAlpha255(src, const_alpha);

        dst = src + multiplyAlpha65535(dst, 65535 - src.alpha());

#endif

    }

}


QT_END_NAMESPACE


#endif // QRGBA64_P_H

QRgba64
Definition qrgba64.h:12

QRgba64::red
constexpr quint16 red() const
Definition qrgba64.h:70

QRgba64::alpha
constexpr quint16 alpha() const
Definition qrgba64.h:73

QRgba64::green
constexpr quint16 green() const
Definition qrgba64.h:71

QRgba64::blue
constexpr quint16 blue() const
Definition qrgba64.h:72

QRgba64::fromRgba64
static constexpr QRgba64 fromRgba64(quint64 c)
Definition qrgba64.h:36

QRgba64::toArgb32
constexpr uint toArgb32() const
Definition qrgba64.h:83

QT_BEGIN_NAMESPACE
Combined button and popup list for selecting options.
Definition qstandardpaths_haiku.cpp:21

QT_END_NAMESPACE
Definition qsharedpointer.cpp:1590

qdrawhelper_p.h

qt_div_65535
static constexpr uint qt_div_65535(uint x)
Definition qdrawhelper_p.h:882

qt_div_255
static constexpr int qt_div_255(int x)
Definition qdrawhelper_p.h:879

Q_DECL_VECTORCALL
#define Q_DECL_VECTORCALL
Definition qdrawhelper_p.h:48

qMin
constexpr const T & qMin(const T &a, const T &b)
Definition qminmax.h:40

b
GLboolean GLboolean GLboolean b
Definition qopengles2ext.h:337

v
GLsizei const GLfloat * v
[13]
Definition qopengles2ext.h:788

x
GLint GLint GLint GLint GLint x
[0]
Definition qopengles2ext.h:605

a
GLboolean GLboolean GLboolean GLboolean a
[7]
Definition qopengles2ext.h:337

r
GLboolean r
[2]
Definition qopengles2ext.h:337

src
GLenum src
Definition qopengles2ext.h:335

dst
GLenum GLenum dst
Definition qopengles2ext.h:335

y
GLint y
Definition qopengles2ext.h:206

s
GLdouble s
[6]
Definition qopenglext.h:235

val
GLuint GLfloat * val
Definition qopenglext.h:1513

ARGB2RGBA
static quint32 ARGB2RGBA(quint32 x)
Definition qpixellayout_p.h:210

qRed
constexpr int qRed(QRgb rgb)
Definition qrgb.h:18

qGreen
constexpr int qGreen(QRgb rgb)
Definition qrgb.h:21

qBlue
constexpr int qBlue(QRgb rgb)
Definition qrgb.h:24

qrgba64.h

qRgba64
constexpr QRgba64 qRgba64(quint16 r, quint16 g, quint16 b, quint16 a)
Definition qrgba64.h:180

multiplyAlpha65535
static QRgba64 multiplyAlpha65535(QRgba64 rgba64, uint alpha65535)
Definition qrgba64_p.h:62

combineAlpha256
QT_BEGIN_NAMESPACE QRgba64 combineAlpha256(QRgba64 rgba64, uint alpha256)
Definition qrgba64_p.h:26

toArgb32
static uint toArgb32(QRgba64 rgba64)
Definition qrgba64_p.h:219

interpolate65535
static QRgba64 interpolate65535(QRgba64 x, uint alpha1, QRgba64 y, uint alpha2)
Definition qrgba64_p.h:159

interpolate255
static QRgba64 interpolate255(QRgba64 x, uint alpha1, QRgba64 y, uint alpha2)
Definition qrgba64_p.h:115

multiplyAlpha255
static T multiplyAlpha255(T rgba64, uint alpha255)
Definition qrgba64_p.h:92

addWithSaturation
static QRgba64 addWithSaturation(QRgba64 a, QRgba64 b)
Definition qrgba64_p.h:180

blend_pixel
static void blend_pixel(QRgba64 &dst, QRgba64 src)
Definition qrgba64_p.h:298

toRgba8888
static uint toRgba8888(QRgba64 rgba64)
Definition qrgba64_p.h:239

rgbBlend
static QRgba64 rgbBlend(QRgba64 d, QRgba64 s, uint rgbAlpha)
Definition qrgba64_p.h:252

QT_FUNCTION_TARGET
#define QT_FUNCTION_TARGET(x)
Definition qsimd_p.h:133

uint
unsigned int uint
Definition qtypes.h:34

d
double d
Definition src_corelib_text_qlocale.cpp:9