d6/d23/qrgba64__p_8h_source.html

// Copyright (C) 2020 The Qt Company Ltd.

// SPDX-License-Identifier: LicenseRef-Qt-Commercial OR LGPL-3.0-only OR GPL-2.0-only OR GPL-3.0-only


#ifndef QRGBA64_P_H

#define QRGBA64_P_H


//

//  W A R N I N G

//  -------------

//

// This file is not part of the Qt API.  It exists purely as an

// implementation detail.  This header file may change from version to

// version without notice, or even be removed.

//

// We mean it.

//


#include "qrgba64.h"

#include "qdrawhelper_p.h"


#include <QtCore/private/qsimd_p.h>

#include <QtGui/private/qtguiglobal_p.h>


QT_BEGIN_NAMESPACE


inline QRgba64 combineAlpha256(QRgba64 rgba64, uint alpha256)

{

    return QRgba64::fromRgba64(rgba64.red(), rgba64.green(), rgba64.blue(), (rgba64.alpha() * alpha256) >> 8);

}


#if defined(__SSE2__)

static inline __m128i Q_DECL_VECTORCALL multiplyAlpha65535(__m128i rgba64, __m128i va)

{

    __m128i vs = rgba64;

    vs = _mm_unpacklo_epi16(_mm_mullo_epi16(vs, va), _mm_mulhi_epu16(vs, va));

    vs = _mm_add_epi32(vs, _mm_srli_epi32(vs, 16));

    vs = _mm_add_epi32(vs, _mm_set1_epi32(0x8000));

    vs = _mm_srai_epi32(vs, 16);

    vs = _mm_packs_epi32(vs, vs);

    return vs;

}

static inline __m128i Q_DECL_VECTORCALL multiplyAlpha65535(__m128i rgba64, uint alpha65535)

{

    const __m128i va = _mm_shufflelo_epi16(_mm_cvtsi32_si128(alpha65535), _MM_SHUFFLE(0, 0, 0, 0));

    return multiplyAlpha65535(rgba64, va);

}

#elif defined(__ARM_NEON__)

static inline uint16x4_t multiplyAlpha65535(uint16x4_t rgba64, uint16x4_t alpha65535)

{

    uint32x4_t vs32 = vmull_u16(rgba64, alpha65535); // vs = vs * alpha

    vs32 = vsraq_n_u32(vs32, vs32, 16); // vs = vs + (vs >> 16)

    return vrshrn_n_u32(vs32, 16); // vs = (vs + 0x8000) >> 16

}

static inline uint16x4_t multiplyAlpha65535(uint16x4_t rgba64, uint alpha65535)

{

    uint32x4_t vs32 = vmull_n_u16(rgba64, alpha65535); // vs = vs * alpha

    vs32 = vsraq_n_u32(vs32, vs32, 16); // vs = vs + (vs >> 16)

    return vrshrn_n_u32(vs32, 16); // vs = (vs + 0x8000) >> 16

}

#elif defined(__loongarch_sx)

static inline __m128i Q_DECL_VECTORCALL multiplyAlpha65535(__m128i rgba64, __m128i va)

{

    __m128i vs = rgba64;

    vs = __lsx_vilvl_h(__lsx_vmuh_hu(vs, va), __lsx_vmul_h(vs, va));

    vs = __lsx_vadd_w(vs, __lsx_vsrli_w(vs, 16));

    vs = __lsx_vadd_w(vs, __lsx_vreplgr2vr_w(0x8000));

    vs = __lsx_vsrai_w(vs, 16);

    vs = __lsx_vpickev_h(__lsx_vsat_w(vs, 15), __lsx_vsat_w(vs, 15));

    return vs;

}

static inline __m128i Q_DECL_VECTORCALL multiplyAlpha65535(__m128i rgba64, uint alpha65535)

{

    const __m128i shuffleMask = (__m128i)(v8i16){0, 0, 0, 0, 4, 5, 6, 7};

    const __m128i va = __lsx_vshuf_h(shuffleMask, __lsx_vldi(0),

                                     __lsx_vinsgr2vr_w(__lsx_vldi(0), alpha65535, 0));

    return multiplyAlpha65535(rgba64, va);

}

#endif


static inline QRgba64 multiplyAlpha65535(QRgba64 rgba64, uint alpha65535)

{

#if defined(__SSE2__)

    const __m128i v = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&rgba64));

    const __m128i vr = multiplyAlpha65535(v, alpha65535);

    QRgba64 r;

    _mm_storel_epi64(reinterpret_cast<__m128i *>(&r), vr);

    return r;

#elif defined(__ARM_NEON__)

    const uint16x4_t v = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&rgba64)));

    const uint16x4_t vr = multiplyAlpha65535(v, alpha65535);

    QRgba64 r;

    vst1_u64(reinterpret_cast<uint64_t *>(&r), vreinterpret_u64_u16(vr));

    return r;

#elif defined(__loongarch_sx)

    const __m128i v = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&rgba64), 0);

    const __m128i vr = multiplyAlpha65535(v, alpha65535);

    QRgba64 r;

    __lsx_vstelm_d(vr, reinterpret_cast<__m128i *>(&r), 0, 0);

    return r;

#else

    return QRgba64::fromRgba64(qt_div_65535(rgba64.red()   * alpha65535),

                               qt_div_65535(rgba64.green() * alpha65535),

                               qt_div_65535(rgba64.blue()  * alpha65535),

                               qt_div_65535(rgba64.alpha() * alpha65535));

#endif

}


#if defined(__SSE2__) || defined(__ARM_NEON__) || defined(__loongarch_sx)

template<typename T>

static inline T Q_DECL_VECTORCALL multiplyAlpha255(T rgba64, uint alpha255)

{

    return multiplyAlpha65535(rgba64, alpha255 * 257);

}

#else

template<typename T>


static inline T multiplyAlpha255(T rgba64, uint alpha255)

{

    return QRgba64::fromRgba64(qt_div_255(rgba64.red()   * alpha255),

                               qt_div_255(rgba64.green() * alpha255),

                               qt_div_255(rgba64.blue()  * alpha255),

                               qt_div_255(rgba64.alpha() * alpha255));

}


#endif


#if defined __SSE2__

static inline __m128i Q_DECL_VECTORCALL interpolate255(__m128i x, uint alpha1, __m128i y, uint alpha2)

{

    return _mm_add_epi16(multiplyAlpha255(x, alpha1), multiplyAlpha255(y, alpha2));

}

#endif


#if defined __ARM_NEON__

inline uint16x4_t interpolate255(uint16x4_t x, uint alpha1, uint16x4_t y, uint alpha2)

{

    return vadd_u16(multiplyAlpha255(x, alpha1), multiplyAlpha255(y, alpha2));

}

#endif


#if defined __loongarch_sx

static inline __m128i Q_DECL_VECTORCALL

interpolate255(__m128i x, uint alpha1, __m128i y, uint alpha2)

{

    return __lsx_vadd_h(multiplyAlpha255(x, alpha1), multiplyAlpha255(y, alpha2));

}

#endif


static inline QRgba64 interpolate255(QRgba64 x, uint alpha1, QRgba64 y, uint alpha2)

{

#if defined(__SSE2__)

    const __m128i vx = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&x));

    const __m128i vy = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&y));

    const __m128i vr = interpolate255(vx, alpha1, vy, alpha2);

    QRgba64 r;

    _mm_storel_epi64(reinterpret_cast<__m128i *>(&r), vr);

    return r;

#elif defined(__ARM_NEON__)

    const uint16x4_t vx = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&x)));

    const uint16x4_t vy = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&y)));

    const uint16x4_t vr = interpolate255(vx, alpha1, vy, alpha2);

    QRgba64 r;

    vst1_u64(reinterpret_cast<uint64_t *>(&r), vreinterpret_u64_u16(vr));

    return r;

#elif defined(__loongarch_sx)

    const __m128i vx = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&x), 0);

    const __m128i vy = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&y), 0);

    const __m128i vr = interpolate255(vx, alpha1, vy, alpha2);

    QRgba64 r;

    __lsx_vstelm_d(vr, reinterpret_cast<__m128i *>(&r), 0, 0);

    return r;

#else

    return QRgba64::fromRgba64(multiplyAlpha255(x, alpha1) + multiplyAlpha255(y, alpha2));

#endif

}


#if defined __SSE2__

static inline __m128i Q_DECL_VECTORCALL interpolate65535(__m128i x, uint alpha1, __m128i y, uint alpha2)

{

    return _mm_add_epi16(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}


static inline __m128i Q_DECL_VECTORCALL interpolate65535(__m128i x, __m128i alpha1, __m128i y, __m128i alpha2)

{

    return _mm_add_epi16(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}

#endif


#if defined __ARM_NEON__

inline uint16x4_t interpolate65535(uint16x4_t x, uint alpha1, uint16x4_t y, uint alpha2)

{

    return vadd_u16(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}

inline uint16x4_t interpolate65535(uint16x4_t x, uint16x4_t alpha1, uint16x4_t y, uint16x4_t alpha2)

{

    return vadd_u16(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}

#endif


#if defined __loongarch_sx

static inline __m128i Q_DECL_VECTORCALL interpolate65535(__m128i x, uint alpha1, __m128i y, uint alpha2)

{

    return __lsx_vadd_h(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}


static inline __m128i Q_DECL_VECTORCALL interpolate65535(__m128i x, __m128i alpha1, __m128i y, __m128i alpha2)

{

    return __lsx_vadd_h(multiplyAlpha65535(x, alpha1), multiplyAlpha65535(y, alpha2));

}

#endif


static inline QRgba64 interpolate65535(QRgba64 x, uint alpha1, QRgba64 y, uint alpha2)

{

#if defined(__SSE2__)

    const __m128i vx = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&x));

    const __m128i vy = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&y));

    const __m128i vr = interpolate65535(vx, alpha1, vy, alpha2);

    QRgba64 r;

    _mm_storel_epi64(reinterpret_cast<__m128i *>(&r), vr);

    return r;

#elif defined(__ARM_NEON__)

    const uint16x4_t vx = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&x)));

    const uint16x4_t vy = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&y)));

    const uint16x4_t vr = interpolate65535(vx, alpha1, vy, alpha2);

    QRgba64 r;

    vst1_u64(reinterpret_cast<uint64_t *>(&r), vreinterpret_u64_u16(vr));

    return r;

#elif defined(__loongarch_sx)

    const __m128i vx = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&x), 0);

    const __m128i vy = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&y), 0);

    const __m128i vr = interpolate65535(vx, alpha1, vy, alpha2);

    QRgba64 r;

    __lsx_vstelm_d(vr, reinterpret_cast<__m128i *>(&r), 0, 0);

    return r;

#else

    return QRgba64::fromRgba64(multiplyAlpha65535(x, alpha1) + multiplyAlpha65535(y, alpha2));

#endif

}


static inline QRgba64 addWithSaturation(QRgba64 a, QRgba64 b)

{

#if defined(__SSE2__)

    const __m128i va = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&a));

    const __m128i vb = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&b));

    const __m128i vr = _mm_adds_epu16(va, vb);

    QRgba64 r;

    _mm_storel_epi64(reinterpret_cast<__m128i *>(&r), vr);

    return r;

#elif defined(__ARM_NEON__)

    const uint16x4_t va = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&a)));

    const uint16x4_t vb = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&b)));

    QRgba64 r;

    vst1_u64(reinterpret_cast<uint64_t *>(&r), vreinterpret_u64_u16(vqadd_u16(va, vb)));

    return r;

#elif defined(__loongarch_sx)

    const __m128i va = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&a), 0);

    const __m128i vb = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&b), 0);

    const __m128i vr = __lsx_vsadd_hu(va, vb);

    QRgba64 r;

    __lsx_vstelm_d(vr, reinterpret_cast<__m128i *>(&r), 0, 0);

    return r;

#else


    return QRgba64::fromRgba64(qMin(a.red() + b.red(), 65535),

                               qMin(a.green() + b.green(), 65535),

                               qMin(a.blue() + b.blue(), 65535),

                               qMin(a.alpha() + b.alpha(), 65535));

#endif

}


#if QT_COMPILER_SUPPORTS_HERE(SSE2)

QT_FUNCTION_TARGET(SSE2)

static inline uint Q_DECL_VECTORCALL toArgb32(__m128i v)

{

    v = _mm_unpacklo_epi16(v, _mm_setzero_si128());

    v = _mm_add_epi32(v, _mm_set1_epi32(128));

    v = _mm_sub_epi32(v, _mm_srli_epi32(v, 8));

    v = _mm_srli_epi32(v, 8);

    v = _mm_packs_epi32(v, v);

    v = _mm_packus_epi16(v, v);

    return _mm_cvtsi128_si32(v);

}

#elif defined __ARM_NEON__

static inline uint toArgb32(uint16x4_t v)

{

    v = vsub_u16(v, vrshr_n_u16(v, 8));

    v = vrshr_n_u16(v, 8);

    uint8x8_t v8 = vmovn_u16(vcombine_u16(v, v));

    return vget_lane_u32(vreinterpret_u32_u8(v8), 0);

}

#elif defined __loongarch_sx

static inline uint Q_DECL_VECTORCALL toArgb32(__m128i v)

{

    v = __lsx_vilvl_h(__lsx_vldi(0), v);

    v = __lsx_vadd_w(v, __lsx_vreplgr2vr_w(128));

    v = __lsx_vsub_w(v, __lsx_vsrli_w(v, 8));

    v = __lsx_vsrli_w(v, 8);

    v = __lsx_vpickev_h(__lsx_vsat_w(v, 15), __lsx_vsat_w(v, 15));

    __m128i tmp = __lsx_vmaxi_h(v, 0);

    v = __lsx_vpickev_b(__lsx_vsat_hu(tmp, 7), __lsx_vsat_hu(tmp, 7));

    return __lsx_vpickve2gr_w(v, 0);

}

#endif


static inline uint toArgb32(QRgba64 rgba64)

{

#if defined __SSE2__

    __m128i v = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&rgba64));

    v = _mm_shufflelo_epi16(v, _MM_SHUFFLE(3, 0, 1, 2));

    return toArgb32(v);

#elif defined __ARM_NEON__

    uint16x4_t v = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&rgba64)));

#if Q_BYTE_ORDER == Q_LITTLE_ENDIAN

    const uint8x8_t shuffleMask = qvset_n_u8(4, 5, 2, 3, 0, 1, 6, 7);

    v = vreinterpret_u16_u8(vtbl1_u8(vreinterpret_u8_u16(v), shuffleMask));

#else

    v = vext_u16(v, v, 3);

#endif

    return toArgb32(v);

#elif defined __loongarch_sx

    __m128i v = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&rgba64), 0);

    const __m128i shuffleMask = (__m128i)(v8i16){2, 1, 0, 3, 4, 5, 6, 7};

    v = __lsx_vshuf_h(shuffleMask, __lsx_vldi(0), v);

    return toArgb32(v);

#else

    return rgba64.toArgb32();

#endif

}


static inline uint toRgba8888(QRgba64 rgba64)

{

#if defined __SSE2__

    __m128i v = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&rgba64));

    return toArgb32(v);

#elif defined __ARM_NEON__

    uint16x4_t v = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&rgba64)));

    return toArgb32(v);

#elif defined __loongarch_sx

    __m128i v = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&rgba64), 0);

    return toArgb32(v);

#else

    return ARGB2RGBA(toArgb32(rgba64));

#endif

}


static inline QRgba64 rgbBlend(QRgba64 d, QRgba64 s, uint rgbAlpha)

{

    QRgba64 blend;

#if defined(__SSE2__)

    __m128i vd = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&d));

    __m128i vs = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&s));

    __m128i va =  _mm_cvtsi32_si128(rgbAlpha);

    va = _mm_unpacklo_epi8(va, va);

    va = _mm_shufflelo_epi16(va, _MM_SHUFFLE(3, 0, 1, 2));

    __m128i vb = _mm_xor_si128(_mm_set1_epi16(-1), va);


    vs = _mm_unpacklo_epi16(_mm_mullo_epi16(vs, va), _mm_mulhi_epu16(vs, va));

    vd = _mm_unpacklo_epi16(_mm_mullo_epi16(vd, vb), _mm_mulhi_epu16(vd, vb));

    vd = _mm_add_epi32(vd, vs);

    vd = _mm_add_epi32(vd, _mm_srli_epi32(vd, 16));

    vd = _mm_add_epi32(vd, _mm_set1_epi32(0x8000));

    vd = _mm_srai_epi32(vd, 16);

    vd = _mm_packs_epi32(vd, vd);


    _mm_storel_epi64(reinterpret_cast<__m128i *>(&blend), vd);

#elif defined(__ARM_NEON__)

    uint16x4_t vd = vreinterpret_u16_u64(vmov_n_u64(d));

    uint16x4_t vs = vreinterpret_u16_u64(vmov_n_u64(s));

    uint8x8_t va8 = vreinterpret_u8_u32(vmov_n_u32(ARGB2RGBA(rgbAlpha)));

    uint16x4_t va = vreinterpret_u16_u8(vzip_u8(va8, va8).val[0]);

    uint16x4_t vb = veor_u16(vdup_n_u16(0xffff), va);


    uint32x4_t vs32 = vmull_u16(vs, va);

    uint32x4_t vd32 = vmull_u16(vd, vb);

    vd32 = vaddq_u32(vd32, vs32);

    vd32 = vsraq_n_u32(vd32, vd32, 16);

    vd = vrshrn_n_u32(vd32, 16);

    vst1_u64(reinterpret_cast<uint64_t *>(&blend), vreinterpret_u64_u16(vd));

#elif defined(__loongarch_sx)

    __m128i vd = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&d), 0);

    __m128i vs = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&s), 0);

    __m128i va = __lsx_vinsgr2vr_w(__lsx_vldi(0), rgbAlpha, 0);

    va = __lsx_vilvl_b(va, va);

    const __m128i shuffleMask = (__m128i)(v8i16){2, 1, 0, 3, 4, 5, 6, 7};

    va = __lsx_vshuf_h(shuffleMask, __lsx_vldi(0), va);

    __m128i vb = __lsx_vxor_v(__lsx_vreplgr2vr_h(-1), va);


    vs = __lsx_vilvl_h(__lsx_vmuh_hu(vs, va), __lsx_vmul_h(vs, va));

    vd = __lsx_vilvl_h(__lsx_vmuh_hu(vd, vb), __lsx_vmul_h(vd, vb));

    vd = __lsx_vadd_w(vd, vs);

    vd = __lsx_vadd_w(vd, __lsx_vsrli_w(vd, 16));

    vd = __lsx_vadd_w(vd, __lsx_vreplgr2vr_w(0x8000));

    vd = __lsx_vsrai_w(vd, 16);

    vd = __lsx_vpickev_h(__lsx_vsat_w(vd, 15), __lsx_vsat_w(vd, 15));

    __lsx_vstelm_d(vd, reinterpret_cast<__m128i *>(&blend), 0, 0);

#else

    const int mr = qRed(rgbAlpha);

    const int mg = qGreen(rgbAlpha);

    const int mb = qBlue(rgbAlpha);

    blend = qRgba64(qt_div_255(s.red()   * mr + d.red()   * (255 - mr)),

                    qt_div_255(s.green() * mg + d.green() * (255 - mg)),

                    qt_div_255(s.blue()  * mb + d.blue()  * (255 - mb)),

                    s.alpha());

#endif

    return blend;

}


static inline void blend_pixel(QRgba64 &dst, QRgba64 src)

{

    if (src.isOpaque())

        dst = src;

    else if (!src.isTransparent()) {

#if defined(__SSE2__)

        const __m128i vd = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&dst));

        const __m128i vs = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&src));

        const __m128i via = _mm_xor_si128(_mm_set1_epi16(-1), _mm_shufflelo_epi16(vs, _MM_SHUFFLE(3, 3, 3, 3)));

        const __m128i vr = _mm_add_epi16(vs, multiplyAlpha65535(vd, via));

        _mm_storel_epi64(reinterpret_cast<__m128i *>(&dst), vr);

#elif defined(__ARM_NEON__)

        const uint16x4_t vd = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&dst)));

        const uint16x4_t vs = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&src)));

        const uint16x4_t via = veor_u16(vdup_n_u16(0xffff), vdup_lane_u16(vs, 3));

        const uint16x4_t vr = vadd_u16(vs, multiplyAlpha65535(vd, via));

        vst1_u64(reinterpret_cast<uint64_t *>(&dst), vreinterpret_u64_u16(vr));

#elif defined(__loongarch_sx)

        const __m128i vd = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&dst), 0);

        const __m128i vs = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&src), 0);

        const __m128i shuffleMask = (__m128i)(v8i16){3, 3, 3, 3, 4, 5, 6, 7};

        const __m128i via = __lsx_vxor_v(__lsx_vreplgr2vr_h(-1), __lsx_vshuf_h(shuffleMask, __lsx_vldi(0), vs));

        const __m128i vr = __lsx_vadd_h(vs, multiplyAlpha65535(vd, via));

        __lsx_vstelm_d(vr, reinterpret_cast<__m128i *>(&dst), 0, 0);

#else

        dst = src + multiplyAlpha65535(dst, 65535 - src.alpha());

#endif

    }

}


static inline void blend_pixel(QRgba64 &dst, QRgba64 src, const int const_alpha)

{

    if (const_alpha == 255)

        return blend_pixel(dst, src);

    if (!src.isTransparent()) {

#if defined(__SSE2__)

        const __m128i vd = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&dst));

        __m128i vs = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(&src));

        vs = multiplyAlpha255(vs, const_alpha);

        const __m128i via = _mm_xor_si128(_mm_set1_epi16(-1), _mm_shufflelo_epi16(vs, _MM_SHUFFLE(3, 3, 3, 3)));

        const __m128i vr = _mm_add_epi16(vs, multiplyAlpha65535(vd, via));

        _mm_storel_epi64(reinterpret_cast<__m128i *>(&dst), vr);

#elif defined(__ARM_NEON__)

        const uint16x4_t vd = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&dst)));

        uint16x4_t vs = vreinterpret_u16_u64(vld1_u64(reinterpret_cast<const uint64_t *>(&src)));

        vs = multiplyAlpha255(vs, const_alpha);

        const uint16x4_t via = veor_u16(vdup_n_u16(0xffff), vdup_lane_u16(vs, 3));

        const uint16x4_t vr = vadd_u16(vs, multiplyAlpha65535(vd, via));

        vst1_u64(reinterpret_cast<uint64_t *>(&dst), vreinterpret_u64_u16(vr));

#elif defined(__loongarch_sx)

        const __m128i vd = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&dst), 0);

        __m128i vs = __lsx_vldrepl_d(reinterpret_cast<const __m128i *>(&src), 0);

        vs = multiplyAlpha255(vs, const_alpha);

        const __m128i shuffleMask = (__m128i)(v8i16){3, 3, 3, 3, 4, 5, 6, 7};

        const __m128i via = __lsx_vxor_v(__lsx_vreplgr2vr_h(-1), __lsx_vshuf_h(shuffleMask, __lsx_vldi(0), vs));

        const __m128i vr = __lsx_vadd_h(vs, multiplyAlpha65535(vd, via));

        __lsx_vstelm_d(vr, reinterpret_cast<__m128i *>(&dst), 0, 0);

#else

        src = multiplyAlpha255(src, const_alpha);

        dst = src + multiplyAlpha65535(dst, 65535 - src.alpha());

#endif

    }

}


QT_END_NAMESPACE


#endif // QRGBA64_P_H

QRgba64
Definition qrgba64.h:12

QPlatformGraphicsBufferHelper
\inmodule QtGui

comp_func_solid_ColorBurn_impl
static void comp_func_solid_ColorBurn_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:2824

OP
#define OP(a, b)

comp_func_solid_ColorDodge_impl
static void comp_func_solid_ColorDodge_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:2583

qt_functionForModeFP_C
CompositionFunctionFP qt_functionForModeFP_C[]
Definition qcompositionfunctions.cpp:4408

comp_func_solid_Darken_impl
static void comp_func_solid_Darken_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:2154

qt_functionForMode_C
CompositionFunction qt_functionForMode_C[]
Definition qcompositionfunctions.cpp:4328

comp_func_solid_SourceOut_template
static void comp_func_solid_SourceOut_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:1002

comp_func_solid_Screen_impl
static void comp_func_solid_Screen_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:1736

comp_func_solid_SoftLight_impl
static void comp_func_solid_SoftLight_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:3289

comp_func_Difference_impl
static void comp_func_Difference_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:3625

comp_func_Plus_template
static void comp_func_Plus_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:1468

hardlight_op
static uint hardlight_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:3047

comp_func_solid_XOR_template
static void comp_func_solid_XOR_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:1304

comp_func_Clear_template
static void comp_func_Clear_template(typename Ops::Type *dest, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:546

comp_func_SourceAtop_template
static void comp_func_SourceAtop_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:1166

comp_func_Multiply_impl
static void comp_func_Multiply_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:1641

comp_func_DestinationIn_template
static void comp_func_DestinationIn_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:944

comp_func_solid_Source_template
static void comp_func_solid_Source_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:597

color_dodge_op
static int color_dodge_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:2567

comp_func_solid_HardLight_impl
static void comp_func_solid_HardLight_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:3058

comp_func_solid_Overlay_impl
static void comp_func_solid_Overlay_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:1939

overlay_op
static int overlay_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:1929

comp_func_DestinationOver_template
static void comp_func_DestinationOver_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:792

comp_func_solid_SourceIn_template
static void comp_func_solid_SourceIn_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:851

comp_func_solid_Plus_template
static void comp_func_solid_Plus_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:1448

comp_func_solid_SourceOver_template
static void comp_func_solid_SourceOver_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:697

Argb32Operations
Argb32OperationsC Argb32Operations
Definition qcompositionfunctions.cpp:86

comp_func_solid_Difference_impl
static void comp_func_solid_Difference_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:3518

multiply_op
static int multiply_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:1527

comp_func_DestinationAtop_template
static void comp_func_DestinationAtop_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:1242

soft_light_op
static int soft_light_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:3273

comp_func_ColorBurn_impl
static void comp_func_ColorBurn_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:2951

comp_func_solid_DestinationOver_template
static void comp_func_solid_DestinationOver_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:779

comp_func_Source_template
static void comp_func_Source_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:612

comp_func_HardLight_impl
static void comp_func_HardLight_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:3175

mix_alpha
static int mix_alpha(int da, int sa)
Definition qcompositionfunctions.cpp:1424

comp_func_solid_DestinationOut_template
static void comp_func_solid_DestinationOut_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:1079

comp_func_SourceOver_template
static void comp_func_SourceOver_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:714

difference_op
static int difference_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:3512

comp_func_solid_SourceAtop_template
static void comp_func_solid_SourceAtop_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:1153

color_burn_op
static int color_burn_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:2808

comp_func_SourceOut_template
static void comp_func_SourceOut_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:1019

qt_functionForModeSolidFP_C
CompositionFunctionSolidFP qt_functionForModeSolidFP_C[]
Definition qcompositionfunctions.cpp:4292

comp_func_Overlay_impl
static void comp_func_Overlay_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:2054

comp_func_Lighten_impl
static void comp_func_Lighten_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:2469

comp_func_solid_DestinationIn_template
static void comp_func_solid_DestinationIn_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:930

comp_func_Darken_impl
static void comp_func_Darken_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:2261

lighten_op
static int lighten_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:2355

comp_func_Screen_impl
static void comp_func_Screen_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:1833

comp_func_solid_DestinationAtop_template
static void comp_func_solid_DestinationAtop_template(typename Ops::Type *dest, int length, typename Ops::Type color, uint const_alpha)
Definition qcompositionfunctions.cpp:1225

qt_functionForMode64_C
CompositionFunction64 qt_functionForMode64_C[]
Definition qcompositionfunctions.cpp:4371

qt_functionForModeSolid_C
CompositionFunctionSolid qt_functionForModeSolid_C[]
Definition qcompositionfunctions.cpp:4212

comp_func_ColorDodge_impl
static void comp_func_ColorDodge_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:2710

comp_func_solid_Multiply_impl
static void comp_func_solid_Multiply_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:1533

comp_func_DestinationOut_template
static void comp_func_DestinationOut_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:1093

comp_func_Exclusion_impl
static void comp_func_Exclusion_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:3816

comp_func_SoftLight_impl
static void comp_func_SoftLight_impl(uint *Q_DECL_RESTRICT dest, const uint *Q_DECL_RESTRICT src, int length, const T &coverage)
Definition qcompositionfunctions.cpp:3418

comp_func_XOR_template
static void comp_func_XOR_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:1318

comp_func_solid_Lighten_impl
static void comp_func_solid_Lighten_impl(uint *dest, int length, uint color, const T &coverage)
Definition qcompositionfunctions.cpp:2361

darken_op
static int darken_op(int dst, int src, int da, int sa)
Definition qcompositionfunctions.cpp:2148

qt_functionForModeSolid64_C
CompositionFunctionSolid64 qt_functionForModeSolid64_C[]
Definition qcompositionfunctions.cpp:4255

comp_func_SourceIn_template
static void comp_func_SourceIn_template(typename Ops::Type *Q_DECL_RESTRICT dest, const typename Ops::Type *Q_DECL_RESTRICT src, int length, uint const_alpha)
Definition qcompositionfunctions.cpp:869

fetch1Pixel< QPixelLayout::BPP1LSB >
uint QT_FASTCALL fetch1Pixel< QPixelLayout::BPP1LSB >(const uchar *src, int index)
Definition qdrawhelper.cpp:58

Q_DECL_RESTRICT
#define Q_DECL_RESTRICT
Definition qdrawhelper_p.h:48

qt_div_255
static constexpr int qt_div_255(int x)
Definition qdrawhelper_p.h:885

Q_DECL_VECTORCALL
#define Q_DECL_VECTORCALL
Definition qdrawhelper_p.h:49

multiplyAlpha65535
static QRgba64 multiplyAlpha65535(QRgba64 rgba64, uint alpha65535)
Definition qrgba64_p.h:80

combineAlpha256
QT_BEGIN_NAMESPACE QRgba64 combineAlpha256(QRgba64 rgba64, uint alpha256)
Definition qrgba64_p.h:26

toArgb32
static uint toArgb32(QRgba64 rgba64)
Definition qrgba64_p.h:303

interpolate65535
static QRgba64 interpolate65535(QRgba64 x, uint alpha1, QRgba64 y, uint alpha2)
Definition qrgba64_p.h:210

interpolate255
static QRgba64 interpolate255(QRgba64 x, uint alpha1, QRgba64 y, uint alpha2)
Definition qrgba64_p.h:147

blend_pixel
static void blend_pixel(QRgba64 &dst, QRgba64 src, const int const_alpha)
Definition qrgba64_p.h:436

addWithSaturation
static QRgba64 addWithSaturation(QRgba64 a, QRgba64 b)
Definition qrgba64_p.h:238

blend_pixel
static void blend_pixel(QRgba64 &dst, QRgba64 src)
Definition qrgba64_p.h:406

toRgba8888
static uint toRgba8888(QRgba64 rgba64)
Definition qrgba64_p.h:328

rgbBlend
static QRgba64 rgbBlend(QRgba64 d, QRgba64 s, uint rgbAlpha)
Definition qrgba64_p.h:344

Argb32OperationsC
Definition qcompositionfunctions.cpp:34

Argb32OperationsC::add
static OptimalType add(OptimalType a, OptimalType b)
Definition qcompositionfunctions.cpp:58

Argb32OperationsC::OptimalType
QRgb OptimalType
Definition qcompositionfunctions.cpp:37

Argb32OperationsC::interpolate
static OptimalType interpolate(OptimalType x, OptimalScalar a1, OptimalType y, OptimalScalar a2)
Definition qcompositionfunctions.cpp:80

Argb32OperationsC::scalarFrom8bit
static Scalar scalarFrom8bit(uint8_t a)
Definition qcompositionfunctions.cpp:45

Argb32OperationsC::isTransparent
static bool isTransparent(Type val)
Definition qcompositionfunctions.cpp:43

Argb32OperationsC::memfill
static void memfill(Type *ptr, Type value, qsizetype len)
Definition qcompositionfunctions.cpp:47

Argb32OperationsC::store
static void store(Type *ptr, OptimalType value)
Definition qcompositionfunctions.cpp:56

Argb32OperationsC::memcpy
static void memcpy(Type *Q_DECL_RESTRICT dest, const Type *Q_DECL_RESTRICT src, qsizetype len)
Definition qcompositionfunctions.cpp:49

Argb32OperationsC::Type
QRgb Type
Definition qcompositionfunctions.cpp:35

Argb32OperationsC::invAlpha
static OptimalScalar invAlpha(OptimalScalar c)
Definition qcompositionfunctions.cpp:66

Argb32OperationsC::convert
static OptimalType convert(const Type &val)
Definition qcompositionfunctions.cpp:54

Argb32OperationsC::plus
static OptimalType plus(OptimalType a, OptimalType b)
Definition qcompositionfunctions.cpp:62

Argb32OperationsC::interpolate8bit
static OptimalType interpolate8bit(OptimalType x, uint8_t a1, OptimalType y, uint8_t a2)
Definition qcompositionfunctions.cpp:74

Argb32OperationsC::Scalar
quint8 Scalar
Definition qcompositionfunctions.cpp:36

Argb32OperationsC::scalar
static OptimalScalar scalar(Scalar v)
Definition qcompositionfunctions.cpp:70

Argb32OperationsC::OptimalScalar
quint8 OptimalScalar
Definition qcompositionfunctions.cpp:38

Argb32OperationsC::multiplyAlpha8bit
static OptimalType multiplyAlpha8bit(OptimalType val, uint8_t a)
Definition qcompositionfunctions.cpp:72

Argb32OperationsC::load
static OptimalType load(const Type *ptr)
Definition qcompositionfunctions.cpp:52

Argb32OperationsC::multiplyAlpha
static OptimalType multiplyAlpha(OptimalType val, OptimalScalar a)
Definition qcompositionfunctions.cpp:76

Argb32OperationsC::alpha
static OptimalScalar alpha(OptimalType val)
Definition qcompositionfunctions.cpp:64

Argb32OperationsC::clear
static const Type clear
Definition qcompositionfunctions.cpp:40

Argb32OperationsC::isOpaque
static bool isOpaque(Type val)
Definition qcompositionfunctions.cpp:41

QFullCoverage
Definition qcompositionfunctions.cpp:1371

QFullCoverage::store
void store(uint *dest, const uint src) const
Definition qcompositionfunctions.cpp:1372

QPartialCoverage
Definition qcompositionfunctions.cpp:1390

QPartialCoverage::store_template
void store_template(typename Op::Type *dest, const typename Op::Type src) const
Definition qcompositionfunctions.cpp:1398

QPartialCoverage::store
void store(uint *dest, const uint src) const
Definition qcompositionfunctions.cpp:1402

QPartialCoverage::QPartialCoverage
QPartialCoverage(uint const_alpha)
Definition qcompositionfunctions.cpp:1391

Rgba64OperationsBase
Definition qcompositionfunctions.cpp:89

Rgba64OperationsBase::isOpaque
static bool isOpaque(Type val)
Definition qcompositionfunctions.cpp:95

Rgba64OperationsBase::Scalar
quint16 Scalar
Definition qcompositionfunctions.cpp:91

Rgba64OperationsBase::clear
static const Type clear
Definition qcompositionfunctions.cpp:93

Rgba64OperationsBase::memcpy
static void memcpy(Type *Q_DECL_RESTRICT dest, const Type *Q_DECL_RESTRICT src, qsizetype len)
Definition qcompositionfunctions.cpp:104

Rgba64OperationsBase::memfill
static void memfill(Type *ptr, Type value, qsizetype len)
Definition qcompositionfunctions.cpp:102

Rgba64OperationsBase::Type
QRgba64 Type
Definition qcompositionfunctions.cpp:90

Rgba64OperationsBase::scalarFrom8bit
static Scalar scalarFrom8bit(uint8_t a)
Definition qcompositionfunctions.cpp:99

Rgba64OperationsBase::isTransparent
static bool isTransparent(Type val)
Definition qcompositionfunctions.cpp:97