d6/d87/qstringconverter_8cpp_source.html

// Copyright (C) 2020 The Qt Company Ltd.

// Copyright (C) 2020 Intel Corporation.

// SPDX-License-Identifier: LicenseRef-Qt-Commercial OR LGPL-3.0-only OR GPL-2.0-only OR GPL-3.0-only


#include <qstringconverter.h>

#include <private/qstringconverter_p.h>

#include "qendian.h"


#include "private/qsimd_p.h"

#include "private/qstringiterator_p.h"

#include "private/qtools_p.h"

#include "qbytearraymatcher.h"

#include "qcontainertools_impl.h"

#include <QtCore/qbytearraylist.h>


#if QT_CONFIG(icu)

#include <unicode/ucnv.h>

#include <unicode/ucnv_cb.h>

#include <unicode/ucnv_err.h>

#include <unicode/ustring.h>

#endif


#ifdef Q_OS_WIN

#include <qt_windows.h>

#ifndef QT_BOOTSTRAPPED

#include <QtCore/qvarlengtharray.h>

#include <QtCore/q20iterator.h>

#include <QtCore/private/qnumeric_p.h>

#endif // !QT_BOOTSTRAPPED

#endif


#include <array>


#if __has_include(<bit>) && __cplusplus > 201703L

#include <bit>

#endif


QT_BEGIN_NAMESPACE


using namespace QtMiscUtils;


static_assert(std::is_nothrow_move_constructible_v<QStringEncoder>);

static_assert(std::is_nothrow_move_assignable_v<QStringEncoder>);

static_assert(std::is_nothrow_move_constructible_v<QStringDecoder>);

static_assert(std::is_nothrow_move_assignable_v<QStringDecoder>);


enum { Endian = 0, Data = 1 };


static const uchar utf8bom[] = { 0xef, 0xbb, 0xbf };


#if defined(__SSE2__) || defined(__ARM_NEON__)

static Q_ALWAYS_INLINE uint qBitScanReverse(unsigned v) noexcept

{

#if defined(__cpp_lib_int_pow2) && __cpp_lib_int_pow2 >= 202002L

     return std::bit_width(v) - 1;

#else

    uint result = qCountLeadingZeroBits(v);

    // Now Invert the result: clz will count *down* from the msb to the lsb, so the msb index is 31

    // and the lsb index is 0. The result for _bit_scan_reverse is expected to be the index when

    // counting up: msb index is 0 (because it starts there), and the lsb index is 31.

    result ^= sizeof(unsigned) * 8 - 1;

    return result;

#endif

}

#endif


#if defined(__SSE2__)

static inline bool simdEncodeAscii(uchar *&dst, const char16_t *&nextAscii, const char16_t *&src, const char16_t *end)

{

    // do sixteen characters at a time

    for ( ; end - src >= 16; src += 16, dst += 16) {

#  ifdef __AVX2__

        __m256i data = _mm256_loadu_si256(reinterpret_cast<const __m256i *>(src));

        __m128i data1 = _mm256_castsi256_si128(data);

        __m128i data2 = _mm256_extracti128_si256(data, 1);

#  else

        __m128i data1 = _mm_loadu_si128((const __m128i*)src);

        __m128i data2 = _mm_loadu_si128(1+(const __m128i*)src);

#  endif


        // check if everything is ASCII

        // the highest ASCII value is U+007F

        // Do the packing directly:

        // The PACKUSWB instruction has packs a signed 16-bit integer to an unsigned 8-bit

        // with saturation. That is, anything from 0x0100 to 0x7fff is saturated to 0xff,

        // while all negatives (0x8000 to 0xffff) get saturated to 0x00. To detect non-ASCII,

        // we simply do a signed greater-than comparison to 0x00. That means we detect NULs as

        // "non-ASCII", but it's an acceptable compromise.

        __m128i packed = _mm_packus_epi16(data1, data2);

        __m128i nonAscii = _mm_cmpgt_epi8(packed, _mm_setzero_si128());


        // store, even if there are non-ASCII characters here

        _mm_storeu_si128((__m128i*)dst, packed);


        // n will contain 1 bit set per character in [data1, data2] that is non-ASCII (or NUL)

        ushort n = ~_mm_movemask_epi8(nonAscii);

        if (n) {

            // find the next probable ASCII character

            // we don't want to load 32 bytes again in this loop if we know there are non-ASCII

            // characters still coming

            nextAscii = src + qBitScanReverse(n) + 1;


            n = qCountTrailingZeroBits(n);

            dst += n;

            src += n;

            return false;

        }

    }


    if (end - src >= 8) {

        // do eight characters at a time

        __m128i data = _mm_loadu_si128(reinterpret_cast<const __m128i *>(src));

        __m128i packed = _mm_packus_epi16(data, data);

        __m128i nonAscii = _mm_cmpgt_epi8(packed, _mm_setzero_si128());


        // store even non-ASCII

        _mm_storel_epi64(reinterpret_cast<__m128i *>(dst), packed);


        uchar n = ~_mm_movemask_epi8(nonAscii);

        if (n) {

            nextAscii = src + qBitScanReverse(n) + 1;

            n = qCountTrailingZeroBits(n);

            dst += n;

            src += n;

            return false;

        }

    }


    return src == end;

}


static inline bool simdDecodeAscii(char16_t *&dst, const uchar *&nextAscii, const uchar *&src, const uchar *end)

{

    // do sixteen characters at a time

    for ( ; end - src >= 16; src += 16, dst += 16) {

        __m128i data = _mm_loadu_si128((const __m128i*)src);


#ifdef __AVX2__

        const int BitSpacing = 2;

        // load and zero extend to an YMM register

        const __m256i extended = _mm256_cvtepu8_epi16(data);


        uint n = _mm256_movemask_epi8(extended);

        if (!n) {

            // store

            _mm256_storeu_si256((__m256i*)dst, extended);

            continue;

        }

#else

        const int BitSpacing = 1;


        // check if everything is ASCII

        // movemask extracts the high bit of every byte, so n is non-zero if something isn't ASCII

        uint n = _mm_movemask_epi8(data);

        if (!n) {

            // unpack

            _mm_storeu_si128((__m128i*)dst, _mm_unpacklo_epi8(data, _mm_setzero_si128()));

            _mm_storeu_si128(1+(__m128i*)dst, _mm_unpackhi_epi8(data, _mm_setzero_si128()));

            continue;

        }

#endif


        // copy the front part that is still ASCII

        while (!(n & 1)) {

            *dst++ = *src++;

            n >>= BitSpacing;

        }


        // find the next probable ASCII character

        // we don't want to load 16 bytes again in this loop if we know there are non-ASCII

        // characters still coming

        n = qBitScanReverse(n);

        nextAscii = src + (n / BitSpacing) + 1;

        return false;


    }


    if (end - src >= 8) {

        __m128i data = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(src));

        uint n = _mm_movemask_epi8(data) & 0xff;

        if (!n) {

            // unpack and store

            _mm_storeu_si128(reinterpret_cast<__m128i *>(dst), _mm_unpacklo_epi8(data, _mm_setzero_si128()));

        } else {

            while (!(n & 1)) {

                *dst++ = *src++;

                n >>= 1;

            }


            n = qBitScanReverse(n);

            nextAscii = src + n + 1;

            return false;

        }

    }


    return src == end;

}


static inline const uchar *simdFindNonAscii(const uchar *src, const uchar *end, const uchar *&nextAscii)

{

#ifdef __AVX2__

    // do 32 characters at a time

    // (this is similar to simdTestMask in qstring.cpp)

    const __m256i mask = _mm256_set1_epi8(char(0x80));

    for ( ; end - src >= 32; src += 32) {

        __m256i data = _mm256_loadu_si256(reinterpret_cast<const __m256i *>(src));

        if (_mm256_testz_si256(mask, data))

            continue;


        uint n = _mm256_movemask_epi8(data);

        Q_ASSERT(n);


        // find the next probable ASCII character

        // we don't want to load 32 bytes again in this loop if we know there are non-ASCII

        // characters still coming

        nextAscii = src + qBitScanReverse(n) + 1;


        // return the non-ASCII character

        return src + qCountTrailingZeroBits(n);

    }

#endif


    // do sixteen characters at a time

    for ( ; end - src >= 16; src += 16) {

        __m128i data = _mm_loadu_si128(reinterpret_cast<const __m128i*>(src));


        // check if everything is ASCII

        // movemask extracts the high bit of every byte, so n is non-zero if something isn't ASCII

        uint n = _mm_movemask_epi8(data);

        if (!n)

            continue;


        // find the next probable ASCII character

        // we don't want to load 16 bytes again in this loop if we know there are non-ASCII

        // characters still coming

        nextAscii = src + qBitScanReverse(n) + 1;


        // return the non-ASCII character

        return src + qCountTrailingZeroBits(n);

    }


    // do four characters at a time

    for ( ; end - src >= 4; src += 4) {

        quint32 data = qFromUnaligned<quint32>(src);

        data &= 0x80808080U;

        if (!data)

            continue;


        // We don't try to guess which of the three bytes is ASCII and which

        // one isn't. The chance that at least two of them are non-ASCII is

        // better than 75%.

        nextAscii = src;

        return src;

    }

    nextAscii = end;

    return src;

}


// Compare only the US-ASCII beginning of [src8, end8) and [src16, end16)

// and advance src8 and src16 to the first character that could not be compared

static void simdCompareAscii(const qchar8_t *&src8, const qchar8_t *end8, const char16_t *&src16, const char16_t *end16)

{

    int bitSpacing = 1;

    qptrdiff len = qMin(end8 - src8, end16 - src16);

    qptrdiff offset = 0;

    uint mask = 0;


    // do sixteen characters at a time

    for ( ; offset + 16 < len; offset += 16) {

        __m128i data8 = _mm_loadu_si128(reinterpret_cast<const __m128i *>(src8 + offset));

#ifdef __AVX2__

        // AVX2 version, use 256-bit registers and VPMOVXZBW

        __m256i data16 = _mm256_loadu_si256(reinterpret_cast<const __m256i *>(src16 + offset));


        // expand US-ASCII as if it were Latin1 and confirm it's US-ASCII

        __m256i datax8 = _mm256_cvtepu8_epi16(data8);

        mask = _mm256_movemask_epi8(datax8);

        if (mask)

            break;


        // compare Latin1 to UTF-16

        __m256i latin1cmp = _mm256_cmpeq_epi16(datax8, data16);

        mask = ~_mm256_movemask_epi8(latin1cmp);

        if (mask)

            break;

#else

        // non-AVX2 code

        __m128i datalo16 = _mm_loadu_si128(reinterpret_cast<const __m128i *>(src16 + offset));

        __m128i datahi16 = _mm_loadu_si128(reinterpret_cast<const __m128i *>(src16 + offset) + 1);


        // expand US-ASCII as if it were Latin1, we'll confirm later

        __m128i datalo8 = _mm_unpacklo_epi8(data8, _mm_setzero_si128());

        __m128i datahi8 = _mm_unpackhi_epi8(data8, _mm_setzero_si128());


        // compare Latin1 to UTF-16

        __m128i latin1cmplo = _mm_cmpeq_epi16(datalo8, datalo16);

        __m128i latin1cmphi = _mm_cmpeq_epi16(datahi8, datahi16);

        mask = _mm_movemask_epi8(latin1cmphi) << 16;

        mask |= ushort(_mm_movemask_epi8(latin1cmplo));

        mask = ~mask;

        if (mask)

            break;


        // confirm it was US-ASCII

        mask = _mm_movemask_epi8(data8);

        if (mask) {

            bitSpacing = 0;

            break;

        }

#endif

    }


    // helper for comparing 4 or 8 characters

    auto cmp_lt_16 = [&mask, &offset](int n, __m128i data8, __m128i data16) {

        // n = 4  ->  sizemask = 0xff

        // n = 8  ->  sizemask = 0xffff

        unsigned sizemask = (1U << (2 * n)) - 1;


        // expand as if Latin1

        data8 = _mm_unpacklo_epi8(data8, _mm_setzero_si128());


        // compare and confirm it's US-ASCII

        __m128i latin1cmp = _mm_cmpeq_epi16(data8, data16);

        mask = ~_mm_movemask_epi8(latin1cmp) & sizemask;

        mask |= _mm_movemask_epi8(data8);

        if (mask == 0)

            offset += n;

    };


    // do eight characters at a time

    if (mask == 0 && offset + 8 < len) {

        __m128i data8 = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(src8 + offset));

        __m128i data16 = _mm_loadu_si128(reinterpret_cast<const __m128i *>(src16 + offset));

        cmp_lt_16(8, data8, data16);

    }


    // do four characters

    if (mask == 0 && offset + 4 < len) {

        __m128i data8 = _mm_cvtsi32_si128(qFromUnaligned<quint32>(src8 + offset));

        __m128i data16 = _mm_loadl_epi64(reinterpret_cast<const __m128i *>(src16 + offset));

        cmp_lt_16(4, data8, data16);

    }


    // correct the source pointers to point to the first character we couldn't deal with

    if (mask)

        offset += qCountTrailingZeroBits(mask) >> bitSpacing;

    src8 += offset;

    src16 += offset;

}

#elif defined(__ARM_NEON__)

static inline bool simdEncodeAscii(uchar *&dst, const char16_t *&nextAscii, const char16_t *&src, const char16_t *end)

{

    uint16x8_t maxAscii = vdupq_n_u16(0x7f);

    uint16x8_t mask1 = { 1,      1 << 2, 1 << 4, 1 << 6, 1 << 8, 1 << 10, 1 << 12, 1 << 14 };

    uint16x8_t mask2 = vshlq_n_u16(mask1, 1);


    // do sixteen characters at a time

    for ( ; end - src >= 16; src += 16, dst += 16) {

        // load 2 lanes (or: "load interleaved")

        uint16x8x2_t in = vld2q_u16(reinterpret_cast<const uint16_t *>(src));


        // check if any of the elements > 0x7f, select 1 bit per element (element 0 -> bit 0, element 1 -> bit 1, etc),

        // add those together into a scalar, and merge the scalars.

        uint16_t nonAscii = vaddvq_u16(vandq_u16(vcgtq_u16(in.val[0], maxAscii), mask1))

                          | vaddvq_u16(vandq_u16(vcgtq_u16(in.val[1], maxAscii), mask2));


        // merge the two lanes by shifting the values of the second by 8 and inserting them

        uint16x8_t out = vsliq_n_u16(in.val[0], in.val[1], 8);


        // store, even if there are non-ASCII characters here

        vst1q_u8(dst, vreinterpretq_u8_u16(out));


        if (nonAscii) {

            // find the next probable ASCII character

            // we don't want to load 32 bytes again in this loop if we know there are non-ASCII

            // characters still coming

            nextAscii = src + qBitScanReverse(nonAscii) + 1;


            nonAscii = qCountTrailingZeroBits(nonAscii);

            dst += nonAscii;

            src += nonAscii;

            return false;

        }

    }

    return src == end;

}


static inline bool simdDecodeAscii(char16_t *&dst, const uchar *&nextAscii, const uchar *&src, const uchar *end)

{

    // do eight characters at a time

    uint8x8_t msb_mask = vdup_n_u8(0x80);

    uint8x8_t add_mask = { 1, 1 << 1, 1 << 2, 1 << 3, 1 << 4, 1 << 5, 1 << 6, 1 << 7 };

    for ( ; end - src >= 8; src += 8, dst += 8) {

        uint8x8_t c = vld1_u8(src);

        uint8_t n = vaddv_u8(vand_u8(vcge_u8(c, msb_mask), add_mask));

        if (!n) {

            // store

            vst1q_u16(reinterpret_cast<uint16_t *>(dst), vmovl_u8(c));

            continue;

        }


        // copy the front part that is still ASCII

        while (!(n & 1)) {

            *dst++ = *src++;

            n >>= 1;

        }


        // find the next probable ASCII character

        // we don't want to load 16 bytes again in this loop if we know there are non-ASCII

        // characters still coming

        n = qBitScanReverse(n);

        nextAscii = src + n + 1;

        return false;


    }

    return src == end;

}


static inline const uchar *simdFindNonAscii(const uchar *src, const uchar *end, const uchar *&nextAscii)

{

    // The SIMD code below is untested, so just force an early return until

    // we've had the time to verify it works.

    nextAscii = end;

    return src;


    // do eight characters at a time

    uint8x8_t msb_mask = vdup_n_u8(0x80);

    uint8x8_t add_mask = { 1, 1 << 1, 1 << 2, 1 << 3, 1 << 4, 1 << 5, 1 << 6, 1 << 7 };

    for ( ; end - src >= 8; src += 8) {

        uint8x8_t c = vld1_u8(src);

        uint8_t n = vaddv_u8(vand_u8(vcge_u8(c, msb_mask), add_mask));

        if (!n)

            continue;


        // find the next probable ASCII character

        // we don't want to load 16 bytes again in this loop if we know there are non-ASCII

        // characters still coming

        nextAscii = src + qBitScanReverse(n) + 1;


        // return the non-ASCII character

        return src + qCountTrailingZeroBits(n);

    }

    nextAscii = end;

    return src;

}


static void simdCompareAscii(const qchar8_t *&, const qchar8_t *, const char16_t *&, const char16_t *)

{

}

#else


static inline bool simdEncodeAscii(uchar *, const char16_t *, const char16_t *, const char16_t *)

{

    return false;

}


static inline bool simdDecodeAscii(char16_t *, const uchar *, const uchar *, const uchar *)

{

    return false;

}


static inline const uchar *simdFindNonAscii(const uchar *src, const uchar *end, const uchar *&nextAscii)

{

    nextAscii = end;

    return src;

}


static void simdCompareAscii(const qchar8_t *&, const qchar8_t *, const char16_t *&, const char16_t *)

{

}


#endif


enum { HeaderDone = 1 };


QByteArray QUtf8::convertFromUnicode(QStringView in)

{

    qsizetype len = in.size();


    // create a QByteArray with the worst case scenario size

    QByteArray result(len * 3, Qt::Uninitialized);

    uchar *dst = reinterpret_cast<uchar *>(const_cast<char *>(result.constData()));

    const char16_t *src = reinterpret_cast<const char16_t *>(in.data());

    const char16_t *const end = src + len;


    while (src != end) {

        const char16_t *nextAscii = end;

        if (simdEncodeAscii(dst, nextAscii, src, end))

            break;


        do {

            char16_t u = *src++;

            int res = QUtf8Functions::toUtf8<QUtf8BaseTraits>(u, dst, src, end);

            if (res < 0) {

                // encoding error - append '?'

                *dst++ = '?';

            }

        } while (src < nextAscii);

    }


    result.truncate(dst - reinterpret_cast<uchar *>(const_cast<char *>(result.constData())));

    return result;

}


QByteArray QUtf8::convertFromUnicode(QStringView in, QStringConverterBase::State *state)

{

    QByteArray ba(3*in.size() +3, Qt::Uninitialized);

    char *end = convertFromUnicode(ba.data(), in, state);

    ba.truncate(end - ba.data());

    return ba;

}


char *QUtf8::convertFromUnicode(char *out, QStringView in, QStringConverter::State *state)

{

    Q_ASSERT(state);

    qsizetype len = in.size();

    if (!len)

        return out;


    auto appendReplacementChar = [state](uchar *cursor) -> uchar * {

        if (state->flags & QStringConverter::Flag::ConvertInvalidToNull) {

            *cursor++ = 0;

        } else {

            // QChar::replacement encoded in utf8

            *cursor++ = 0xef;

            *cursor++ = 0xbf;

            *cursor++ = 0xbd;

        }

        return cursor;

    };


    uchar *cursor = reinterpret_cast<uchar *>(out);

    const char16_t *src = in.utf16();

    const char16_t *const end = src + len;


    if (!(state->flags & QStringDecoder::Flag::Stateless)) {

        if (state->remainingChars) {

            int res = QUtf8Functions::toUtf8<QUtf8BaseTraits>(state->state_data[0], cursor, src, end);

            if (res < 0)

                cursor = appendReplacementChar(cursor);

            state->state_data[0] = 0;

            state->remainingChars = 0;

        } else if (!(state->internalState & HeaderDone) && state->flags & QStringConverter::Flag::WriteBom) {

            // append UTF-8 BOM

            *cursor++ = utf8bom[0];

            *cursor++ = utf8bom[1];

            *cursor++ = utf8bom[2];

            state->internalState |= HeaderDone;

        }

    }


    while (src != end) {

        const char16_t *nextAscii = end;

        if (simdEncodeAscii(cursor, nextAscii, src, end))

            break;


        do {

            char16_t uc = *src++;

            int res = QUtf8Functions::toUtf8<QUtf8BaseTraits>(uc, cursor, src, end);

            if (Q_LIKELY(res >= 0))

                continue;


            if (res == QUtf8BaseTraits::Error) {

                // encoding error

                ++state->invalidChars;

                cursor = appendReplacementChar(cursor);

            } else if (res == QUtf8BaseTraits::EndOfString) {

                if (state->flags & QStringConverter::Flag::Stateless) {

                    ++state->invalidChars;

                    cursor = appendReplacementChar(cursor);

                } else {

                    state->remainingChars = 1;

                    state->state_data[0] = uc;

                }

                return reinterpret_cast<char *>(cursor);

            }

        } while (src < nextAscii);

    }


    return reinterpret_cast<char *>(cursor);

}


char *QUtf8::convertFromLatin1(char *out, QLatin1StringView in)

{

    // ### SIMD-optimize:

    for (uchar ch : in) {

        if (ch < 128) {

            *out++ = ch;

        } else {

            // as per https://en.wikipedia.org/wiki/UTF-8#Encoding, 2nd row

            *out++ = 0b110'0'0000u | (ch >> 6);

            *out++ = 0b10'00'0000u | (ch & 0b0011'1111);

        }

    }

    return out;

}


QString QUtf8::convertToUnicode(QByteArrayView in)

{

    // UTF-8 to UTF-16 always needs the exact same number of words or less:

    //    UTF-8     UTF-16

    //   1 byte     1 word

    //   2 bytes    1 word

    //   3 bytes    1 word

    //   4 bytes    2 words (one surrogate pair)

    // That is, we'll use the full buffer if the input is US-ASCII (1-byte UTF-8),

    // half the buffer for U+0080-U+07FF text (e.g., Greek, Cyrillic, Arabic) or

    // non-BMP text, and one third of the buffer for U+0800-U+FFFF text (e.g, CJK).

    //

    // The table holds for invalid sequences too: we'll insert one replacement char

    // per invalid byte.

    QString result(in.size(), Qt::Uninitialized);

    QChar *data = const_cast<QChar*>(result.constData()); // we know we're not shared

    const QChar *end = convertToUnicode(data, in);

    result.truncate(end - data);

    return result;

}


char16_t *QUtf8::convertToUnicode(char16_t *dst, QByteArrayView in) noexcept

{

    const uchar *const start = reinterpret_cast<const uchar *>(in.data());

    const uchar *src = start;

    const uchar *end = src + in.size();


    // attempt to do a full decoding in SIMD

    const uchar *nextAscii = end;

    if (!simdDecodeAscii(dst, nextAscii, src, end)) {

        // at least one non-ASCII entry

        // check if we failed to decode the UTF-8 BOM; if so, skip it

        if (Q_UNLIKELY(src == start)

                && end - src >= 3

                && Q_UNLIKELY(src[0] == utf8bom[0] && src[1] == utf8bom[1] && src[2] == utf8bom[2])) {

            src += 3;

        }


        while (src < end) {

            nextAscii = end;

            if (simdDecodeAscii(dst, nextAscii, src, end))

                break;


            do {

                uchar b = *src++;

                const qsizetype res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(b, dst, src, end);

                if (res < 0) {

                    // decoding error

                    *dst++ = QChar::ReplacementCharacter;

                }

            } while (src < nextAscii);

        }

    }


    return dst;

}


QString QUtf8::convertToUnicode(QByteArrayView in, QStringConverter::State *state)

{

    // See above for buffer requirements for stateless decoding. However, that

    // fails if the state is not empty. The following situations can add to the

    // requirements:

    //  state contains      chars starts with           requirement

    //   1 of 2 bytes       valid continuation          0

    //   2 of 3 bytes       same                        0

    //   3 bytes of 4       same                        +1 (need to insert surrogate pair)

    //   1 of 2 bytes       invalid continuation        +1 (need to insert replacement and restart)

    //   2 of 3 bytes       same                        +1 (same)

    //   3 of 4 bytes       same                        +1 (same)

    QString result(in.size() + 1, Qt::Uninitialized);

    QChar *end = convertToUnicode(result.data(), in, state);

    result.truncate(end - result.constData());

    return result;

}


char16_t *QUtf8::convertToUnicode(char16_t *dst, QByteArrayView in, QStringConverter::State *state)

{

    qsizetype len = in.size();


    Q_ASSERT(state);

    if (!len)

        return dst;


    char16_t replacement = QChar::ReplacementCharacter;

    if (state->flags & QStringConverter::Flag::ConvertInvalidToNull)

        replacement = QChar::Null;


    qsizetype res;

    uchar ch = 0;


    const uchar *src = reinterpret_cast<const uchar *>(in.data());

    const uchar *end = src + len;


    if (!(state->flags & QStringConverter::Flag::Stateless)) {

        bool headerdone = state->internalState & HeaderDone || state->flags & QStringConverter::Flag::ConvertInitialBom;

        if (state->remainingChars || !headerdone) {

            // handle incoming state first

            uchar remainingCharsData[4]; // longest UTF-8 sequence possible

            qsizetype remainingCharsCount = state->remainingChars;

            qsizetype newCharsToCopy = qMin<qsizetype>(sizeof(remainingCharsData) - remainingCharsCount, end - src);


            memset(remainingCharsData, 0, sizeof(remainingCharsData));

            memcpy(remainingCharsData, &state->state_data[0], remainingCharsCount);

            memcpy(remainingCharsData + remainingCharsCount, src, newCharsToCopy);


            const uchar *begin = &remainingCharsData[1];

            res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(remainingCharsData[0], dst, begin,

                    static_cast<const uchar *>(remainingCharsData) + remainingCharsCount + newCharsToCopy);

            if (res == QUtf8BaseTraits::Error) {

                ++state->invalidChars;

                *dst++ = replacement;

                ++src;

            } else if (res == QUtf8BaseTraits::EndOfString) {

                // if we got EndOfString again, then there were too few bytes in src;

                // copy to our state and return

                state->remainingChars = remainingCharsCount + newCharsToCopy;

                memcpy(&state->state_data[0], remainingCharsData, state->remainingChars);

                return dst;

            } else if (!headerdone) {

                // eat the UTF-8 BOM

                if (dst[-1] == 0xfeff)

                    --dst;

            }

            state->internalState |= HeaderDone;


            // adjust src now that we have maybe consumed a few chars

            if (res >= 0) {

                Q_ASSERT(res > remainingCharsCount);

                src += res - remainingCharsCount;

            }

        }

    } else if (!(state->flags & QStringConverter::Flag::ConvertInitialBom)) {

        // stateless, remove initial BOM

        if (len > 2 && src[0] == utf8bom[0] && src[1] == utf8bom[1] && src[2] == utf8bom[2])

            // skip BOM

            src += 3;

    }


    // main body, stateless decoding

    res = 0;

    const uchar *nextAscii = src;

    while (res >= 0 && src < end) {

        if (src >= nextAscii && simdDecodeAscii(dst, nextAscii, src, end))

            break;


        ch = *src++;

        res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(ch, dst, src, end);

        if (res == QUtf8BaseTraits::Error) {

            res = 0;

            ++state->invalidChars;

            *dst++ = replacement;

        }

    }


    if (res == QUtf8BaseTraits::EndOfString) {

        // unterminated UTF sequence

        if (state->flags & QStringConverter::Flag::Stateless) {

            *dst++ = QChar::ReplacementCharacter;

            ++state->invalidChars;

            while (src++ < end) {

                *dst++ = QChar::ReplacementCharacter;

                ++state->invalidChars;

            }

            state->remainingChars = 0;

        } else {

            --src; // unread the byte in ch

            state->remainingChars = end - src;

            memcpy(&state->state_data[0], src, end - src);

        }

    } else {

        state->remainingChars = 0;

    }


    return dst;

}


struct QUtf8NoOutputTraits : public QUtf8BaseTraitsNoAscii

{

    struct NoOutput {};

    static void appendUtf16(const NoOutput &, char16_t) {}

    static void appendUcs4(const NoOutput &, char32_t) {}

};


QUtf8::ValidUtf8Result QUtf8::isValidUtf8(QByteArrayView in)

{

    const uchar *src = reinterpret_cast<const uchar *>(in.data());

    const uchar *end = src + in.size();

    const uchar *nextAscii = src;

    bool isValidAscii = true;


    while (src < end) {

        if (src >= nextAscii)

            src = simdFindNonAscii(src, end, nextAscii);

        if (src == end)

            break;


        do {

            uchar b = *src++;

            if ((b & 0x80) == 0)

                continue;


            isValidAscii = false;

            QUtf8NoOutputTraits::NoOutput output;

            const qsizetype res = QUtf8Functions::fromUtf8<QUtf8NoOutputTraits>(b, output, src, end);

            if (res < 0) {

                // decoding error

                return { false, false };

            }

        } while (src < nextAscii);

    }


    return { true, isValidAscii };

}


int QUtf8::compareUtf8(QByteArrayView utf8, QStringView utf16, Qt::CaseSensitivity cs) noexcept

{

    auto src1 = reinterpret_cast<const qchar8_t *>(utf8.data());

    auto end1 = src1 + utf8.size();

    auto src2 = reinterpret_cast<const char16_t *>(utf16.data());

    auto end2 = src2 + utf16.size();


    do {

        simdCompareAscii(src1, end1, src2, end2);


        if (src1 < end1 && src2 < end2) {

            char32_t uc1 = *src1++;

            char32_t uc2 = *src2++;


            if (uc1 >= 0x80) {

                char32_t *output = &uc1;

                qsizetype res = QUtf8Functions::fromUtf8<QUtf8BaseTraitsNoAscii>(uc1, output, src1, end1);

                if (res < 0) {

                    // decoding error

                    uc1 = QChar::ReplacementCharacter;

                }


                // Only decode the UTF-16 surrogate pair if the UTF-8 code point

                // wasn't US-ASCII (a surrogate cannot match US-ASCII).

                if (QChar::isHighSurrogate(uc2) && src2 < end2 && QChar::isLowSurrogate(*src2))

                    uc2 = QChar::surrogateToUcs4(uc2, *src2++);

            }

            if (cs == Qt::CaseInsensitive) {

                uc1 = QChar::toCaseFolded(uc1);

                uc2 = QChar::toCaseFolded(uc2);

            }

            if (uc1 != uc2)

                return int(uc1) - int(uc2);

        }

    } while (src1 < end1 && src2 < end2);


    // the shorter string sorts first

    return (end1 > src1) - int(end2 > src2);

}


int QUtf8::compareUtf8(QByteArrayView utf8, QLatin1StringView s, Qt::CaseSensitivity cs)

{

    char32_t uc1 = QChar::Null;

    auto src1 = reinterpret_cast<const uchar *>(utf8.data());

    auto end1 = src1 + utf8.size();

    auto src2 = reinterpret_cast<const uchar *>(s.latin1());

    auto end2 = src2 + s.size();


    while (src1 < end1 && src2 < end2) {

        uchar b = *src1++;

        char32_t *output = &uc1;

        const qsizetype res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(b, output, src1, end1);

        if (res < 0) {

            // decoding error

            uc1 = QChar::ReplacementCharacter;

        }


        char32_t uc2 = *src2++;

        if (cs == Qt::CaseInsensitive) {

            uc1 = QChar::toCaseFolded(uc1);

            uc2 = QChar::toCaseFolded(uc2);

        }

        if (uc1 != uc2)

            return int(uc1) - int(uc2);

    }


    // the shorter string sorts first

    return (end1 > src1) - (end2 > src2);

}


int QUtf8::compareUtf8(QByteArrayView lhs, QByteArrayView rhs, Qt::CaseSensitivity cs) noexcept

{

    if (lhs.isEmpty())

        return qt_lencmp(0, rhs.size());


    if (cs == Qt::CaseSensitive) {

        const auto l = std::min(lhs.size(), rhs.size());

        int r = memcmp(lhs.data(), rhs.data(), l);

        return r ? r : qt_lencmp(lhs.size(), rhs.size());

    }


    char32_t uc1 = QChar::Null;

    auto src1 = reinterpret_cast<const uchar *>(lhs.data());

    auto end1 = src1 + lhs.size();

    char32_t uc2 = QChar::Null;

    auto src2 = reinterpret_cast<const uchar *>(rhs.data());

    auto end2 = src2 + rhs.size();


    while (src1 < end1 && src2 < end2) {

        uchar b = *src1++;

        char32_t *output = &uc1;

        qsizetype res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(b, output, src1, end1);

        if (res < 0) {

            // decoding error

            uc1 = QChar::ReplacementCharacter;

        }


        b = *src2++;

        output = &uc2;

        res = QUtf8Functions::fromUtf8<QUtf8BaseTraits>(b, output, src2, end2);

        if (res < 0) {

            // decoding error

            uc2 = QChar::ReplacementCharacter;

        }


        uc1 = QChar::toCaseFolded(uc1);

        uc2 = QChar::toCaseFolded(uc2);

        if (uc1 != uc2)

            return int(uc1) - int(uc2);

    }


    // the shorter string sorts first

    return (end1 > src1) - (end2 > src2);

}


#ifndef QT_BOOTSTRAPPED


QByteArray QUtf16::convertFromUnicode(QStringView in, QStringConverter::State *state, DataEndianness endian)

{

    bool writeBom = !(state->internalState & HeaderDone) && state->flags & QStringConverter::Flag::WriteBom;

    qsizetype length = 2 * in.size();

    if (writeBom)

        length += 2;


    QByteArray d(length, Qt::Uninitialized);

    char *end = convertFromUnicode(d.data(), in, state, endian);

    Q_ASSERT(end - d.constData() == d.size());

    Q_UNUSED(end);

    return d;

}


char *QUtf16::convertFromUnicode(char *out, QStringView in, QStringConverter::State *state, DataEndianness endian)

{

    Q_ASSERT(state);

    bool writeBom = !(state->internalState & HeaderDone) && state->flags & QStringConverter::Flag::WriteBom;


    if (endian == DetectEndianness)

        endian = (QSysInfo::ByteOrder == QSysInfo::BigEndian) ? BigEndianness : LittleEndianness;


    if (writeBom) {

        // set them up the BOM

        QChar bom(QChar::ByteOrderMark);

        if (endian == BigEndianness)

            qToBigEndian(bom.unicode(), out);

        else

            qToLittleEndian(bom.unicode(), out);

        out += 2;

    }

    if (endian == BigEndianness)

        qToBigEndian<char16_t>(in.data(), in.size(), out);

    else

        qToLittleEndian<char16_t>(in.data(), in.size(), out);


    state->remainingChars = 0;

    state->internalState |= HeaderDone;

    return out + 2*in.size();

}


QString QUtf16::convertToUnicode(QByteArrayView in, QStringConverter::State *state, DataEndianness endian)

{

    QString result((in.size() + 1) >> 1, Qt::Uninitialized); // worst case

    QChar *qch = convertToUnicode(result.data(), in, state, endian);

    result.truncate(qch - result.constData());

    return result;

}


QChar *QUtf16::convertToUnicode(QChar *out, QByteArrayView in, QStringConverter::State *state, DataEndianness endian)

{

    qsizetype len = in.size();

    const char *chars = in.data();


    Q_ASSERT(state);


    if (endian == DetectEndianness)

        endian = (DataEndianness)state->state_data[Endian];


    const char *end = chars + len;


    // make sure we can decode at least one char

    if (state->remainingChars + len < 2) {

        if (len) {

            Q_ASSERT(state->remainingChars == 0 && len == 1);

            state->remainingChars = 1;

            state->state_data[Data] = *chars;

        }

        return out;

    }


    bool headerdone = state && state->internalState & HeaderDone;

    if (state->flags & QStringConverter::Flag::ConvertInitialBom)

        headerdone = true;


    if (!headerdone || state->remainingChars) {

        uchar buf;

        if (state->remainingChars)

            buf = state->state_data[Data];

        else

            buf = *chars++;


        // detect BOM, set endianness

        state->internalState |= HeaderDone;

        QChar ch(buf, *chars++);

        if (endian == DetectEndianness) {

            // someone set us up the BOM

            if (ch == QChar::ByteOrderSwapped) {

                endian = BigEndianness;

            } else if (ch == QChar::ByteOrderMark) {

                endian = LittleEndianness;

            } else {

                if (QSysInfo::ByteOrder == QSysInfo::BigEndian) {

                    endian = BigEndianness;

                } else {

                    endian = LittleEndianness;

                }

            }

        }

        if (endian == BigEndianness)

            ch = QChar::fromUcs2((ch.unicode() >> 8) | ((ch.unicode() & 0xff) << 8));

        if (headerdone || ch != QChar::ByteOrderMark)

            *out++ = ch;

    } else if (endian == DetectEndianness) {

        endian = (QSysInfo::ByteOrder == QSysInfo::BigEndian) ? BigEndianness : LittleEndianness;

    }


    qsizetype nPairs = (end - chars) >> 1;

    if (endian == BigEndianness)

        qFromBigEndian<char16_t>(chars, nPairs, out);

    else

        qFromLittleEndian<char16_t>(chars, nPairs, out);

    out += nPairs;


    state->state_data[Endian] = endian;

    state->remainingChars = 0;

    if ((end - chars) & 1) {

        if (state->flags & QStringConverter::Flag::Stateless) {

            *out++ = state->flags & QStringConverter::Flag::ConvertInvalidToNull ? QChar::Null : QChar::ReplacementCharacter;

        } else {

            state->remainingChars = 1;

            state->state_data[Data] = *(end - 1);

        }

    } else {

        state->state_data[Data] = 0;

    }


    return out;

}


QByteArray QUtf32::convertFromUnicode(QStringView in, QStringConverter::State *state, DataEndianness endian)

{

    bool writeBom = !(state->internalState & HeaderDone) && state->flags & QStringConverter::Flag::WriteBom;

    qsizetype length =  4*in.size();

    if (writeBom)

        length += 4;

    QByteArray ba(length, Qt::Uninitialized);

    char *end = convertFromUnicode(ba.data(), in, state, endian);

    ba.truncate(end - ba.constData());

    return ba;

}


char *QUtf32::convertFromUnicode(char *out, QStringView in, QStringConverter::State *state, DataEndianness endian)

{

    Q_ASSERT(state);


    bool writeBom = !(state->internalState & HeaderDone) && state->flags & QStringConverter::Flag::WriteBom;

    if (endian == DetectEndianness)

        endian = (QSysInfo::ByteOrder == QSysInfo::BigEndian) ? BigEndianness : LittleEndianness;


    if (writeBom) {

        // set them up the BOM

        if (endian == BigEndianness) {

            out[0] = 0;

            out[1] = 0;

            out[2] = (char)0xfe;

            out[3] = (char)0xff;

        } else {

            out[0] = (char)0xff;

            out[1] = (char)0xfe;

            out[2] = 0;

            out[3] = 0;

        }

        out += 4;

        state->internalState |= HeaderDone;

    }


    const QChar *uc = in.data();

    const QChar *end = in.data() + in.size();

    QChar ch;

    char32_t ucs4;

    if (state->remainingChars == 1) {

        auto character = state->state_data[Data];

        Q_ASSERT(character <= 0xFFFF);

        ch = QChar(character);

        // this is ugly, but shortcuts a whole lot of logic that would otherwise be required

        state->remainingChars = 0;

        goto decode_surrogate;

    }


    while (uc < end) {

        ch = *uc++;

        if (Q_LIKELY(!ch.isSurrogate())) {

            ucs4 = ch.unicode();

        } else if (Q_LIKELY(ch.isHighSurrogate())) {

decode_surrogate:

            if (uc == end) {

                if (state->flags & QStringConverter::Flag::Stateless) {

                    ucs4 = state->flags & QStringConverter::Flag::ConvertInvalidToNull ? 0 : QChar::ReplacementCharacter;

                } else {

                    state->remainingChars = 1;

                    state->state_data[Data] = ch.unicode();

                    return out;

                }

            } else if (uc->isLowSurrogate()) {

                ucs4 = QChar::surrogateToUcs4(ch, *uc++);

            } else {

                ucs4 = state->flags & QStringConverter::Flag::ConvertInvalidToNull ? 0 : QChar::ReplacementCharacter;

            }

        } else {

            ucs4 = state->flags & QStringConverter::Flag::ConvertInvalidToNull ? 0 : QChar::ReplacementCharacter;

        }

        if (endian == BigEndianness)

            qToBigEndian(ucs4, out);

        else

            qToLittleEndian(ucs4, out);

        out += 4;

    }


    return out;

}


QString QUtf32::convertToUnicode(QByteArrayView in, QStringConverter::State *state, DataEndianness endian)

{

    QString result;

    result.resize((in.size() + 7) >> 1); // worst case

    QChar *end = convertToUnicode(result.data(), in, state, endian);

    result.truncate(end - result.constData());

    return result;

}


QChar *QUtf32::convertToUnicode(QChar *out, QByteArrayView in, QStringConverter::State *state, DataEndianness endian)

{

    qsizetype len = in.size();

    const char *chars = in.data();


    Q_ASSERT(state);

    if (endian == DetectEndianness)

        endian = (DataEndianness)state->state_data[Endian];


    const char *end = chars + len;


    uchar tuple[4];

    memcpy(tuple, &state->state_data[Data], 4);


    // make sure we can decode at least one char

    if (state->remainingChars + len < 4) {

        if (len) {

            while (chars < end) {

                tuple[state->remainingChars] = *chars;

                ++state->remainingChars;

                ++chars;

            }

            Q_ASSERT(state->remainingChars < 4);

            memcpy(&state->state_data[Data], tuple, 4);

        }

        return out;

    }


    bool headerdone = state->internalState & HeaderDone;

    if (state->flags & QStringConverter::Flag::ConvertInitialBom)

        headerdone = true;


    qsizetype num = state->remainingChars;

    state->remainingChars = 0;


    if (!headerdone || endian == DetectEndianness || num) {

        while (num < 4)

            tuple[num++] = *chars++;

        if (endian == DetectEndianness) {

            // someone set us up the BOM?

            if (tuple[0] == 0xff && tuple[1] == 0xfe && tuple[2] == 0 && tuple[3] == 0) {

                endian = LittleEndianness;

            } else if (tuple[0] == 0 && tuple[1] == 0 && tuple[2] == 0xfe && tuple[3] == 0xff) {

                endian = BigEndianness;

            } else if (QSysInfo::ByteOrder == QSysInfo::BigEndian) {

                endian = BigEndianness;

            } else {

                endian = LittleEndianness;

            }

        }

        char32_t code = (endian == BigEndianness) ? qFromBigEndian<char32_t>(tuple) : qFromLittleEndian<char32_t>(tuple);

        if (headerdone || code != QChar::ByteOrderMark) {

            if (QChar::requiresSurrogates(code)) {

                *out++ = QChar(QChar::highSurrogate(code));

                *out++ = QChar(QChar::lowSurrogate(code));

            } else {

                *out++ = QChar(code);

            }

        }

        num = 0;

    } else if (endian == DetectEndianness) {

        endian = (QSysInfo::ByteOrder == QSysInfo::BigEndian) ? BigEndianness : LittleEndianness;

    }

    state->state_data[Endian] = endian;

    state->internalState |= HeaderDone;


    while (chars < end) {

        tuple[num++] = *chars++;

        if (num == 4) {

            char32_t code = (endian == BigEndianness) ? qFromBigEndian<char32_t>(tuple) : qFromLittleEndian<char32_t>(tuple);

            for (char16_t c : QChar::fromUcs4(code))

                *out++ = c;

            num = 0;

        }

    }


    if (num) {

        if (state->flags & QStringDecoder::Flag::Stateless) {

            *out++ = QChar::ReplacementCharacter;

        } else {

            state->state_data[Endian] = endian;

            state->remainingChars = num;

            memcpy(&state->state_data[Data], tuple, 4);

        }

    }


    return out;

}


#endif // !QT_BOOTSTRAPPED


#if defined(Q_OS_WIN) && !defined(QT_BOOTSTRAPPED)

int QLocal8Bit::checkUtf8()

{

    return GetACP() == CP_UTF8 ? 1 : -1;

}


QString QLocal8Bit::convertToUnicode_sys(QByteArrayView in, QStringConverter::State *state)

{

    return convertToUnicode_sys(in, CP_ACP, state);

}


QString QLocal8Bit::convertToUnicode_sys(QByteArrayView in, quint32 codePage,

                                         QStringConverter::State *state)

{

    const char *mb = in.data();

    qsizetype mblen = in.size();


    Q_ASSERT(state);

    qsizetype &invalidChars = state->invalidChars;

    using Flag = QStringConverter::Flag;

    const bool useNullForReplacement = !!(state->flags & Flag::ConvertInvalidToNull);

    const char16_t replacementCharacter = useNullForReplacement ? QChar::Null

                                                                : QChar::ReplacementCharacter;

    if (state->flags & Flag::Stateless) {

        Q_ASSERT(state->remainingChars == 0);

        state = nullptr;

    }


    if (!mb || !mblen)

        return QString();


    // Use a local stack-buffer at first to allow us a decently large container

    // to avoid a lot of resizing, without also returning an overallocated

    // QString to the user for small strings.

    // Then we can be fast for small strings and take the hit of extra resizes

    // and measuring how much storage is needed for large strings.

    std::array<wchar_t, 4096> buf;

    wchar_t *out = buf.data();

    qsizetype outlen = buf.size();


    QString sp;


    // Return a pointer to storage where we have enough space for `size`

    const auto growOut = [&](qsizetype size) -> std::tuple<wchar_t *, qsizetype> {

        if (outlen >= size)

            return {out, outlen};

        const bool wasStackBuffer = sp.isEmpty();

        const auto begin = wasStackBuffer ? buf.data() : reinterpret_cast<wchar_t *>(sp.data());

        const qsizetype offset = qsizetype(std::distance(begin, out));

        qsizetype newSize = 0;

        if (Q_UNLIKELY(qAddOverflow(offset, size, &newSize))) {

            Q_CHECK_PTR(false);

            return {nullptr, 0};

        }

        sp.resize(newSize);

        auto it = reinterpret_cast<wchar_t *>(sp.data());

        if (wasStackBuffer)

            it = std::copy_n(buf.data(), offset, it);

        else

            it += offset;

        return {it, size};

    };


    // Convert the pending characters (if available)

    while (state && state->remainingChars && mblen) {

        QStringConverter::State localState;

        localState.flags = state->flags;

        // Use at most 6 characters as a guess for the longest encoded character

        // in any multibyte encoding.

        // Even with a total of 2 bytes of overhead that would leave around

        // 2^(4 * 8) possible characters

        std::array<char, 6> prev = {0};

        Q_ASSERT(state->remainingChars <= q20::ssize(state->state_data));

        qsizetype index = 0;

        for (; index < state->remainingChars; ++index)

            prev[index] = state->state_data[index];

        const qsizetype toCopy = std::min(q20::ssize(prev) - index, mblen);

        for (qsizetype i = 0; i < toCopy; ++i, ++index)

            prev[index] = mb[i];

        mb += toCopy;

        mblen -= toCopy;


        // Recursing:

        // Since we are using a clean local state it will try to decode what was

        // stored in our state + some extra octets from input (`prev`). If some

        // part fails we will have those characters stored in the local state's

        // storage, and we can extract those. It may also output some

        // replacement characters, which we'll count in the invalidChars.

        // In the best case we only do this once, but we will loop until we have

        // resolved all the remaining characters or we have run out of new input

        // in which case we may still have remaining characters.

        const QString tmp = convertToUnicode_sys(QByteArrayView(prev.data(), index), codePage,

                                                    &localState);

        std::tie(out, outlen) = growOut(tmp.size());

        if (!out)

            return {};

        out = std::copy_n(reinterpret_cast<const wchar_t *>(tmp.constData()), tmp.size(), out);

        outlen -= tmp.size();

        const qsizetype tail = toCopy - localState.remainingChars;

        if (tail >= 0) {

            // Everything left to process comes from `in`, so we can stop

            // looping. Adjust the window for `in` and unset remainingChars to

            // signal that we're done.

            mb -= localState.remainingChars;

            mblen += localState.remainingChars;

            localState.remainingChars = 0;

        }

        state->remainingChars = localState.remainingChars;

        state->invalidChars += localState.invalidChars;

        std::copy_n(localState.state_data, state->remainingChars, state->state_data);

    }


    Q_ASSERT(!state || state->remainingChars == 0 || mblen == 0);


    // Need it in this scope, since we try to decrease our window size if we

    // encounter an error

    int nextIn = qt_saturate<int>(mblen);

    while (mblen > 0) {

        std::tie(out, outlen) = growOut(1); // Need space for at least one character

        if (!out)

            return {};

        const int nextOut = qt_saturate<int>(outlen);

        int len = MultiByteToWideChar(codePage, MB_ERR_INVALID_CHARS, mb, nextIn, out, nextOut);

        if (len) {

            mb += nextIn;

            mblen -= nextIn;

            out += len;

            outlen -= len;

        } else {

            int r = GetLastError();

            if (r == ERROR_INSUFFICIENT_BUFFER) {

                const int wclen = MultiByteToWideChar(codePage, 0, mb, nextIn, 0, 0);

                std::tie(out, outlen) = growOut(wclen);

                if (!out)

                    return {};

            } else if (r == ERROR_NO_UNICODE_TRANSLATION) {

                // Can't decode the current window, so either store the state,

                // reduce window size or output a replacement character.


                // Check if we can store all remaining characters in the state

                // to be used next time we're called:

                if (state && mblen <= q20::ssize(state->state_data)) {

                    state->remainingChars = mblen;

                    std::copy_n(mb, mblen, state->state_data);

                    mb += mblen;

                    mblen = 0;

                    break;

                }


                // .. if not, try to find the last valid character in the window

                // and try again with a shrunken window:

                if (nextIn > 1) {

                    // There may be some incomplete data at the end of our current

                    // window, so decrease the window size and try again.

                    // In the worst case scenario there is gigs of undecodable

                    // garbage, but what are we supposed to do about that?

                    const auto it = CharPrevExA(codePage, mb, mb + nextIn, 0);

                    if (it != mb)

                        nextIn = int(it - mb);

                    else

                        --nextIn;

                    continue;

                }


                // Finally, we are forced to output a replacement character for

                // the first byte in the window:

                std::tie(out, outlen) = growOut(1);

                if (!out)

                    return {};

                *out = replacementCharacter;

                ++invalidChars;

                ++out;

                --outlen;

                ++mb;

                --mblen;

            } else {

                // Fail.

                qWarning("MultiByteToWideChar: Cannot convert multibyte text");

                break;

            }

        }

        nextIn = qt_saturate<int>(mblen);

    }


    if (sp.isEmpty()) {

        // We must have only used the stack buffer

        if (out != buf.data()) // else: we return null-string

            sp = QStringView(buf.data(), out).toString();

    } else{

        const auto begin = reinterpret_cast<wchar_t *>(sp.data());

        sp.truncate(std::distance(begin, out));

    }


    if (sp.size() && sp.back().isNull())

        sp.chop(1);


    if (!state && mblen > 0) {

        // We have trailing character(s) that could not be converted, and

        // nowhere to cache them

        sp.resize(sp.size() + mblen, replacementCharacter);

        invalidChars += mblen;

    }

    return sp;

}


QByteArray QLocal8Bit::convertFromUnicode_sys(QStringView in, QStringConverter::State *state)

{

    return convertFromUnicode_sys(in, CP_ACP, state);

}


QByteArray QLocal8Bit::convertFromUnicode_sys(QStringView in, quint32 codePage,

                                              QStringConverter::State *state)

{

    const wchar_t *ch = reinterpret_cast<const wchar_t *>(in.data());

    qsizetype uclen = in.size();


    Q_ASSERT(state);

    // The Windows API has a *boolean* out-parameter that says if a replacement

    // character was used, but it gives us no way to know _how many_ were used.

    // Since we cannot simply scan the string for replacement characters

    // (which is potentially a question mark, and thus a valid character),

    // we simply do not track the number of invalid characters here.

    // auto &invalidChars = state->invalidChars;


    using Flag = QStringConverter::Flag;

    if (state->flags & Flag::Stateless) { // temporary

        Q_ASSERT(state->remainingChars == 0);

        state = nullptr;

    }


    if (!ch)

        return QByteArray();

    if (uclen == 0)

        return QByteArray("");


    // Use a local stack-buffer at first to allow us a decently large container

    // to avoid a lot of resizing, without also returning an overallocated

    // QByteArray to the user for small strings.

    // Then we can be fast for small strings and take the hit of extra resizes

    // and measuring how much storage is needed for large strings.

    std::array<char, 4096> buf;

    char *out = buf.data();

    qsizetype outlen = buf.size();

    QByteArray mb;


    if (state && state->remainingChars > 0) {

        Q_ASSERT(state->remainingChars == 1);

        // Let's try to decode the pending character

        wchar_t wc[2] = { wchar_t(state->state_data[0]), ch[0] };

        // Check if the second character is a valid low surrogate,

        // otherwise we'll just decode the first character, for which windows

        // will output a replacement character.

        const bool validCodePoint = QChar::isLowSurrogate(wc[1]);

        int len = WideCharToMultiByte(codePage, 0, wc, validCodePoint ? 2 : 1, out, outlen, nullptr,

                                      nullptr);

        if (!len)

            return {}; // Cannot recover, and I refuse to believe it was a size limitation

        out += len;

        outlen -= len;

        if (validCodePoint) {

            ++ch;

            --uclen;

        }

        state->remainingChars = 0;

        state->state_data[0] = 0;

        if (uclen == 0)

            return QByteArrayView(buf.data(), len).toByteArray();

    }


    if (state && QChar::isHighSurrogate(ch[uclen - 1])) {

        // We can handle a missing low surrogate at the end of the string,

        // so if there is one, exclude it now and store it in the state.

        state->remainingChars = 1;

        state->state_data[0] = ch[uclen - 1];

        --uclen;

        if (uclen == 0)

            return QByteArray();

    }


    Q_ASSERT(uclen > 0);


    // Return a pointer to storage where we have enough space for `size`

    const auto growOut = [&](qsizetype size) -> std::tuple<char *, qsizetype> {

        if (outlen >= size)

            return {out, outlen};

        const bool wasStackBuffer = mb.isEmpty();

        const auto begin = wasStackBuffer ? buf.data() : mb.data();

        const qsizetype offset = qsizetype(std::distance(begin, out));

        qsizetype newSize = 0;

        if (Q_UNLIKELY(qAddOverflow(offset, size, &newSize))) {

            Q_CHECK_PTR(false);

            return {nullptr, 0};

        }

        mb.resize(newSize);

        auto it = mb.data();

        if (wasStackBuffer)

            it = std::copy_n(buf.data(), offset, it);

        else

            it += offset;

        return {it, size};

    };


    const auto getNextWindowSize = [&]() {

        int nextIn = qt_saturate<int>(uclen);

        // The Windows API has some issues if the current window ends in the

        // middle of a surrogate pair, so we avoid that:

        if (nextIn > 1 && QChar::isHighSurrogate(ch[nextIn - 1]))

            --nextIn;

        return nextIn;

    };


    int len = 0;

    while (uclen > 0) {

        const int nextIn = getNextWindowSize();

        std::tie(out, outlen) = growOut(1); // We need at least one byte

        if (!out)

            return {};

        const int nextOut = qt_saturate<int>(outlen);

        len = WideCharToMultiByte(codePage, 0, ch, nextIn, out, nextOut, nullptr, nullptr);

        if (len > 0) {

            ch += nextIn;

            uclen -= nextIn;

            out += len;

            outlen -= len;

        } else {

            int r = GetLastError();

            if (r == ERROR_INSUFFICIENT_BUFFER) {

                int neededLength = WideCharToMultiByte(codePage, 0, ch, nextIn, nullptr, 0,

                                                       nullptr, nullptr);

                if (neededLength <= 0) {

                    // Fail. Observed with UTF8 where the input window was max int and ended in an

                    // incomplete sequence, probably a Windows bug. We try to avoid that from

                    // happening by reducing the window size in that case. But let's keep this

                    // branch just in case of other bugs.

#ifndef QT_NO_DEBUG

                    r = GetLastError();

                    fprintf(stderr,

                            "WideCharToMultiByte: Cannot convert multibyte text (error %d)\n", r);

#endif // !QT_NO_DEBUG

                    break;

                }

                std::tie(out, outlen) = growOut(neededLength);

                if (!out)

                    return {};

                // and try again...

            } else {

                // Fail.  Probably can't happen in fact (dwFlags is 0).

#ifndef QT_NO_DEBUG

                // Can't use qWarning(), as it'll recurse to handle %ls

                fprintf(stderr,

                        "WideCharToMultiByte: Cannot convert multibyte text (error %d): %ls\n", r,

                        reinterpret_cast<const wchar_t *>(

                                QStringView(ch, uclen).left(100).toString().utf16()));

#endif

                break;

            }

        }

    }

    if (mb.isEmpty()) {

        // We must have only used the stack buffer

        if (out != buf.data()) // else: we return null-array

            mb = QByteArrayView(buf.data(), out).toByteArray();

    } else {

        mb.truncate(std::distance(mb.data(), out));

    }

    return mb;

}

#endif


void QStringConverter::State::clear() noexcept

{

    if (clearFn)

        clearFn(this);

    else

        state_data[0] = state_data[1] = state_data[2] = state_data[3] = 0;

    remainingChars = 0;

    invalidChars = 0;

    internalState = 0;

}


void QStringConverter::State::reset() noexcept

{

    if (flags & Flag::UsesIcu) {

#if QT_CONFIG(icu)

        UConverter *converter = static_cast<UConverter *>(d[0]);

        if (converter)

            ucnv_reset(converter);

#else

        Q_UNREACHABLE();

#endif

    } else {

        clear();

    }

}


#ifndef QT_BOOTSTRAPPED


static QChar *fromUtf16(QChar *out, QByteArrayView in, QStringConverter::State *state)

{

    return QUtf16::convertToUnicode(out, in, state, DetectEndianness);

}


static char *toUtf16(char *out, QStringView in, QStringConverter::State *state)

{

    return QUtf16::convertFromUnicode(out, in, state, DetectEndianness);

}


static QChar *fromUtf16BE(QChar *out, QByteArrayView in, QStringConverter::State *state)

{

    return QUtf16::convertToUnicode(out, in, state, BigEndianness);

}


static char *toUtf16BE(char *out, QStringView in, QStringConverter::State *state)

{

    return QUtf16::convertFromUnicode(out, in, state, BigEndianness);

}


static QChar *fromUtf16LE(QChar *out, QByteArrayView in, QStringConverter::State *state)

{

    return QUtf16::convertToUnicode(out, in, state, LittleEndianness);

}


static char *toUtf16LE(char *out, QStringView in, QStringConverter::State *state)

{

    return QUtf16::convertFromUnicode(out, in, state, LittleEndianness);

}


static QChar *fromUtf32(QChar *out, QByteArrayView in, QStringConverter::State *state)

{

    return QUtf32::convertToUnicode(out, in, state, DetectEndianness);

}


static char *toUtf32(char *out, QStringView in, QStringConverter::State *state)

{

    return QUtf32::convertFromUnicode(out, in, state, DetectEndianness);

}


static QChar *fromUtf32BE(QChar *out, QByteArrayView in, QStringConverter::State *state)

{

    return QUtf32::convertToUnicode(out, in, state, BigEndianness);

}


static char *toUtf32BE(char *out, QStringView in, QStringConverter::State *state)

{

    return QUtf32::convertFromUnicode(out, in, state, BigEndianness);

}


static QChar *fromUtf32LE(QChar *out, QByteArrayView in, QStringConverter::State *state)

{

    return QUtf32::convertToUnicode(out, in, state, LittleEndianness);

}


static char *toUtf32LE(char *out, QStringView in, QStringConverter::State *state)

{

    return QUtf32::convertFromUnicode(out, in, state, LittleEndianness);

}


#endif // !QT_BOOTSTRAPPED


char *QLatin1::convertFromUnicode(char *out, QStringView in, QStringConverter::State *state) noexcept

{

    Q_ASSERT(state);

    if (state->flags & QStringConverter::Flag::Stateless) // temporary

        state = nullptr;


    const char replacement = (state && state->flags & QStringConverter::Flag::ConvertInvalidToNull) ? 0 : '?';

    qsizetype invalid = 0;

    for (qsizetype i = 0; i < in.size(); ++i) {

        if (in[i] > QChar(0xff)) {

            *out = replacement;

            ++invalid;

        } else {

            *out = (char)in[i].cell();

        }

        ++out;

    }

    if (state)

        state->invalidChars += invalid;

    return out;

}


static QChar *fromLocal8Bit(QChar *out, QByteArrayView in, QStringConverter::State *state)

{

    QString s = QLocal8Bit::convertToUnicode(in, state);

    memcpy(out, s.constData(), s.size()*sizeof(QChar));

    return out + s.size();

}


static char *toLocal8Bit(char *out, QStringView in, QStringConverter::State *state)

{

    QByteArray s = QLocal8Bit::convertFromUnicode(in, state);

    memcpy(out, s.constData(), s.size());

    return out + s.size();

}


static qsizetype fromUtf8Len(qsizetype l) { return l + 1; }

static qsizetype toUtf8Len(qsizetype l) { return 3*(l + 1); }


#ifndef QT_BOOTSTRAPPED

static qsizetype fromUtf16Len(qsizetype l) { return l/2 + 2; }

static qsizetype toUtf16Len(qsizetype l) { return 2*(l + 1); }


static qsizetype fromUtf32Len(qsizetype l) { return l/2 + 2; }

static qsizetype toUtf32Len(qsizetype l) { return 4*(l + 1); }

#endif


static qsizetype fromLatin1Len(qsizetype l) { return l + 1; }

static qsizetype toLatin1Len(qsizetype l) { return l + 1; }


const QStringConverter::Interface QStringConverter::encodingInterfaces[QStringConverter::LastEncoding + 1] =

{

    { "UTF-8", QUtf8::convertToUnicode, fromUtf8Len, QUtf8::convertFromUnicode, toUtf8Len },

#ifndef QT_BOOTSTRAPPED

    { "UTF-16", fromUtf16, fromUtf16Len, toUtf16, toUtf16Len },

    { "UTF-16LE", fromUtf16LE, fromUtf16Len, toUtf16LE, toUtf16Len },

    { "UTF-16BE", fromUtf16BE, fromUtf16Len, toUtf16BE, toUtf16Len },

    { "UTF-32", fromUtf32, fromUtf32Len, toUtf32, toUtf32Len },

    { "UTF-32LE", fromUtf32LE, fromUtf32Len, toUtf32LE, toUtf32Len },

    { "UTF-32BE", fromUtf32BE, fromUtf32Len, toUtf32BE, toUtf32Len },

#endif

    { "ISO-8859-1", QLatin1::convertToUnicode, fromLatin1Len, QLatin1::convertFromUnicode, toLatin1Len },

    { "Locale", fromLocal8Bit, fromUtf8Len, toLocal8Bit, toUtf8Len }

};


// match names case insensitive and skipping '-' and '_'


static bool nameMatch(const char *a, const char *b)

{

    do {

        while (*a == '-' || *a == '_')

            ++a;

        while (*b == '-' || *b == '_')

            ++b;

        if (!*a && !*b) // end of both strings

            return true;

    } while (QtMiscUtils::toAsciiLower(*a++) == QtMiscUtils::toAsciiLower(*b++));


    return false;

}


#if QT_CONFIG(icu)

// only derives from QStringConverter to get access to protected types

struct QStringConverterICU : QStringConverter

{

    static void clear_function(QStringConverterBase::State *state) noexcept

    {

        ucnv_close(static_cast<UConverter *>(state->d[0]));

        state->d[0] = nullptr;

    }


    static void ensureConverter(QStringConverter::State *state)

    {

        // old code might reset the state via clear instead of reset

        // in that case, the converter has been closed, and we have to reopen it

        if (state->d[0] == nullptr)

            state->d[0] = createConverterForName(static_cast<const char *>(state->d[1]), state);

    }


    static QChar *toUtf16(QChar *out, QByteArrayView in, QStringConverter::State *state)

    {

        ensureConverter(state);


        auto icu_conv = static_cast<UConverter *>(state->d[0]);

        UErrorCode err = U_ZERO_ERROR;

        auto source = in.data();

        auto sourceLimit = in.data() + in.size();


        qsizetype length = toLen(in.size());


        UChar *target = reinterpret_cast<UChar *>(out);

        auto targetLimit = target + length;

        // We explicitly clean up anyway, so no need to set flush to true,

        // which would just reset the converter.

        UBool flush = false;


        // If the QStringConverter was moved, the state that we used as a context is stale now.

        UConverterToUCallback action;

        const void *context;

        ucnv_getToUCallBack(icu_conv, &action, &context);

        if (context != state)

             ucnv_setToUCallBack(icu_conv, action, state, nullptr, nullptr, &err);


        ucnv_toUnicode(icu_conv, &target, targetLimit, &source, sourceLimit, nullptr, flush, &err);

        // We did reserve enough space:

        Q_ASSERT(err != U_BUFFER_OVERFLOW_ERROR);

        if (state->flags.testFlag(QStringConverter::Flag::Stateless)) {

            if (auto leftOver = ucnv_toUCountPending(icu_conv, &err)) {

                ucnv_reset(icu_conv);

                state->invalidChars += leftOver;

            }

        }

        return reinterpret_cast<QChar *>(target);

    }


    static char *fromUtf16(char *out, QStringView in, QStringConverter::State *state)

    {

        ensureConverter(state);

        auto icu_conv = static_cast<UConverter *>(state->d[0]);

        UErrorCode err = U_ZERO_ERROR;

        auto source = reinterpret_cast<const UChar *>(in.data());

        auto sourceLimit = reinterpret_cast<const UChar *>(in.data() + in.size());


        qsizetype length = UCNV_GET_MAX_BYTES_FOR_STRING(in.size(), ucnv_getMaxCharSize(icu_conv));


        char *target = out;

        char *targetLimit = out + length;

        UBool flush = false;


        // If the QStringConverter was moved, the state that we used as a context is stale now.

        UConverterFromUCallback action;

        const void *context;

        ucnv_getFromUCallBack(icu_conv, &action, &context);

        if (context != state)

             ucnv_setFromUCallBack(icu_conv, action, state, nullptr, nullptr, &err);


        ucnv_fromUnicode(icu_conv, &target, targetLimit, &source, sourceLimit, nullptr, flush, &err);

        // We did reserve enough space:

        Q_ASSERT(err != U_BUFFER_OVERFLOW_ERROR);

        if (state->flags.testFlag(QStringConverter::Flag::Stateless)) {

            if (auto leftOver = ucnv_fromUCountPending(icu_conv, &err)) {

                ucnv_reset(icu_conv);

                state->invalidChars += leftOver;

            }

        }

        return target;

    }


    Q_DISABLE_COPY_MOVE(QStringConverterICU)


    template<qsizetype X>

    static qsizetype fromLen(qsizetype inLength)

    {

        return X * inLength * sizeof(UChar);

    }


    static qsizetype toLen(qsizetype inLength)

    {


        /* Assumption: each input char might map to a different codepoint

           Each codepoint can take up to 4 bytes == 2 QChar

           We can ignore reserving space for a BOM, as only UTF encodings use one

           and those are not handled by the ICU converter.

         */

        return 2 * inLength;

    }


    static constexpr QStringConverter::Interface forLength[] = {

        {"icu, recompile if you see this", QStringConverterICU::toUtf16, QStringConverterICU::toLen, QStringConverterICU::fromUtf16, QStringConverterICU::fromLen<1>},

        {"icu, recompile if you see this", QStringConverterICU::toUtf16, QStringConverterICU::toLen, QStringConverterICU::fromUtf16, QStringConverterICU::fromLen<2>},

        {"icu, recompile if you see this", QStringConverterICU::toUtf16, QStringConverterICU::toLen, QStringConverterICU::fromUtf16, QStringConverterICU::fromLen<3>},

        {"icu, recompile if you see this", QStringConverterICU::toUtf16, QStringConverterICU::toLen, QStringConverterICU::fromUtf16, QStringConverterICU::fromLen<4>},

        {"icu, recompile if you see this", QStringConverterICU::toUtf16, QStringConverterICU::toLen, QStringConverterICU::fromUtf16, QStringConverterICU::fromLen<5>},

        {"icu, recompile if you see this", QStringConverterICU::toUtf16, QStringConverterICU::toLen, QStringConverterICU::fromUtf16, QStringConverterICU::fromLen<6>},

        {"icu, recompile if you see this", QStringConverterICU::toUtf16, QStringConverterICU::toLen, QStringConverterICU::fromUtf16, QStringConverterICU::fromLen<7>},

        {"icu, recompile if you see this", QStringConverterICU::toUtf16, QStringConverterICU::toLen, QStringConverterICU::fromUtf16, QStringConverterICU::fromLen<8>}

    };


    static UConverter *createConverterForName(const char *name, const State *state)

    {

        Q_ASSERT(name);

        Q_ASSERT(state);

        UErrorCode status = U_ZERO_ERROR;

        UConverter *conv = ucnv_open(name, &status);

        if (status != U_ZERO_ERROR && status != U_AMBIGUOUS_ALIAS_WARNING) {

            ucnv_close(conv);

            return nullptr;

        }


        if (state->flags.testFlag(Flag::ConvertInvalidToNull)) {

            UErrorCode error = U_ZERO_ERROR;


            auto nullToSubstituter = [](const void *context, UConverterToUnicodeArgs *toUArgs,

                                        const char *, int32_t length,

                                        UConverterCallbackReason reason, UErrorCode *err) {

                if (reason <= UCNV_IRREGULAR) {

                    *err = U_ZERO_ERROR;

                    UChar c = '\0';

                    ucnv_cbToUWriteUChars(toUArgs, &c, 1, 0, err);

                    // Recover outer scope's state (which isn't const) from context:

                    auto state = const_cast<State *>(static_cast<const State *>(context));

                    state->invalidChars += length;

                }

            };

            ucnv_setToUCallBack(conv, nullToSubstituter, state, nullptr, nullptr, &error);


            auto nullFromSubstituter = [](const void *context, UConverterFromUnicodeArgs *fromUArgs,

                                          const UChar *, int32_t length,

                                          UChar32, UConverterCallbackReason reason, UErrorCode *err) {

                if (reason <= UCNV_IRREGULAR) {

                    *err = U_ZERO_ERROR;

                    const UChar replacement[] = { 0 };

                    const UChar *stringBegin = std::begin(replacement);

                    ucnv_cbFromUWriteUChars(fromUArgs, &stringBegin, std::end(replacement), 0, err);

                    // Recover outer scope's state (which isn't const) from context:

                    auto state = const_cast<State *>(static_cast<const State *>(context));

                    state->invalidChars += length;

                }

            };

            ucnv_setFromUCallBack(conv, nullFromSubstituter, state, nullptr, nullptr, &error);

        } else {

            UErrorCode error = U_ZERO_ERROR;


            auto qmarkToSubstituter = [](const void *context, UConverterToUnicodeArgs *toUArgs,

                                         const char *codeUnits,int32_t length,

                                         UConverterCallbackReason reason, UErrorCode *err) {

                if (reason <= UCNV_IRREGULAR) {

                    // Recover outer scope's state (which isn't const) from context:

                    auto state = const_cast<State *>(static_cast<const State *>(context));

                    state->invalidChars += length;

                }

                // use existing ICU callback for logic

                UCNV_TO_U_CALLBACK_SUBSTITUTE(nullptr, toUArgs, codeUnits, length, reason, err);


            };

            ucnv_setToUCallBack(conv, qmarkToSubstituter, state, nullptr, nullptr, &error);


            auto qmarkFromSubstituter = [](const void *context, UConverterFromUnicodeArgs *fromUArgs,

                                           const UChar *codeUnits, int32_t length,

                                           UChar32 codePoint, UConverterCallbackReason reason, UErrorCode *err) {

                if (reason <= UCNV_IRREGULAR) {

                    // Recover outer scope's state (which isn't const) from context:

                    auto state = const_cast<State *>(static_cast<const State *>(context));

                    state->invalidChars += length;

                }

                // use existing ICU callback for logic

                UCNV_FROM_U_CALLBACK_SUBSTITUTE(nullptr, fromUArgs, codeUnits, length,

                                                codePoint, reason, err);

            };

            ucnv_setFromUCallBack(conv, qmarkFromSubstituter, state, nullptr, nullptr, &error);

        }

        return conv;

    }


    static const QStringConverter::Interface *make_icu_converter(

            QStringConverterBase::State *state,

            const char *name)

    {

        UErrorCode status = U_ZERO_ERROR;

        UConverter *conv = createConverterForName(name, state);

        if (!conv)

            return nullptr;


        const char *icuName = ucnv_getName(conv, &status);

        // ucnv_getStandardName returns a name which is owned by the library

        // we can thus store it in the state without worrying aobut its lifetime

        const char *persistentName = ucnv_getStandardName(icuName, "MIME", &status);

        if (U_FAILURE(status) || !persistentName) {

             status = U_ZERO_ERROR;

             persistentName = ucnv_getStandardName(icuName, "IANA", &status);

        }

        state->d[1] = const_cast<char *>(persistentName);

        state->d[0] = conv;

        state->flags |= QStringConverterBase::Flag::UsesIcu;

        qsizetype maxCharSize = ucnv_getMaxCharSize(conv);

        state->clearFn = QStringConverterICU::clear_function;

        if (maxCharSize > 8 || maxCharSize < 1) {

            qWarning("Encountered unexpected codec \"%s\" which requires >8x space", name);

            return nullptr;

        } else {

            return &forLength[maxCharSize - 1];

        }


    }


};

#endif


QStringConverter::QStringConverter(const char *name, Flags f)

    : iface(nullptr), state(f)

{

    auto e = encodingForName(name);

    if (e)

        iface = encodingInterfaces + int(*e);

#if QT_CONFIG(icu)

    else

        iface = QStringConverterICU::make_icu_converter(&state, name);

#endif

}


const char *QStringConverter::name() const noexcept

{

    if (!iface)

        return nullptr;

    if (state.flags & QStringConverter::Flag::UsesIcu) {

#if QT_CONFIG(icu)

        return static_cast<const char*>(state.d[1]);

#else

        return nullptr;

#endif

    } else {

        return iface->name;

    }

}


std::optional<QStringConverter::Encoding> QStringConverter::encodingForName(const char *name) noexcept

{

    if (!name)

        return std::nullopt;

    for (qsizetype i = 0; i < LastEncoding + 1; ++i) {

        if (nameMatch(encodingInterfaces[i].name, name))

            return QStringConverter::Encoding(i);

    }

    if (nameMatch(name, "latin1"))

        return QStringConverter::Latin1;

    return std::nullopt;

}


#ifndef QT_BOOTSTRAPPED

std::optional<QStringConverter::Encoding>


QStringConverter::encodingForData(QByteArrayView data, char16_t expectedFirstCharacter) noexcept

{

    // someone set us up the BOM?

    qsizetype arraySize = data.size();

    if (arraySize > 3) {

        char32_t uc = qFromUnaligned<char32_t>(data.data());

        if (uc == qToBigEndian(char32_t(QChar::ByteOrderMark)))

            return QStringConverter::Utf32BE;

        if (uc == qToLittleEndian(char32_t(QChar::ByteOrderMark)))

            return QStringConverter::Utf32LE;

        if (expectedFirstCharacter) {

            // catch also anything starting with the expected character

            if (qToLittleEndian(uc) == expectedFirstCharacter)

                return QStringConverter::Utf32LE;

            else if (qToBigEndian(uc) == expectedFirstCharacter)

                return QStringConverter::Utf32BE;

        }

    }


    if (arraySize > 2) {

        if (memcmp(data.data(), utf8bom, sizeof(utf8bom)) == 0)

            return QStringConverter::Utf8;

    }


    if (arraySize > 1) {

        char16_t uc = qFromUnaligned<char16_t>(data.data());

        if (uc == qToBigEndian(char16_t(QChar::ByteOrderMark)))

            return QStringConverter::Utf16BE;

        if (uc == qToLittleEndian(char16_t(QChar::ByteOrderMark)))

            return QStringConverter::Utf16LE;

        if (expectedFirstCharacter) {

            // catch also anything starting with the expected character

            if (qToLittleEndian(uc) == expectedFirstCharacter)

                return QStringConverter::Utf16LE;

            else if (qToBigEndian(uc) == expectedFirstCharacter)

                return QStringConverter::Utf16BE;

        }

    }

    return std::nullopt;

}


static QByteArray parseHtmlMetaForEncoding(QByteArrayView data)

{

    static constexpr auto metaSearcher = qMakeStaticByteArrayMatcher("meta ");

    static constexpr auto charsetSearcher = qMakeStaticByteArrayMatcher("charset=");


    QByteArray header = data.first(qMin(data.size(), qsizetype(1024))).toByteArray().toLower();

    qsizetype pos = metaSearcher.indexIn(header);

    if (pos != -1) {

        pos = charsetSearcher.indexIn(header, pos);

        if (pos != -1) {

            pos += qstrlen("charset=");

            if (pos < header.size() && (header.at(pos) == '\"' || header.at(pos) == '\''))

                ++pos;


            qsizetype pos2 = pos;

            // The attribute can be closed with either """, "'", ">" or "/",

            // none of which are valid charset characters.

            while (++pos2 < header.size()) {

                char ch = header.at(pos2);

                if (ch == '\"' || ch == '\'' || ch == '>' || ch == '/') {

                    QByteArray name = header.mid(pos, pos2 - pos);

                    qsizetype colon = name.indexOf(':');

                    if (colon > 0)

                        name = name.left(colon);

                    name = name.simplified();

                    if (name == "unicode") // QTBUG-41998, ICU will return UTF-16.

                        name = QByteArrayLiteral("UTF-8");

                    if (!name.isEmpty())

                        return name;

                }

            }

        }

    }

    return QByteArray();

}


std::optional<QStringConverter::Encoding> QStringConverter::encodingForHtml(QByteArrayView data)

{

    // determine charset

    std::optional<QStringConverter::Encoding> encoding = encodingForData(data);

    if (encoding)

        // trust the initial BOM

        return encoding;


    QByteArray encodingTag = parseHtmlMetaForEncoding(data);

    if (!encodingTag.isEmpty())

        return encodingForName(encodingTag);


    return Utf8;

}


static qsizetype availableCodecCount()

{

#if !QT_CONFIG(icu)

    return QStringConverter::Encoding::LastEncoding;

#else

    /* icu contains also the names of what Qt provides

       except for the special Locale one (so add one for it)

    */

    return 1 + ucnv_countAvailable();

#endif

}


QStringList QStringConverter::availableCodecs()

{

    auto availableCodec = [](qsizetype index) -> QString

    {

    #if !QT_CONFIG(icu)

        return QString::fromLatin1(encodingInterfaces[index].name);

    #else

        if (index == 0) // "Locale", not provided by icu

            return QString::fromLatin1(

                        encodingInterfaces[QStringConverter::Encoding::System].name);

        // this mirrors the setup we do to set a converters name

        UErrorCode status = U_ZERO_ERROR;

        auto icuName = ucnv_getAvailableName(int32_t(index - 1));

        const char *standardName = ucnv_getStandardName(icuName, "MIME", &status);

        if (U_FAILURE(status) || !standardName) {

            status = U_ZERO_ERROR;

            standardName = ucnv_getStandardName(icuName, "IANA", &status);

        }

        if (!standardName)

            standardName = icuName;

        return QString::fromLatin1(standardName);

    #endif

    };


    qsizetype codecCount = availableCodecCount();

    QStringList result;

    result.reserve(codecCount);

    for (qsizetype i = 0; i < codecCount; ++i)

        result.push_back(availableCodec(i));

    return result;

}


QStringDecoder QStringDecoder::decoderForHtml(QByteArrayView data)

{

    // determine charset

    std::optional<QStringConverter::Encoding> encoding = encodingForData(data);

    if (encoding)

        // trust the initial BOM

        return QStringDecoder(encoding.value());


    QByteArray encodingTag = parseHtmlMetaForEncoding(data);

    if (!encodingTag.isEmpty())

        return QStringDecoder(encodingTag);


    return QStringDecoder(Utf8);

}


#endif // !QT_BOOTSTRAPPED


const char *QStringConverter::nameForEncoding(QStringConverter::Encoding e)

{

    return encodingInterfaces[int(e)].name;

}


QT_END_NAMESPACE

QByteArrayView
Definition qbytearrayview.h:77

QByteArrayView::toByteArray
QByteArray toByteArray() const
Definition qbytearray.h:796

QByteArray
\inmodule QtCore
Definition qbytearray.h:57

QByteArray::data
char * data()
\macro QT_NO_CAST_FROM_BYTEARRAY
Definition qbytearray.h:611

QByteArray::constData
const char * constData() const noexcept
Returns a pointer to the const data stored in the byte array.
Definition qbytearray.h:124

QByteArray::truncate
void truncate(qsizetype pos)
Truncates the byte array at index position pos.
Definition qbytearray.cpp:1707

QChar
\inmodule QtCore

QLatin1StringView
Definition qlatin1stringview.h:32

QStringConverterBase::Flag
Flag
Definition qstringconverter_base.h:30

QStringConverterBase::Flag::ConvertInvalidToNull
@ ConvertInvalidToNull

QStringConverterBase::Flag::Stateless
@ Stateless

QStringConverterBase::Flag::UsesIcu
@ UsesIcu

QStringConverterBase::Flag::WriteBom
@ WriteBom

QStringConverterBase::Flag::ConvertInitialBom
@ ConvertInitialBom

QStringConverter
\inmodule QtCore
Definition qstringconverter_base.h:87

QStringConverter::name
Q_CORE_EXPORT const char * name() const noexcept
Returns the canonical name of the encoding this QStringConverter can encode or decode.
Definition qstringconverter.cpp:2182

QStringConverter::encodingForHtml
static Q_CORE_EXPORT std::optional< Encoding > encodingForHtml(QByteArrayView data)
Tries to determine the encoding of the HTML in data by looking at leading byte order marks or a chars...
Definition qstringconverter.cpp:2349

QStringConverter::nameForEncoding
static Q_CORE_EXPORT const char * nameForEncoding(Encoding e)
Returns the canonical name for encoding e.
Definition qstringconverter.cpp:2449

QStringConverter::Encoding
Encoding
\value Utf8 Create a converter to or from UTF-8 \value Utf16 Create a converter to or from UTF-16.
Definition qstringconverter_base.h:90

QStringConverter::Latin1
@ Latin1
Definition qstringconverter_base.h:100

QStringConverter::Utf8
@ Utf8
Definition qstringconverter_base.h:91

QStringConverter::Utf32LE
@ Utf32LE
Definition qstringconverter_base.h:97

QStringConverter::Utf16LE
@ Utf16LE
Definition qstringconverter_base.h:94

QStringConverter::Utf32BE
@ Utf32BE
Definition qstringconverter_base.h:98

QStringConverter::LastEncoding
@ LastEncoding
Definition qstringconverter_base.h:102

QStringConverter::Utf16BE
@ Utf16BE
Definition qstringconverter_base.h:95

QStringConverter::System
@ System
Definition qstringconverter_base.h:101

QStringConverter::state
State state
Definition qstringconverter_base.h:169

QStringConverter::availableCodecs
static Q_CORE_EXPORT QStringList availableCodecs()
Returns a list of names of supported codecs.
Definition qstringconverter.cpp:2389

QStringConverter::iface
const Interface * iface
Definition qstringconverter_base.h:168

QStringConverter::encodingForName
static Q_CORE_EXPORT std::optional< Encoding > encodingForName(const char *name) noexcept
Convert name to the corresponding \l Encoding member, if there is one.
Definition qstringconverter.cpp:2242

QStringConverter::QStringConverter
constexpr QStringConverter() noexcept
Definition qstringconverter_base.h:131

QStringConverter::encodingForData
static Q_CORE_EXPORT std::optional< Encoding > encodingForData(QByteArrayView data, char16_t expectedFirstCharacter=0) noexcept
Returns the encoding for the content of data if it can be determined.
Definition qstringconverter.cpp:2264

QStringDecoder
\inmodule QtCore
Definition qstringconverter.h:86

QStringDecoder::decoderForHtml
static Q_CORE_EXPORT QStringDecoder decoderForHtml(QByteArrayView data)
Tries to determine the encoding of the HTML in data by looking at leading byte order marks or a chars...
Definition qstringconverter.cpp:2430

QStringDecoder::QStringDecoder
constexpr QStringDecoder() noexcept
Default constructs an decoder.
Definition qstringconverter.h:95

QStringList
\inmodule QtCore

QStringView
\inmodule QtCore
Definition qstringview.h:78

QStringView::toString
QString toString() const
Returns a deep copy of this string view's data as a QString.
Definition qstring.h:1121

QString
\macro QT_RESTRICTED_CAST_FROM_ASCII
Definition qstring.h:129

QString::fromLatin1
static QString fromLatin1(QByteArrayView ba)
This is an overloaded member function, provided for convenience. It differs from the above function o...
Definition qstring.cpp:5871

QString::constData
const QChar * constData() const
Returns a pointer to the data stored in the QString.
Definition qstring.h:1246

QString::size
qsizetype size() const noexcept
Returns the number of characters in this string.
Definition qstring.h:186

QString::data
QChar * data()
Returns a pointer to the data stored in the QString.
Definition qstring.h:1240

QSysInfo::BigEndian
@ BigEndian
Definition qsysinfo.h:29

QSysInfo::ByteOrder
@ ByteOrder
Definition qsysinfo.h:34

i
i
[1]
Definition doc_src_containers.cpp:169

clear
b clear()

cursor
QCursor cursor
Definition doc_src_properties.cpp:25

it
QSet< QString >::iterator it
Definition doc_src_qset.cpp:85

state
else opt state
[0]
Definition doc_src_styles.cpp:11

QQmlSA::Flag
Flag
Definition qqmlsa_p.h:42

QT_BEGIN_NAMESPACE
Combined button and popup list for selecting options.
Definition qstandardpaths_haiku.cpp:21

QT_END_NAMESPACE
Definition qsharedpointer.cpp:1590

QtMiscUtils
Definition qtools_p.h:26

QtMiscUtils::qt_lencmp
constexpr int qt_lencmp(qsizetype lhs, qsizetype rhs) noexcept
Definition qtools_p.h:109

QtMiscUtils::toAsciiLower
constexpr char toAsciiLower(char ch) noexcept
Definition qtools_p.h:87

Qt::flush
QTextStream & flush(QTextStream &stream)
Calls QTextStream::flush() on stream and returns stream.
Definition qtextstream.cpp:2849

Qt::CaseSensitivity
CaseSensitivity
Definition qnamespace.h:1261

Qt::CaseInsensitive
@ CaseInsensitive
Definition qnamespace.h:1262

Qt::CaseSensitive
@ CaseSensitive
Definition qnamespace.h:1263

Qt::Uninitialized
constexpr Initialization Uninitialized
Definition qnamespace.h:1597

q20::ssize
constexpr auto ssize(const C &c) -> std::common_type_t< std::ptrdiff_t, std::make_signed_t< decltype(c.size())> >
Definition q20iterator.h:33

qCountLeadingZeroBits
QT_POPCOUNT_RELAXED_CONSTEXPR uint qCountLeadingZeroBits(quint32 v) noexcept
Definition qalgorithms.h:368

qCountTrailingZeroBits
constexpr uint qCountTrailingZeroBits(quint32 v) noexcept
Definition qalgorithms.h:319

context
static void * context
Definition qandroidaudiosource.cpp:42

QByteArrayLiteral
#define QByteArrayLiteral(str)
Definition qbytearray.h:52

qstrlen
size_t qstrlen(const char *str)
Definition qbytearrayalgorithms.h:104

qbytearraymatcher.h

qMakeStaticByteArrayMatcher
constexpr QStaticByteArrayMatcher< N > qMakeStaticByteArrayMatcher(const char(&pattern)[N]) noexcept
Definition qbytearraymatcher.h:123

Q_UNLIKELY
#define Q_UNLIKELY(x)
Definition qcompilerdetection.h:1017

Q_LIKELY
#define Q_LIKELY(x)
Definition qcompilerdetection.h:1014

Q_ALWAYS_INLINE
#define Q_ALWAYS_INLINE
Definition qcompilerdetection.h:1318

qcontainertools_impl.h

error
DBusConnection const char DBusError * error
Definition qdbus_symbols_p.h:165

header
static QString header(const QString &name)
Definition qdbusxml2cpp.cpp:197

QByteArray
typedef QByteArray(EGLAPIENTRYP PFNQGSGETDISPLAYSPROC)()

qendian.h

qToBigEndian
constexpr T qToBigEndian(T source)
Definition qendian.h:172

qToLittleEndian
constexpr T qToLittleEndian(T source)
Definition qendian.h:176

Flags
Flags
Definition qfontsubset.cpp:650

qWarning
#define qWarning
Definition qlogging.h:166

qMin
constexpr const T & qMin(const T &a, const T &b)
Definition qminmax.h:40

qAddOverflow
std::enable_if_t< std::is_unsigned_v< T >, bool > qAddOverflow(T v1, T v2, T *r)
Definition qnumeric.h:113

b
GLboolean GLboolean GLboolean b
Definition qopengles2ext.h:337

v
GLsizei const GLfloat * v
[13]
Definition qopengles2ext.h:788

a
GLboolean GLboolean GLboolean GLboolean a
[7]
Definition qopengles2ext.h:337

size
GLenum GLuint GLintptr GLsizeiptr size
[1]
Definition qopengles2ext.h:660

index
GLuint index
[2]
Definition qopengles2ext.h:331

r
GLboolean r
[2]
Definition qopengles2ext.h:337

end
GLuint GLuint end
Definition qopengles2ext.h:354

length
GLenum GLuint GLenum GLsizei length
Definition qopengles2ext.h:151

data
GLint GLsizei GLsizei GLenum GLenum GLsizei void * data
Definition qopengles2ext.h:206

f
GLfloat GLfloat f
Definition qopengles2ext.h:795

src
GLenum src
Definition qopengles2ext.h:335

left
GLint left
Definition qopengles2ext.h:792

dst
GLenum GLenum dst
Definition qopengles2ext.h:335

buf
GLenum GLuint GLenum GLsizei const GLchar * buf
Definition qopengles2ext.h:151

target
GLenum target
Definition qopengles2ext.h:751

flags
GLbitfield flags
Definition qopengles2ext.h:1026

start
GLuint start
Definition qopengles2ext.h:354

offset
GLenum GLuint GLintptr offset
Definition qopengles2ext.h:660

name
GLuint name
Definition qopengles2ext.h:156

mask
GLint GLint GLint GLint GLint GLint GLint GLbitfield mask
Definition qopengles2ext.h:893

n
GLfloat n
Definition qopengles2ext.h:795

source
GLsizei GLsizei GLchar * source
Definition qopengles2ext.h:952

s
GLdouble s
[6]
Definition qopenglext.h:235

res
GLuint res
Definition qopenglext.h:8867

c
const GLubyte * c
Definition qopenglext.h:12701

in
GLuint in
Definition qopenglext.h:8870

result
GLuint64EXT * result
[6]
Definition qopenglext.h:10932

len
GLenum GLsizei len
Definition qopenglext.h:3292

num
GLuint num
Definition qopenglext.h:5654

packed
GLuint GLenum GLsizei GLsizei GLint GLint GLboolean packed
Definition qopenglext.h:9781

Q_ASSERT
#define Q_ASSERT(cond)
Definition qrandom.cpp:47

begin
QtPrivate::QRegularExpressionMatchIteratorRangeBasedForIterator begin(const QRegularExpressionMatchIterator &iterator)
Definition qregularexpression.cpp:2733

HeaderDone
@ HeaderDone
Definition qstringconverter.cpp:472

utf8bom
static const uchar utf8bom[]
Definition qstringconverter.cpp:49

fromUtf32LE
static QChar * fromUtf32LE(QChar *out, QByteArrayView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1703

fromUtf16LE
static QChar * fromUtf16LE(QChar *out, QByteArrayView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1673

parseHtmlMetaForEncoding
static QByteArray parseHtmlMetaForEncoding(QByteArrayView data)
Definition qstringconverter.cpp:2305

fromUtf32BE
static QChar * fromUtf32BE(QChar *out, QByteArrayView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1693

toUtf8Len
static qsizetype toUtf8Len(qsizetype l)
Definition qstringconverter.cpp:1752

fromLocal8Bit
static QChar * fromLocal8Bit(QChar *out, QByteArrayView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1736

Endian
@ Endian
Definition qstringconverter.cpp:47

Data
@ Data
Definition qstringconverter.cpp:47

simdDecodeAscii
static bool simdDecodeAscii(char16_t *, const uchar *, const uchar *, const uchar *)
Definition qstringconverter.cpp:456

simdCompareAscii
static void simdCompareAscii(const qchar8_t *&, const qchar8_t *, const char16_t *&, const char16_t *)
Definition qstringconverter.cpp:467

toLatin1Len
static qsizetype toLatin1Len(qsizetype l)
Definition qstringconverter.cpp:1763

simdFindNonAscii
static const uchar * simdFindNonAscii(const uchar *src, const uchar *end, const uchar *&nextAscii)
Definition qstringconverter.cpp:461

simdEncodeAscii
static bool simdEncodeAscii(uchar *, const char16_t *, const char16_t *, const char16_t *)
Definition qstringconverter.cpp:451

fromUtf32
static QChar * fromUtf32(QChar *out, QByteArrayView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1683

toUtf32
static char * toUtf32(char *out, QStringView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1688

toUtf16LE
static char * toUtf16LE(char *out, QStringView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1678

fromUtf8Len
static qsizetype fromUtf8Len(qsizetype l)
Definition qstringconverter.cpp:1751

toLocal8Bit
static char * toLocal8Bit(char *out, QStringView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1743

toUtf16Len
static qsizetype toUtf16Len(qsizetype l)
Definition qstringconverter.cpp:1756

fromLatin1Len
static qsizetype fromLatin1Len(qsizetype l)
Definition qstringconverter.cpp:1762

toUtf16BE
static char * toUtf16BE(char *out, QStringView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1668

toUtf32LE
static char * toUtf32LE(char *out, QStringView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1708

fromUtf32Len
static qsizetype fromUtf32Len(qsizetype l)
Definition qstringconverter.cpp:1758

availableCodecCount
static qsizetype availableCodecCount()
Definition qstringconverter.cpp:2364

nameMatch
static bool nameMatch(const char *a, const char *b)
Definition qstringconverter.cpp:1913

fromUtf16BE
static QChar * fromUtf16BE(QChar *out, QByteArrayView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1663

toUtf32Len
static qsizetype toUtf32Len(qsizetype l)
Definition qstringconverter.cpp:1759

fromUtf16Len
static qsizetype fromUtf16Len(qsizetype l)
Definition qstringconverter.cpp:1755

toUtf32BE
static char * toUtf32BE(char *out, QStringView in, QStringConverter::State *state)
Definition qstringconverter.cpp:1698

qstringconverter.h

DataEndianness
DataEndianness
Definition qstringconverter_p.h:293

LittleEndianness
@ LittleEndianness
Definition qstringconverter_p.h:296

DetectEndianness
@ DetectEndianness
Definition qstringconverter_p.h:294

BigEndianness
@ BigEndianness
Definition qstringconverter_p.h:295

qchar8_t
qchar8_t
Definition qstringconverter_p.h:27

sp
#define sp
Definition qt_mips_asm_dsp_p.h:52

qt_windows.h

Q_UNUSED
#define Q_UNUSED(x)
Definition qtpreprocessorsupport.h:20

quint32
unsigned int quint32
Definition qtypes.h:50

uchar
unsigned char uchar
Definition qtypes.h:32

qptrdiff
ptrdiff_t qptrdiff
Definition qtypes.h:164

qsizetype
ptrdiff_t qsizetype
Definition qtypes.h:165

uint
unsigned int uint
Definition qtypes.h:34

ushort
unsigned short ushort
Definition qtypes.h:33

output
QT_BEGIN_NAMESPACE typedef uchar * output
Definition qvideoframeconversionhelper_p.h:24

Q_CHECK_PTR
Q_CHECK_PTR(a=new int[80])

ba
QByteArray ba
[0]
Definition src_corelib_io_qdebug.cpp:31

pos
pos
[7]
Definition src_corelib_io_qsettings.cpp:57

out
QTextStream out(stdout)
[7]
Definition src_corelib_kernel_qvariant.cpp:17

ch
char ch
Definition src_corelib_io_qtextstream.cpp:30

nullptr
QObject::connect nullptr
Definition src_corelib_kernel_qobject.cpp:255

d
double d
Definition src_corelib_text_qlocale.cpp:9

toUtf16
auto toUtf16
[1]
Definition src_corelib_text_qstringconverter.cpp:6

fromUtf16
auto fromUtf16
[2]
Definition src_corelib_text_qstringconverter.cpp:13

toString
char * toString(const MyType &t)
[31]
Definition src_qtestlib_qtestcase_snippet.cpp:115

QLatin1::convertToUnicode
static char16_t * convertToUnicode(char16_t *dst, QLatin1StringView in) noexcept
Definition qstring.cpp:5687

QLatin1::convertFromUnicode
static char * convertFromUnicode(char *out, QStringView in, QStringConverter::State *state) noexcept
Definition qstringconverter.cpp:1714

QLocal8Bit::convertToUnicode
static QString convertToUnicode(QByteArrayView in, QStringConverter::State *state)
Definition qstringconverter_p.h:357

QLocal8Bit::convertFromUnicode
static QByteArray convertFromUnicode(QStringView in, QStringConverter::State *state)
Definition qstringconverter_p.h:359

QStringConverterBase::State
Definition qstringconverter_base.h:40

QStringConverterBase::State::flags
Flags flags
Definition qstringconverter_base.h:67

QStringConverterBase::State::remainingChars
qsizetype remainingChars
Definition qstringconverter_base.h:69

QStringConverterBase::State::clearFn
ClearDataFn clearFn
Definition qstringconverter_base.h:77

QStringConverterBase::State::internalState
int internalState
Definition qstringconverter_base.h:68

QStringConverterBase::State::invalidChars
qsizetype invalidChars
Definition qstringconverter_base.h:70

QStringConverterBase::State::d
void * d[2]
Definition qstringconverter_base.h:74

QStringConverterBase::State::state_data
uint state_data[4]
Definition qstringconverter_base.h:73

QStringConverter::Interface
Definition qstringconverter_base.h:120

QStringConverter::Interface::name
const char * name
Definition qstringconverter_base.h:124

QUtf16::convertToUnicode
static Q_CORE_EXPORT QString convertToUnicode(QByteArrayView, QStringConverter::State *, DataEndianness=DetectEndianness)
Definition qstringconverter.cpp:987

QUtf16::convertFromUnicode
static Q_CORE_EXPORT QByteArray convertFromUnicode(QStringView, QStringConverter::State *, DataEndianness=DetectEndianness)
Definition qstringconverter.cpp:946

QUtf32::convertFromUnicode
static Q_CORE_EXPORT QByteArray convertFromUnicode(QStringView, QStringConverter::State *, DataEndianness=DetectEndianness)
Definition qstringconverter.cpp:1076

QUtf32::convertToUnicode
static QChar * convertToUnicode(QChar *out, QByteArrayView, QStringConverter::State *state, DataEndianness endian)
Definition qstringconverter.cpp:1167

QUtf8BaseTraitsNoAscii
Definition qstringconverter_p.h:123

QUtf8BaseTraits::Error
static const int Error
Definition qstringconverter_p.h:63

QUtf8BaseTraits::EndOfString
static const int EndOfString
Definition qstringconverter_p.h:64

QUtf8NoOutputTraits::NoOutput
Definition qstringconverter.cpp:794

QUtf8NoOutputTraits
Definition qstringconverter.cpp:793

QUtf8NoOutputTraits::appendUtf16
static void appendUtf16(const NoOutput &, char16_t)
Definition qstringconverter.cpp:795

QUtf8NoOutputTraits::appendUcs4
static void appendUcs4(const NoOutput &, char32_t)
Definition qstringconverter.cpp:796

QUtf8::ValidUtf8Result
Definition qstringconverter_p.h:325

QUtf8::convertFromUnicode
static Q_CORE_EXPORT QByteArray convertFromUnicode(QStringView in)
Definition qstringconverter.cpp:474

QUtf8::compareUtf8
static int compareUtf8(QByteArrayView utf8, QStringView utf16, Qt::CaseSensitivity cs=Qt::CaseSensitive) noexcept
Definition qstringconverter.cpp:830

QUtf8::convertToUnicode
static QChar * convertToUnicode(QChar *buffer, QByteArrayView in) noexcept
Definition qstringconverter_p.h:301

QUtf8::isValidUtf8
static ValidUtf8Result isValidUtf8(QByteArrayView in)
Definition qstringconverter.cpp:799

QUtf8::convertFromLatin1
static Q_CORE_EXPORT char * convertFromLatin1(char *out, QLatin1StringView in)
Definition qstringconverter.cpp:581

State
Definition generate_keywords.cpp:256