FCL/sf/os/textandloc: charconvfw/Charconv/ongoing/Source/foreign/plugins/J5.CPP@8b9155204a54 (annotated)

32 8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	1	/*
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	2	* Copyright (c) 2005 Nokia Corporation and/or its subsidiary(-ies).
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	3	* All rights reserved.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	4	* This component and the accompanying materials are made available
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	5	* under the terms of the License "Eclipse Public License v1.0"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	6	* which accompanies this distribution, and is available
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	7	* at the URL "http://www.eclipse.org/legal/epl-v10.html".
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	8	*
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	9	* Initial Contributors:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	10	* Nokia Corporation - initial contribution.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	11	*
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	12	* Contributors:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	13	*
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	14	* Description:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	15	*
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	16	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	17
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	18
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	19
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	20
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	21
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	22
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	23
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	24
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	25	#include <e32std.h>
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	26	#include <charconv.h>
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	27	#include <ecom/implementationproxy.h>
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	28	#include <utf.h>
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	29	#include "charactersetconverter.h"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	30	#include "convutils.h"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	31	#include "shiftjis.h"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	32	#include "JISBASE.H"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	33	#include "J5.H"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	34
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	35	#include "jisx0201.h"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	36	#include "jisx0208.h"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	37	#include "jisx0212.h"
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	38
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	39	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	40	J5 will use up to KMaxSizeAutoDetectSample to try to deterine the format of data.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	41	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	42	const TInt KMaxSizeAutoDetectSample = 1000;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	43
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	44	const TUint8 KEscape = 0x1b;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	45	const TInt KByteOrderMark = 0xfeff;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	46
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	47	const TDesC8& CJ5Converter::ReplacementForUnconvertibleUnicodeCharacters()
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	48	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	49	return CnvShiftJis::ReplacementForUnconvertibleUnicodeCharacters();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	50	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	51
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	52	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	53	This API should not be used as it is ambiguous as to what encoding is required.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	54	The user should instead call the specific plug-in for the appropriate conversion.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	55	J5 ConvertFromUnicode() will convert to UTF8 as default.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	56	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	57	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	58	TInt CJ5Converter::ConvertFromUnicode(
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	59	CCnvCharacterSetConverter::TEndianness /* aDefaultEndiannessOfForeignCharacters */,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	60	const TDesC8& /* aReplacementForUnconvertibleUnicodeCharacters */,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	61	TDes8& aForeign,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	62	const TDesC16& aUnicode,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	63	CCnvCharacterSetConverter::TArrayOfAscendingIndices& /* aIndicesOfUnconvertibleCharacters */)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	64	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	65	return CnvUtfConverter::ConvertFromUnicodeToUtf8(aForeign, aUnicode);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	66	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	67
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	68	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	69	This will automatically determine one of the five supported encodings
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	70	to use and convert accordingly. This plugin method is available to the
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	71	user though the CCnvCharacterSetConverter::ConvertToUnicode() method.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	72	There is no way for the caller to determine which encoding has been used.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	73
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	74	NOTE: For debugging the selected character set is returned in the state.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	75
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	76	@released 9.1
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	77	@param aDefaultEndiannessOfForeignCharacters The default endian-ness to use when reading characters
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	78	in the foreign character set.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	79	@param aUnicode On return, contains the text converted into Unicode.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	80	@param aForeign The non-Unicode source text to be converted.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	81	@param aState Used to save state information across multiple calls
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	82	to <code>ConvertToUnicode()</code>.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	83	@param aNumberOfUnconvertibleCharacters On return, contains the number of bytes which were not
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	84	converted.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	85	@param aIndexOfFirstByteOfFirstUnconvertibleCharacter On return, contains the index of the first bytein the
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	86	input text that could not be converted. A negative
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	87	value indicates that all the characters were
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	88	converted.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	89	@return The number of unconverted bytes left at the end of the input descriptor
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	90	(e.g. because the output descriptor is not long enough to hold all the text),
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	91	or one of the error values defined in TError.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	92	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	93	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	94	TInt CJ5Converter::ConvertToUnicode(
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	95	CCnvCharacterSetConverter::TEndianness aDefaultEndiannessOfForeignCharacters,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	96	TDes16& aUnicode,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	97	const TDesC8& aForeign,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	98	TInt& aState,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	99	TInt& aNumberOfUnconvertibleCharacters,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	100	TInt& aIndexOfFirstByteOfFirstUnconvertibleCharacter)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	101	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	102	// As the aState parameter is used to pass back the detected value
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	103	// use a "hidden" internal state variable.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	104	TInt internalState = CCnvCharacterSetConverter::KStateDefault;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	105
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	106	// determine the encoding type and then decode appropriatly
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	107	switch ( DetectEncoding(aDefaultEndiannessOfForeignCharacters, aForeign))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	108	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	109	case EShiftjis:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	110	aState = EShiftjis;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	111	return CnvShiftJis::ConvertToUnicode(aDefaultEndiannessOfForeignCharacters, aUnicode, aForeign,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	112	aNumberOfUnconvertibleCharacters, aIndexOfFirstByteOfFirstUnconvertibleCharacter);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	113
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	114	case EIso2022jp1:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	115	aState = EIso2022jp1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	116	return CnvJisBase::ConvertToUnicode(aDefaultEndiannessOfForeignCharacters, aUnicode, aForeign, internalState,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	117	aNumberOfUnconvertibleCharacters, aIndexOfFirstByteOfFirstUnconvertibleCharacter);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	118
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	119	case EEucjp:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	120	aState = EEucjp;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	121	return ConvertEEucjpToUnicode(
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	122	aDefaultEndiannessOfForeignCharacters, aUnicode, aForeign, internalState,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	123	aNumberOfUnconvertibleCharacters, aIndexOfFirstByteOfFirstUnconvertibleCharacter);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	124
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	125	case EUcs2:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	126	aState = EUcs2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	127	return ConvertUcs2ToUnicode( aDefaultEndiannessOfForeignCharacters, aUnicode, aForeign,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	128	aNumberOfUnconvertibleCharacters, aIndexOfFirstByteOfFirstUnconvertibleCharacter);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	129
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	130	case EUtf8:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	131	aState = EUtf8;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	132	return CnvUtfConverter::ConvertToUnicodeFromUtf8(aUnicode, aForeign);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	133
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	134	default:
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	135	// fall though to the default, which is decode as UTF8
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	136	aState = EUnknown;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	137	break;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	138	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	139
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	140	// decode as UTF8
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	141	return CnvUtfConverter::ConvertToUnicodeFromUtf8(aUnicode, aForeign);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	142	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	143
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	144	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	145	This API is used by CCnvCharacterSetConverter::AutoDetectCharacterSetL().
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	146	This method returns a value between 0 and 100, indicating how likely it
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	147	is that this is the correct converter, for the text supplied. As J5 is
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	148	NOT intended to be used with the existing auto-detect mechanism, it will
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	149	always return 0
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	150	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	151	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	152	TBool CJ5Converter::IsInThisCharacterSetL(
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	153	TBool& aSetToTrue,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	154	TInt& aConfidenceLevel,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	155	const TDesC8& /* aSample */)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	156	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	157	/*
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	158	aSetToTrue - This value should be set to ETrue. It is used to indicate to
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	159	CCnvCharacterSetConverter::AutoDetectCharacterSetL() that the plug-in DLL
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	160	is implementing a function of this signature and is therefore not the empty
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	161	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	162	aSetToTrue=ETrue;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	163
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	164	/* no need to look at the sample as this always returns 0
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	165	as the autodetect feature is not supported by the J5 plug-in
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	166	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	167	aConfidenceLevel=0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	168	return ETrue;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	169	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	170
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	171	CJ5Converter* CJ5Converter::NewL()
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	172	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	173	CJ5Converter* self = new(ELeave) CJ5Converter();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	174	CleanupStack::PushL(self);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	175	self->ConstructL();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	176	CleanupStack::Pop(self);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	177	return self;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	178	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	179
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	180	CJ5Converter::~CJ5Converter()
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	181	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	182	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	183
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	184	CJ5Converter::CJ5Converter()
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	185	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	186	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	187
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	188	void CJ5Converter::ConstructL()
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	189	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	190	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	191
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	192	const TImplementationProxy ImplementationTable[] =
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	193	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	194	#ifdef DOCOMO_TEST
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	195	// for the test build use a special test UID
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	196	IMPLEMENTATION_PROXY_ENTRY(0x01000002, CJ5Converter::NewL)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	197	#else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	198	IMPLEMENTATION_PROXY_ENTRY(KCharacterSetIdentifierJ5, CJ5Converter::NewL)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	199	#endif
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	200	};
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	201
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	202	EXPORT_C const TImplementationProxy* ImplementationGroupProxy(TInt& aTableCount)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	203	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	204	aTableCount = sizeof(ImplementationTable) / sizeof(TImplementationProxy);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	205
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	206	return ImplementationTable;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	207	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	208
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	209	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	210	DetectEncoding determine the characterset encoding.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	211	The logic for this detection is based on the information in CJKV by Ken Lunde.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	212	A detailed diagram of this logic is in the J5 how to document section 2.4
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	213	@return The detected character set as a enum CJ5Converter.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	214	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	215	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	216	enum CJ5Converter::TJ5Encoding CJ5Converter::DetectEncoding(
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	217	CCnvCharacterSetConverter::TEndianness& aDefaultEndiannessOfForeignCharacters ,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	218	const TDesC8& aForeign)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	219	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	220
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	221	// first check for UCS2
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	222	CCnvCharacterSetConverter::TEndianness ucs2Endianness = CCnvCharacterSetConverter::ELittleEndian;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	223	if ( DetectUcs2(aForeign, ucs2Endianness ))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	224	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	225	// if ucs2 is detected pass back the detected endianess
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	226	aDefaultEndiannessOfForeignCharacters = ucs2Endianness;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	227	return EUcs2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	228	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	229
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	230	// next try EUC_JP
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	231	TInt eucJpValidBytes = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	232	CJ5Converter::TDectectCharacterSet result = DetectEucJp( aForeign, eucJpValidBytes );
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	233	if ( result == EIsCharacterSet )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	234	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	235	return EEucjp;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	236	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	237
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	238	// next try Iso 2020JP
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	239	if ( DetectIso2022( aForeign ) == EIsCharacterSet )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	240	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	241	return EIso2022jp1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	242	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	243
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	244	// next try Utf8
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	245	if ( DetectUtf8( aForeign ) == EIsCharacterSet )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	246	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	247	return EUtf8;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	248	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	249
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	250	// shiftjis
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	251	TInt shiftjisValidBytes = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	252	result = DetectShiftJis( aForeign, shiftjisValidBytes );
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	253	if ( result == EIsCharacterSet )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	254	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	255	return EShiftjis;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	256	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	257
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	258	// no clear winner so go for the best
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	259	TInt sampleLength = Min(aForeign.Length(), KMaxSizeAutoDetectSample);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	260
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	261	// if more than half is shiftjis and more shiftjis than EUC_JP,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	262	if ((shiftjisValidBytes > eucJpValidBytes ) && (shiftjisValidBytes * 2> sampleLength))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	263	return EShiftjis;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	264
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	265	// if more than half is EUC_JP and more EUC_JP than shiftjis,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	266	if ((eucJpValidBytes > shiftjisValidBytes ) && (eucJpValidBytes * 2> sampleLength))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	267	return EEucjp;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	268
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	269	// return the default
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	270	return EUcs2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	271	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	272
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	273
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	274	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	275	Check if UCS2.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	276	If the first two bytes are the Unicode Endian Specifiers (0xfffe or 0xfeff)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	277	then this must be UCS2. Otherwise try lookiing for 0x00 or 0x00
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	278	@param A sample of data to be checked
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	279	@param The Endianness if USC2 is detected
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	280	@return ETrue if UCS2 else EFalse
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	281	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	282	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	283	TBool CJ5Converter::DetectUcs2( const TDesC8& aForeign,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	284	CCnvCharacterSetConverter::TEndianness& aTEndianness )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	285	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	286	// if the sample is not big enough
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	287	if (aForeign.Length() < 2)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	288	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	289	return EFalse;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	290	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	291	else if (aForeign[0]==0xff && aForeign[1]==0xfe )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	292	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	293	// we have found a Little Endian Byte order mark
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	294	aTEndianness = CCnvCharacterSetConverter::ELittleEndian;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	295	return ETrue;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	296	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	297	else if (aForeign[0]==0xfe && aForeign[1]==0xff )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	298	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	299	// we have found a Big Endian Byte order mark
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	300	aTEndianness = CCnvCharacterSetConverter::EBigEndian;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	301	return ETrue;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	302	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	303
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	304	// Next check for sequences of 0x00 or 0x00 as UCS-2 is the only charset that
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	305	// specifies 0x00 or 0x00 (according to endianness) for the ASCII range of characters.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	306	// NB: This will fail if there are no ASCII characters in the text.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	307	TInt sampleLength = aForeign.Length();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	308	sampleLength = Min(aForeign.Length(), KMaxSizeAutoDetectSample);;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	309
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	310	// check the sample for sequences of 0x00 or 0x00
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	311	TInt bigEndianConfidence = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	312	TInt littleEndianConfidence = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	313	TInt i=0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	314	for(;i< (sampleLength-1); i+=2)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	315	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	316	if( aForeign[i] == 0x00)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	317	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	318	bigEndianConfidence +=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	319	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	320	else if ( aForeign[i+1] == 0x00)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	321	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	322	littleEndianConfidence +=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	323	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	324	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	325
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	326	// which occurs most BE or LE
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	327	TInt confidenceLevel = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	328	if (bigEndianConfidence > littleEndianConfidence)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	329	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	330	aTEndianness = CCnvCharacterSetConverter::EBigEndian;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	331	confidenceLevel = bigEndianConfidence;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	332	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	333	else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	334	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	335	aTEndianness = CCnvCharacterSetConverter::ELittleEndian;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	336	confidenceLevel = littleEndianConfidence;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	337	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	338
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	339	// if more than 97% count as UCS2
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	340	if ( confidenceLevel * 100/sampleLength > 97)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	341	return ETrue;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	342
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	343	return EFalse;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	344	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	345
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	346	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	347	Check if ShiftJis (reference CJKV by Ken Lunde page 175)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	348	@param A sample of data to be checked
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	349	@param The number of input bytes that can be converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	350	@return The result of the check as either EIsCharacterSet, EIsNotCharacterSet or EMaybeCharacterSet
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	351	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	352	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	353	enum CJ5Converter::TDectectCharacterSet CJ5Converter::DetectShiftJis( const TDesC8& aForeign,TInt &aNumberOfBytesConverted )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	354	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	355	// Get the sample length
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	356	TInt sampleLength = Min(aForeign.Length(), KMaxSizeAutoDetectSample);;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	357
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	358	TInt i=0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	359	aNumberOfBytesConverted = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	360
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	361	TText8 character;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	362	TText8 characterPlus1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	363	TText8 characterPlus2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	364
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	365	// scan the sample text looking for valid shiftjis data
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	366	while ( i < sampleLength )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	367	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	368	// get the next few characters, use 0 if there is no more sample
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	369	// as this will not match any test.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	370	character = aForeign[i];
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	371	characterPlus1 = ( i < (sampleLength-1) ? aForeign[i+1]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	372	characterPlus2 = ( i < (sampleLength-2) ? aForeign[i+2]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	373
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	374	// SHIFTJIS - 0x8e to 0x9f followed by 0x40 to 0xfc
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	375	if ((character >= 0x81) && (character <= 0x9f) &&
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	376	(characterPlus1 >= 0x40) && (characterPlus1 <= 0xfc) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	377	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	378	// this is SHIFTJIS unless it is EUC JP code set 2 or 3
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	379	if ((character == 0x8E) && (characterPlus1 >= 0xA1) && (characterPlus1 <= 0xDF))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	380	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	381	// this could be EUC JP code set 2 (or shiftjis)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	382	aNumberOfBytesConverted+=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	383	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	384	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	385	else if ((character == 0x8F) &&
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	386	(characterPlus1 >= 0xA1) && (characterPlus1 <= 0xDF) &&
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	387	(characterPlus2 >= 0xA1) && (characterPlus2 <= 0xDF))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	388	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	389	// this could be EUC JP code set 3 (or shiftjis)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	390	aNumberOfBytesConverted+=3;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	391	i+=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	392	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	393	else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	394	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	395	// this can only be shift jis
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	396	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	397	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	398	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	399
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	400	// SHIFTJIS - 0xE0 to 0xEF followed by .....
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	401	else if ((character >= 0xE0) && (character <= 0xEF))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	402	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	403	// 0x40 to 0xFC which overlaps UTF8 between 0x80 and 0xBF
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	404	// including Mopera extension to shiftjis from 0xEF80 to 0xEFFC
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	405
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	406	if ( (characterPlus1 >= 0x40) && (characterPlus1 <= 0x7E) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	407	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	408	// this can only be shift jis
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	409	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	410	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	411	else if ( (characterPlus1 >= 0xC0) && (characterPlus1 <= 0xFC) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	412	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	413	// this could be EUC JP code set 1
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	414	aNumberOfBytesConverted+=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	415	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	416	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	417
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	418	// problem here is the overlap between the UTF8 and shiftjis
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	419	else if ( (characterPlus1 >= 0x80) && (characterPlus1 <= 0xBF) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	420	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	421	// this could be shiftjis or utf8
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	422	aNumberOfBytesConverted+=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	423	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	424	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	425	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	426	// half width katakana A1-DF
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	427	else if ((character >= 0xA1) && (character <= 0xDF))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	428	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	429	aNumberOfBytesConverted+=1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	430	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	431	// ASCII or JIS-Roman 20-7e
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	432	else if ( ((character >= 0x20) && (character <= 0x7E)) \|\| (character == 0x0A) \|\| (character == 0x0D))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	433	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	434	aNumberOfBytesConverted+=1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	435	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	436	else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	437	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	438	// This is not decoding as shiftjis, so reject
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	439	aNumberOfBytesConverted =0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	440	return EIsNotCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	441	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	442	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	443	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	444
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	445	// if all the characters could be converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	446	if (aNumberOfBytesConverted == sampleLength)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	447	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	448	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	449	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	450	else if (aNumberOfBytesConverted == 0)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	451	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	452	return EIsNotCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	453	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	454	else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	455	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	456	return EMaybeCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	457	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	458	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	459
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	460	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	461	Check if UTF8 (reference CJKV by Ken Lunde page 189)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	462	@param A sample of data to be checked
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	463	@param The number of input bytes that can be converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	464	@return The result of the check as either EIsCharacterSet, EIsNotCharacterSet or EMaybeCharacterSet
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	465	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	466	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	467	enum CJ5Converter::TDectectCharacterSet CJ5Converter::DetectUtf8( const TDesC8& aForeign )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	468	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	469	// Get the sample length
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	470	TInt sampleLength = Min(aForeign.Length(), KMaxSizeAutoDetectSample);;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	471
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	472	TInt i=0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	473	TText8 character;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	474	TText8 characterPlus1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	475	TText8 characterPlus2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	476	TText8 characterPlus3;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	477
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	478	// scan the sample text looking for valid UTF8
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	479	while ( i < sampleLength )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	480	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	481	// get the next few characters, use 0 if there is no more sample
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	482	// as this will not match any test.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	483	character = aForeign[i];
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	484	characterPlus1 = ( i < (sampleLength-1) ? aForeign[i+1]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	485	characterPlus2 = ( i < (sampleLength-2) ? aForeign[i+2]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	486	characterPlus3 = ( i < (sampleLength-3) ? aForeign[i+3]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	487
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	488	// UTF8 range 110xxxxx followed by one valid UTF8 bytes
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	489	if(((character & 0xe0)==0xc0) && (( characterPlus1 & 0xc0)==0x80) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	490	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	491	// two bytes of valid UTF8 found
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	492	i+=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	493	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	494	// UTF8 range 1110xxxx followed by two valid UTF8 bytes
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	495	else if(((character & 0xf0)==0xe0) && (( characterPlus1 & 0xc0)==0x80) && (( characterPlus2 & 0xc0)==0x80))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	496	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	497	// three bytes of valid UTF8 found
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	498	i+=3;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	499	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	500	// UTF8 range 11110xxx followed by three valid UTF8 bytes
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	501	else if(((character & 0xf8)==0xf0) && (( characterPlus1 & 0xc0)==0x80)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	502	&& (( characterPlus2 & 0xc0)==0x80) && (( characterPlus3 & 0xc0)==0x80) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	503	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	504	// four bytes of valid UTF8 found
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	505	i+=4;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	506	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	507
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	508	// ascii range 0 to 0x7F
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	509	else if((character & 0x80)==0x00)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	510	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	511	// The value of character is in the range 0x00-0x7f
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	512	// UTF8 maintains ASCII transparency. So it's a valid UTF8.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	513	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	514	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	515	// if the sample data is longer than KMaxSizeAutoDetectSample then except anything
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	516	// for the last two bytes as they may not appear valid without more data
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	517	else if( i >= (KMaxSizeAutoDetectSample -2) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	518	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	519	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	520	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	521	else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	522	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	523	// This is not decoding as UTF8 so reject
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	524	return EIsNotCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	525	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	526	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	527
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	528	// All the characters could be converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	529	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	530
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	531	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	532
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	533
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	534	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	535	Check if ISO2022JP by lookiing for the escape sequences.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	536	@param A sample of data to be checked
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	537	@param The number of input bytes that can be converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	538	@return The result of the check as either EIsCharacterSet, EIsNotCharacterSet or EMaybeCharacterSet
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	539	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	540	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	541	enum CJ5Converter::TDectectCharacterSet CJ5Converter::DetectIso2022( const TDesC8& aForeign )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	542	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	543	// Get the sample length
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	544	TInt sampleLength = Min(aForeign.Length(), KMaxSizeAutoDetectSample);;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	545
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	546	TInt i=0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	547	TText8 character;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	548	TText8 characterPlus1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	549	TText8 characterPlus2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	550	TText8 characterPlus3;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	551	TText8 characterPlus4;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	552	TText8 characterPlus5;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	553
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	554	// scan the sample text looking for valid UTF8
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	555	while ( i < sampleLength )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	556	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	557	// get the next few characters, use 0 if there is no more sample
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	558	// as this will not match any test.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	559	character = aForeign[i];
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	560	characterPlus1 = ( i < (sampleLength-1) ? aForeign[i+1]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	561	characterPlus2 = ( i < (sampleLength-2) ? aForeign[i+2]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	562	characterPlus3 = ( i < (sampleLength-3) ? aForeign[i+3]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	563
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	564
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	565	// check for the JIS escape sequences of ISO 2022Jp
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	566	// These values have been taken from JISBASE_SHARED
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	567	if (character == KEscape)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	568	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	569	// Escape Sequence For Jis C6226_1978 \x1b\x24\x40
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	570	if ((characterPlus1 == 0x24) && (characterPlus2 == 0x40))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	571	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	572	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	573	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	574
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	575	// Escape Sequence For Jis X0208_1983 \x1b\x24\x42
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	576	else if ((characterPlus1 == 0x24) && (characterPlus2 == 0x42))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	577	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	578	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	579	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	580
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	581	// Escape Sequence For Jis Roman \x1b\x28\x4a
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	582	else if ((characterPlus1 == 0x28) && (characterPlus2 == 0x4A))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	583	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	584	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	585	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	586
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	587	// Escape Sequence For Jis RomanIncorrect \x1b\x28\x48
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	588	else if ((characterPlus1 == 0x28) && (characterPlus2 == 0x48))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	589	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	590	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	591	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	592
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	593	// Escape Sequence For Ascii \x1b\x28\x42
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	594	else if ((characterPlus1 == 0x28) && (characterPlus2 == 0x42))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	595	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	596	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	597	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	598
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	599	// Escape Sequence For EscapeSequenceForHalfWidthKatakana \x1b\x28\x49
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	600	else if ((characterPlus1 == 0x28) && (characterPlus2 == 0x49))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	601	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	602	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	603	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	604
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	605	// Escape Sequence For Jis X0208_199x \x1b\x26\x40\x1b\x24\x42
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	606	else if ((characterPlus1 == 0x26) && (characterPlus2 == 0x40))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	607	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	608	characterPlus4 = ( i < (sampleLength-4) ? aForeign[i+4]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	609	characterPlus5 = ( i < (sampleLength-5) ? aForeign[i+5]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	610
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	611	if ((characterPlus3 == 0x1b) && (characterPlus4 == 0x24) && (characterPlus5 == 0x42))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	612	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	613	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	614	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	615	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	616	// Escape Sequence For Jis X0212_1990 \x1b\x24\x28\x44
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	617	else if ((characterPlus1 == 0x24) && (characterPlus2 == 0x28))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	618	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	619	if (characterPlus3 == 0x44)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	620	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	621	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	622	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	623	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	624
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	625	// check for the JIS escape sequences of ISO 2022Jp "B@" x42 x40
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	626	else if ((characterPlus1 == 'B') \|\| (characterPlus1 == '@'))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	627	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	628	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	629	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	630
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	631	} // end of if ( character == KEscape )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	632
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	633	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	634	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	635
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	636	// if escape sequences have been found then this is not ISO2022
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	637	return EIsNotCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	638
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	639	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	640
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	641
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	642	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	643	Check if EUC JP (reference CJKV by Ken Lunde page 164)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	644	@param A sample of data to be checked
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	645	@param The number of input bytes that can be converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	646	@return The result of the check as either EIsCharacterSet, EIsNotCharacterSet or EMaybeCharacterSet
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	647	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	648	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	649	CJ5Converter::TDectectCharacterSet CJ5Converter::DetectEucJp( const TDesC8& aForeign,TInt &aNumberOfBytesConverted )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	650	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	651	// Get the sample length
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	652	TInt sampleLength = Min(aForeign.Length(), KMaxSizeAutoDetectSample);;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	653
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	654	TInt i=0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	655	aNumberOfBytesConverted = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	656
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	657	TText8 character;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	658	TText8 characterPlus1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	659	TText8 characterPlus2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	660
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	661	// scan the sample text looking for valid shiftjis data
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	662	while ( i < sampleLength )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	663	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	664	// get the next few characters, use 0 if there is no more sample
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	665	// as this will not match any test.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	666	character = aForeign[i];
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	667	characterPlus1 = ( i < (sampleLength-1) ? aForeign[i+1]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	668	characterPlus2 = ( i < (sampleLength-2) ? aForeign[i+2]:0);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	669
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	670	// EUCJP code set 0 0x21-0x7e
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	671	if ( (character >= 0x21) && (character <= 0x7e))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	672	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	673	aNumberOfBytesConverted++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	674	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	675	else if ( (character == 0x0a) \|\| (character == 0x0d))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	676	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	677	aNumberOfBytesConverted++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	678	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	679	// EUCJP code set 1
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	680	else if ( (character >= 0xa1) && (character <= 0xff)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	681	&& (characterPlus1 >= 0xa1) && (characterPlus1 <= 0xff) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	682	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	683	aNumberOfBytesConverted+=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	684	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	685	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	686
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	687	// EUC JP code set 2, starts with the EUC JP SS2 character (0x8E)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	688	// and is followed by character in range 0xA1- 0xDF
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	689	else if ((character == 0x8E) && (characterPlus1 >= 0xA1) && (characterPlus1 <= 0xDF) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	690	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	691	// this could be 2 bytes of EUC JP code set 2
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	692	aNumberOfBytesConverted += 2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	693	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	694	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	695	// EUC JP code set 3, starts with the EUC JP SS3 character (0x8F)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	696	// and is followed by two characters in range A1- DF A1 -FE
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	697	else if ((character == 0x8F) && (characterPlus1 >= 0xA1) && (characterPlus1 <= 0xDF)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	698	&& (characterPlus2 >= 0xA1) && (characterPlus2 <= 0xDF))
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	699	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	700	// this could be 3 bytes of EUC JP code set 3
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	701	aNumberOfBytesConverted += 3;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	702	i+=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	703	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	704	else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	705	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	706	// This is not a valid decoding as EUC JP so reject
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	707	return EIsNotCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	708	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	709	i++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	710	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	711
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	712
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	713	// if all the characters could be converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	714	if (aNumberOfBytesConverted == sampleLength)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	715	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	716	return EIsCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	717	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	718	else if (aNumberOfBytesConverted == 0)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	719	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	720	return EIsNotCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	721	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	722	else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	723	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	724	return EMaybeCharacterSet;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	725	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	726	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	727
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	728
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	729	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	730	Convert from UCS2 (Universal Character Set containing two bytes) to unicode
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	731	Remove any byte order marks in the UCSs.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	732	@param aUnicode Contains the converted text in the Unicode character set.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	733	@param aForeign The non-Unicode source text to be converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	734	@param aNumberOfUnconvertibleCharacters Contains the number of bytes which were not converted.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	735	@param aIndexOfFirstByteOfFirstUnconvertibleCharacter The index of the first byte of the first unconvertible character.
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	736	@return the number of bytes converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	737	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	738	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	739	TInt CJ5Converter::ConvertUcs2ToUnicode(CCnvCharacterSetConverter::TEndianness& aDefaultEndiannessOfForeignCharacters,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	740	TDes16& aUnicode,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	741	const TDesC8& aForeign,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	742	TInt& aNumberOfUnconvertibleCharacters,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	743	TInt& aIndexOfFirstByteOfFirstUnconvertibleCharacter)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	744
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	745	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	746	TInt numberOfBytesConverted = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	747	TInt numberOfUnicodeCharacters =0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	748	TChar nextChar;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	749
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	750	// start at begining of the output buffer provided
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	751	aUnicode.Zero();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	752
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	753	// while there is at least 2 bytes of data to convert and space in the output buffer
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	754	while ( (numberOfBytesConverted+1 < aForeign.Size()) && (numberOfUnicodeCharacters < aUnicode.MaxLength()) )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	755	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	756	if (aDefaultEndiannessOfForeignCharacters == CCnvCharacterSetConverter::ELittleEndian )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	757	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	758	// ELittleEndian 0x??00
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	759	nextChar = aForeign[numberOfBytesConverted] + ( aForeign[numberOfBytesConverted+1] << 8);
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	760	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	761	else
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	762	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	763	// EBigEndian 0x00??
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	764	nextChar = ( aForeign[numberOfBytesConverted] <<8 ) + aForeign[numberOfBytesConverted+1];
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	765	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	766
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	767	// save the unicode character extracted unless it's a BOM
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	768	if ( nextChar != KByteOrderMark )
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	769	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	770	aUnicode.Append( nextChar );
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	771	numberOfUnicodeCharacters++;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	772	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	773
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	774	numberOfBytesConverted+=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	775	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	776
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	777	// there are no uncovertable characters with UCS2, but there could be
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	778	aNumberOfUnconvertibleCharacters = 0;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	779	// a negative value indicates that all characters converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	780	aIndexOfFirstByteOfFirstUnconvertibleCharacter = -1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	781
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	782	// returns the number of unconverted bytes left at the end of the input descriptor
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	783	// Note there could be 1 byte left over if an odd number of bytes provided for conversion
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	784	return aForeign.Size() - numberOfBytesConverted;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	785	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	786
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	787	/**
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	788	Convert from EUC_JP (Extended Unix Code encoding for Japanese)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	789	Using the standard Charconv method of an array of methods
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	790	@return the number of bytes converted
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	791	@internalTechnology
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	792	*/
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	793	TInt CJ5Converter::ConvertEEucjpToUnicode(
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	794	CCnvCharacterSetConverter::TEndianness aDefaultEndiannessOfForeignCharacters,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	795	TDes16& aUnicode,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	796	const TDesC8& aForeign,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	797	TInt& /aState/,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	798	TInt& aNumberOfUnconvertibleCharacters,
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	799	TInt& aIndexOfFirstByteOfFirstUnconvertibleCharacter)
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	800	{
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	801	TFixedArray<CnvUtilities::SMethod, 4> methods;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	802	methods[0].iNumberOfBytesAbleToConvert=NumberOfBytesAbleToConvertToJisRoman;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	803	methods[0].iConvertToIntermediateBufferInPlace=DummyConvertToIntermediateBufferInPlace;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	804	methods[0].iConversionData=&CnvJisRoman::ConversionData();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	805	methods[0].iNumberOfBytesPerCharacter=1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	806	methods[0].iNumberOfCoreBytesPerCharacter=1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	807	methods[1].iNumberOfBytesAbleToConvert=NumberOfBytesAbleToConvertToJisX0208;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	808	methods[1].iConvertToIntermediateBufferInPlace=ConvertToJisX0208FromEucJpPackedInPlace;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	809	methods[1].iConversionData=&CnvJisX0208::ConversionData();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	810	methods[1].iNumberOfBytesPerCharacter=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	811	methods[1].iNumberOfCoreBytesPerCharacter=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	812	methods[2].iNumberOfBytesAbleToConvert=NumberOfBytesAbleToConvertToHalfWidthKatakana8;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	813	methods[2].iConvertToIntermediateBufferInPlace=ConvertToHalfWidthKatakana8FromEucJpPackedInPlace;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	814	methods[2].iConversionData=&CnvHalfWidthKatakana8::ConversionData();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	815	methods[2].iNumberOfBytesPerCharacter=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	816	methods[2].iNumberOfCoreBytesPerCharacter=1;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	817	methods[3].iNumberOfBytesAbleToConvert=NumberOfBytesAbleToConvertToJisX0212;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	818	methods[3].iConvertToIntermediateBufferInPlace=ConvertToJisX0212FromEucJpPackedInPlace;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	819	methods[3].iConversionData=&CnvJisX0212::ConversionData();
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	820	methods[3].iNumberOfBytesPerCharacter=3;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	821	methods[3].iNumberOfCoreBytesPerCharacter=2;
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	822	return CnvUtilities::ConvertToUnicodeFromHeterogeneousForeign(aDefaultEndiannessOfForeignCharacters, aUnicode, aForeign, aNumberOfUnconvertibleCharacters, aIndexOfFirstByteOfFirstUnconvertibleCharacter, methods.Array());
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	823	}
8b9155204a54 Revert last code drop. Pat Downey <patd@symbian.org> parents: diff changeset	824

author	Pat Downey <patd@symbian.org>
	Fri, 04 Jun 2010 10:37:54 +0100
changeset 32	8b9155204a54
permissions	-rw-r--r--