MCL/sf/mw/qt: src/corelib/tools/qregexp.cpp@cc75c76972ee (annotated)

0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1	/****************************************************************************
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2	**
4 3b1da2848fc7 Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 3 diff changeset	3	** Copyright (C) 2010 Nokia Corporation and/or its subsidiary(-ies).
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4	** All rights reserved.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	5	** Contact: Nokia Corporation (qt-info@nokia.com)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	6	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	7	** This file is part of the QtCore module of the Qt Toolkit.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	8	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	9	** $QT_BEGIN_LICENSE:LGPL$
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	10	** No Commercial Usage
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	11	** This file contains pre-release code and may not be distributed.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	12	** You may use this file in accordance with the terms and conditions
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	13	** contained in the Technology Preview License Agreement accompanying
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	14	** this package.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	15	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	16	** GNU Lesser General Public License Usage
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	17	** Alternatively, this file may be used under the terms of the GNU Lesser
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	18	** General Public License version 2.1 as published by the Free Software
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	19	** Foundation and appearing in the file LICENSE.LGPL included in the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	20	** packaging of this file. Please review the following information to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	21	** ensure the GNU Lesser General Public License version 2.1 requirements
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	22	** will be met: http://www.gnu.org/licenses/old-licenses/lgpl-2.1.html.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	23	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	24	** In addition, as a special exception, Nokia gives you certain additional
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	25	** rights. These rights are described in the Nokia Qt LGPL Exception
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	26	** version 1.1, included in the file LGPL_EXCEPTION.txt in this package.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	27	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	28	** If you have questions regarding the use of this file, please contact
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	29	** Nokia at qt-info@nokia.com.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	30	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	31	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	32	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	33	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	34	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	35	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	36	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	37	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	38	** $QT_END_LICENSE$
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	39	**
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	40	****************************************************************************/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	41
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	42	#include "qregexp.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	43
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	44	#include "qalgorithms.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	45	#include "qbitarray.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	46	#include "qcache.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	47	#include "qdatastream.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	48	#include "qlist.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	49	#include "qmap.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	50	#include "qmutex.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	51	#include "qstring.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	52	#include "qstringlist.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	53	#include "qstringmatcher.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	54	#include "qvector.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	55	#include "private/qfunctions_p.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	56
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	57	#include <limits.h>
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	58
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	59	QT_BEGIN_NAMESPACE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	60
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	61	int qFindString(const QChar *haystack, int haystackLen, int from,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	62	const QChar *needle, int needleLen, Qt::CaseSensitivity cs);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	63
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	64	// error strings for the regexp parser
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	65	#define RXERR_OK QT_TRANSLATE_NOOP("QRegExp", "no error occurred")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	66	#define RXERR_DISABLED QT_TRANSLATE_NOOP("QRegExp", "disabled feature used")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	67	#define RXERR_CHARCLASS QT_TRANSLATE_NOOP("QRegExp", "bad char class syntax")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	68	#define RXERR_LOOKAHEAD QT_TRANSLATE_NOOP("QRegExp", "bad lookahead syntax")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	69	#define RXERR_REPETITION QT_TRANSLATE_NOOP("QRegExp", "bad repetition syntax")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	70	#define RXERR_OCTAL QT_TRANSLATE_NOOP("QRegExp", "invalid octal value")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	71	#define RXERR_LEFTDELIM QT_TRANSLATE_NOOP("QRegExp", "missing left delim")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	72	#define RXERR_END QT_TRANSLATE_NOOP("QRegExp", "unexpected end")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	73	#define RXERR_LIMIT QT_TRANSLATE_NOOP("QRegExp", "met internal limit")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	74	#define RXERR_INTERVAL QT_TRANSLATE_NOOP("QRegExp", "invalid interval")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	75	#define RXERR_CATEGORY QT_TRANSLATE_NOOP("QRegExp", "invalid category")
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	76
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	77	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	78	WARNING! Be sure to read qregexp.tex before modifying this file.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	79	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	80
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	81	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	82	\class QRegExp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	83	\reentrant
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	84	\brief The QRegExp class provides pattern matching using regular expressions.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	85
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	86	\ingroup tools
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	87	\ingroup shared
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	88
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	89	\keyword regular expression
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	90
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	91	A regular expression, or "regexp", is a pattern for matching
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	92	substrings in a text. This is useful in many contexts, e.g.,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	93
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	94	\table
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	95	\row \i Validation
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	96	\i A regexp can test whether a substring meets some criteria,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	97	e.g. is an integer or contains no whitespace.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	98	\row \i Searching
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	99	\i A regexp provides more powerful pattern matching than
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	100	simple substring matching, e.g., match one of the words
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	101	\e{mail}, \e{letter} or \e{correspondence}, but none of the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	102	words \e{email}, \e{mailman}, \e{mailer}, \e{letterbox}, etc.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	103	\row \i Search and Replace
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	104	\i A regexp can replace all occurrences of a substring with a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	105	different substring, e.g., replace all occurrences of \e{&}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	106	with \e{\&} except where the \e{&} is already followed by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	107	an \e{amp;}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	108	\row \i String Splitting
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	109	\i A regexp can be used to identify where a string should be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	110	split apart, e.g. splitting tab-delimited strings.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	111	\endtable
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	112
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	113	A brief introduction to regexps is presented, a description of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	114	Qt's regexp language, some examples, and the function
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	115	documentation itself. QRegExp is modeled on Perl's regexp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	116	language. It fully supports Unicode. QRegExp can also be used in a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	117	simpler, \e{wildcard mode} that is similar to the functionality
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	118	found in command shells. The syntax rules used by QRegExp can be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	119	changed with setPatternSyntax(). In particular, the pattern syntax
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	120	can be set to QRegExp::FixedString, which means the pattern to be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	121	matched is interpreted as a plain string, i.e., special characters
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	122	(e.g., backslash) are not escaped.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	123
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	124	A good text on regexps is \e {Mastering Regular Expressions}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	125	(Third Edition) by Jeffrey E. F. Friedl, ISBN 0-596-52812-4.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	126
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	127	\tableofcontents
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	128
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	129	\section1 Introduction
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	130
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	131	Regexps are built up from expressions, quantifiers, and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	132	assertions. The simplest expression is a character, e.g. \bold{x}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	133	or \bold{5}. An expression can also be a set of characters
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	134	enclosed in square brackets. \bold{[ABCD]} will match an \bold{A}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	135	or a \bold{B} or a \bold{C} or a \bold{D}. We can write this same
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	136	expression as \bold{[A-D]}, and an experession to match any
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	137	captital letter in the English alphabet is written as
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	138	\bold{[A-Z]}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	139
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	140	A quantifier specifies the number of occurrences of an expression
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	141	that must be matched. \bold{x{1,1}} means match one and only one
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	142	\bold{x}. \bold{x{1,5}} means match a sequence of \bold{x}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	143	characters that contains at least one \bold{x} but no more than
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	144	five.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	145
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	146	Note that in general regexps cannot be used to check for balanced
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	147	brackets or tags. For example, a regexp can be written to match an
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	148	opening html \c{<b>} and its closing \c{</b>}, if the \c{<b>} tags
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	149	are not nested, but if the \c{<b>} tags are nested, that same
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	150	regexp will match an opening \c{<b>} tag with the wrong closing
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	151	\c{</b>}. For the fragment \c{<b>bold <b>bolder</b></b>}, the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	152	first \c{<b>} would be matched with the first \c{</b>}, which is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	153	not correct. However, it is possible to write a regexp that will
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	154	match nested brackets or tags correctly, but only if the number of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	155	nesting levels is fixed and known. If the number of nesting levels
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	156	is not fixed and known, it is impossible to write a regexp that
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	157	will not fail.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	158
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	159	Suppose we want a regexp to match integers in the range 0 to 99.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	160	At least one digit is required, so we start with the expression
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	161	\bold{[0-9]{1,1}}, which matches a single digit exactly once. This
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	162	regexp matches integers in the range 0 to 9. To match integers up
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	163	to 99, increase the maximum number of occurrences to 2, so the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	164	regexp becomes \bold{[0-9]{1,2}}. This regexp satisfies the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	165	original requirement to match integers from 0 to 99, but it will
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	166	also match integers that occur in the middle of strings. If we
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	167	want the matched integer to be the whole string, we must use the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	168	anchor assertions, \bold{^} (caret) and \bold{$} (dollar). When
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	169	\bold{^} is the first character in a regexp, it means the regexp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	170	must match from the beginning of the string. When \bold{$} is the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	171	last character of the regexp, it means the regexp must match to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	172	the end of the string. The regexp becomes \bold{^[0-9]{1,2}$}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	173	Note that assertions, e.g. \bold{^} and \bold{$}, do not match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	174	characters but locations in the string.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	175
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	176	If you have seen regexps described elsewhere, they may have looked
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	177	different from the ones shown here. This is because some sets of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	178	characters and some quantifiers are so common that they have been
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	179	given special symbols to represent them. \bold{[0-9]} can be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	180	replaced with the symbol \bold{\\d}. The quantifier to match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	181	exactly one occurrence, \bold{{1,1}}, can be replaced with the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	182	expression itself, i.e. \bold{x{1,1}} is the same as \bold{x}. So
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	183	our 0 to 99 matcher could be written as \bold{^\\d{1,2}$}. It can
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	184	also be written \bold{^\\d\\d{0,1}$}, i.e. \e{From the start of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	185	the string, match a digit, followed immediately by 0 or 1 digits}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	186	In practice, it would be written as \bold{^\\d\\d?$}. The \bold{?}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	187	is shorthand for the quantifier \bold{{0,1}}, i.e. 0 or 1
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	188	occurrences. \bold{?} makes an expression optional. The regexp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	189	\bold{^\\d\\d?$} means \e{From the beginning of the string, match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	190	one digit, followed immediately by 0 or 1 more digit, followed
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	191	immediately by end of string}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	192
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	193	To write a regexp that matches one of the words 'mail' \e or
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	194	'letter' \e or 'correspondence' but does not match words that
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	195	contain these words, e.g., 'email', 'mailman', 'mailer', and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	196	'letterbox', start with a regexp that matches 'mail'. Expressed
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	197	fully, the regexp is \bold{m{1,1}a{1,1}i{1,1}l{1,1}}, but because
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	198	a character expression is automatically quantified by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	199	\bold{{1,1}}, we can simplify the regexp to \bold{mail}, i.e., an
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	200	'm' followed by an 'a' followed by an 'i' followed by an 'l'. Now
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	201	we can use the vertical bar \bold{\|}, which means \bold{or}, to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	202	include the other two words, so our regexp for matching any of the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	203	three words becomes \bold{mail\|letter\|correspondence}. Match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	204	'mail' \bold{or} 'letter' \bold{or} 'correspondence'. While this
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	205	regexp will match one of the three words we want to match, it will
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	206	also match words we don't want to match, e.g., 'email'. To
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	207	prevent the regexp from matching unwanted words, we must tell it
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	208	to begin and end the match at word boundaries. First we enclose
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	209	our regexp in parentheses, \bold{(mail\|letter\|correspondence)}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	210	Parentheses group expressions together, and they identify a part
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	211	of the regexp that we wish to \l{capturing text}{capture}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	212	Enclosing the expression in parentheses allows us to use it as a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	213	component in more complex regexps. It also allows us to examine
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	214	which of the three words was actually matched. To force the match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	215	to begin and end on word boundaries, we enclose the regexp in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	216	\bold{\\b} \e{word boundary} assertions:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	217	\bold{\\b(mail\|letter\|correspondence)\\b}. Now the regexp means:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	218	\e{Match a word boundary, followed by the regexp in parentheses,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	219	followed by a word boundary}. The \bold{\\b} assertion matches a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	220	\e position in the regexp, not a \e character. A word boundary is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	221	any non-word character, e.g., a space, newline, or the beginning
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	222	or ending of a string.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	223
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	224	If we want to replace ampersand characters with the HTML entity
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	225	\bold{\&}, the regexp to match is simply \bold{\&}. But this
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	226	regexp will also match ampersands that have already been converted
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	227	to HTML entities. We want to replace only ampersands that are not
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	228	already followed by \bold{amp;}. For this, we need the negative
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	229	lookahead assertion, \bold{(?!}__\bold{)}. The regexp can then be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	230	written as \bold{\&(?!amp;)}, i.e. \e{Match an ampersand that is}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	231	\bold{not} \e{followed by} \bold{amp;}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	232
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	233	If we want to count all the occurrences of 'Eric' and 'Eirik' in a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	234	string, two valid solutions are \bold{\\b(Eric\|Eirik)\\b} and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	235	\bold{\\bEi?ri[ck]\\b}. The word boundary assertion '\\b' is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	236	required to avoid matching words that contain either name,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	237	e.g. 'Ericsson'. Note that the second regexp matches more
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	238	spellings than we want: 'Eric', 'Erik', 'Eiric' and 'Eirik'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	239
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	240	Some of the examples discussed above are implemented in the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	241	\link #code-examples code examples \endlink section.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	242
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	243	\target characters-and-abbreviations-for-sets-of-characters
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	244	\section1 Characters and Abbreviations for Sets of Characters
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	245
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	246	\table
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	247	\header \i Element \i Meaning
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	248	\row \i \bold{c}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	249	\i A character represents itself unless it has a special
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	250	regexp meaning. e.g. \bold{c} matches the character \e c.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	251	\row \i \bold{\\c}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	252	\i A character that follows a backslash matches the character
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	253	itself, except as specified below. e.g., To match a literal
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	254	caret at the beginning of a string, write \bold{\\^}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	255	\row \i \bold{\\a}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	256	\i Matches the ASCII bell (BEL, 0x07).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	257	\row \i \bold{\\f}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	258	\i Matches the ASCII form feed (FF, 0x0C).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	259	\row \i \bold{\\n}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	260	\i Matches the ASCII line feed (LF, 0x0A, Unix newline).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	261	\row \i \bold{\\r}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	262	\i Matches the ASCII carriage return (CR, 0x0D).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	263	\row \i \bold{\\t}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	264	\i Matches the ASCII horizontal tab (HT, 0x09).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	265	\row \i \bold{\\v}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	266	\i Matches the ASCII vertical tab (VT, 0x0B).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	267	\row \i \bold{\\x\e{hhhh}}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	268	\i Matches the Unicode character corresponding to the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	269	hexadecimal number \e{hhhh} (between 0x0000 and 0xFFFF).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	270	\row \i \bold{\\0\e{ooo}} (i.e., \\zero \e{ooo})
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	271	\i matches the ASCII/Latin1 character for the octal number
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	272	\e{ooo} (between 0 and 0377).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	273	\row \i \bold{. (dot)}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	274	\i Matches any character (including newline).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	275	\row \i \bold{\\d}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	276	\i Matches a digit (QChar::isDigit()).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	277	\row \i \bold{\\D}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	278	\i Matches a non-digit.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	279	\row \i \bold{\\s}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	280	\i Matches a whitespace character (QChar::isSpace()).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	281	\row \i \bold{\\S}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	282	\i Matches a non-whitespace character.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	283	\row \i \bold{\\w}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	284	\i Matches a word character (QChar::isLetterOrNumber(), QChar::isMark(), or '_').
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	285	\row \i \bold{\\W}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	286	\i Matches a non-word character.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	287	\row \i \bold{\\\e{n}}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	288	\i The \e{n}-th \l backreference, e.g. \\1, \\2, etc.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	289	\endtable
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	290
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	291	\bold{Note:} The C++ compiler transforms backslashes in strings.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	292	To include a \bold{\\} in a regexp, enter it twice, i.e. \c{\\}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	293	To match the backslash character itself, enter it four times, i.e.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	294	\c{\\\\}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	295
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	296	\target sets-of-characters
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	297	\section1 Sets of Characters
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	298
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	299	Square brackets mean match any character contained in the square
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	300	brackets. The character set abbreviations described above can
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	301	appear in a character set in square brackets. Except for the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	302	character set abbreviations and the following two exceptions,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	303	characters do not have special meanings in square brackets.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	304
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	305	\table
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	306	\row \i \bold{^}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	307
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	308	\i The caret negates the character set if it occurs as the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	309	first character (i.e. immediately after the opening square
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	310	bracket). \bold{[abc]} matches 'a' or 'b' or 'c', but
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	311	\bold{[^abc]} matches anything \e but 'a' or 'b' or 'c'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	312
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	313	\row \i \bold{-}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	314
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	315	\i The dash indicates a range of characters. \bold{[W-Z]}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	316	matches 'W' or 'X' or 'Y' or 'Z'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	317
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	318	\endtable
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	319
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	320	Using the predefined character set abbreviations is more portable
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	321	than using character ranges across platforms and languages. For
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	322	example, \bold{[0-9]} matches a digit in Western alphabets but
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	323	\bold{\\d} matches a digit in \e any alphabet.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	324
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	325	Note: In other regexp documentation, sets of characters are often
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	326	called "character classes".
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	327
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	328	\target quantifiers
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	329	\section1 Quantifiers
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	330
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	331	By default, an expression is automatically quantified by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	332	\bold{{1,1}}, i.e. it should occur exactly once. In the following
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	333	list, \bold{\e {E}} stands for expression. An expression is a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	334	character, or an abbreviation for a set of characters, or a set of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	335	characters in square brackets, or an expression in parentheses.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	336
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	337	\table
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	338	\row \i \bold{\e {E}?}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	339
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	340	\i Matches zero or one occurrences of \e E. This quantifier
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	341	means \e{The previous expression is optional}, because it
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	342	will match whether or not the expression is found. \bold{\e
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	343	{E}?} is the same as \bold{\e {E}{0,1}}. e.g., \bold{dents?}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	344	matches 'dent' or 'dents'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	345
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	346	\row \i \bold{\e {E}+}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	347
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	348	\i Matches one or more occurrences of \e E. \bold{\e {E}+} is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	349	the same as \bold{\e {E}{1,}}. e.g., \bold{0+} matches '0',
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	350	'00', '000', etc.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	351
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	352	\row \i \bold{\e {E}*}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	353
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	354	\i Matches zero or more occurrences of \e E. It is the same
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	355	as \bold{\e {E}{0,}}. The \bold{*} quantifier is often used
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	356	in error where \bold{+} should be used. For example, if
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	357	\bold{\\s*$} is used in an expression to match strings that
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	358	end in whitespace, it will match every string because
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	359	\bold{\\s*$} means \e{Match zero or more whitespaces followed
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	360	by end of string}. The correct regexp to match strings that
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	361	have at least one trailing whitespace character is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	362	\bold{\\s+$}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	363
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	364	\row \i \bold{\e {E}{n}}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	365
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	366	\i Matches exactly \e n occurrences of \e E. \bold{\e {E}{n}}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	367	is the same as repeating \e E \e n times. For example,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	368	\bold{x{5}} is the same as \bold{xxxxx}. It is also the same
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	369	as \bold{\e {E}{n,n}}, e.g. \bold{x{5,5}}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	370
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	371	\row \i \bold{\e {E}{n,}}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	372	\i Matches at least \e n occurrences of \e E.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	373
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	374	\row \i \bold{\e {E}{,m}}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	375	\i Matches at most \e m occurrences of \e E. \bold{\e {E}{,m}}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	376	is the same as \bold{\e {E}{0,m}}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	377
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	378	\row \i \bold{\e {E}{n,m}}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	379	\i Matches at least \e n and at most \e m occurrences of \e E.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	380	\endtable
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	381
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	382	To apply a quantifier to more than just the preceding character,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	383	use parentheses to group characters together in an expression. For
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	384	example, \bold{tag+} matches a 't' followed by an 'a' followed by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	385	at least one 'g', whereas \bold{(tag)+} matches at least one
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	386	occurrence of 'tag'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	387
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	388	Note: Quantifiers are normally "greedy". They always match as much
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	389	text as they can. For example, \bold{0+} matches the first zero it
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	390	finds and all the consecutive zeros after the first zero. Applied
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	391	to '20005', it matches'2\underline{000}5'. Quantifiers can be made
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	392	non-greedy, see setMinimal().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	393
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	394	\target capturing parentheses
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	395	\target backreferences
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	396	\section1 Capturing Text
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	397
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	398	Parentheses allow us to group elements together so that we can
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	399	quantify and capture them. For example if we have the expression
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	400	\bold{mail\|letter\|correspondence} that matches a string we know
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	401	that \e one of the words matched but not which one. Using
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	402	parentheses allows us to "capture" whatever is matched within
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	403	their bounds, so if we used \bold{(mail\|letter\|correspondence)}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	404	and matched this regexp against the string "I sent you some email"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	405	we can use the cap() or capturedTexts() functions to extract the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	406	matched characters, in this case 'mail'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	407
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	408	We can use captured text within the regexp itself. To refer to the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	409	captured text we use \e backreferences which are indexed from 1,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	410	the same as for cap(). For example we could search for duplicate
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	411	words in a string using \bold{\\b(\\w+)\\W+\\1\\b} which means match a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	412	word boundary followed by one or more word characters followed by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	413	one or more non-word characters followed by the same text as the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	414	first parenthesized expression followed by a word boundary.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	415
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	416	If we want to use parentheses purely for grouping and not for
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	417	capturing we can use the non-capturing syntax, e.g.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	418	\bold{(?:green\|blue)}. Non-capturing parentheses begin '(?:' and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	419	end ')'. In this example we match either 'green' or 'blue' but we
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	420	do not capture the match so we only know whether or not we matched
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	421	but not which color we actually found. Using non-capturing
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	422	parentheses is more efficient than using capturing parentheses
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	423	since the regexp engine has to do less book-keeping.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	424
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	425	Both capturing and non-capturing parentheses may be nested.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	426
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	427	\target greedy quantifiers
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	428
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	429	For historical reasons, quantifiers (e.g. \bold{*}) that apply to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	430	capturing parentheses are more "greedy" than other quantifiers.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	431	For example, \bold{a(a)} will match "aaa" with cap(1) == "aaa".
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	432	This behavior is different from what other regexp engines do
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	433	(notably, Perl). To obtain a more intuitive capturing behavior,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	434	specify QRegExp::RegExp2 to the QRegExp constructor or call
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	435	setPatternSyntax(QRegExp::RegExp2).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	436
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	437	\target cap_in_a_loop
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	438
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	439	When the number of matches cannot be determined in advance, a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	440	common idiom is to use cap() in a loop. For example:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	441
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	442	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 0
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	443
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	444	\target assertions
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	445	\section1 Assertions
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	446
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	447	Assertions make some statement about the text at the point where
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	448	they occur in the regexp but they do not match any characters. In
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	449	the following list \bold{\e {E}} stands for any expression.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	450
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	451	\table
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	452	\row \i \bold{^}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	453	\i The caret signifies the beginning of the string. If you
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	454	wish to match a literal \c{^} you must escape it by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	455	writing \c{\\^}. For example, \bold{^#include} will only
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	456	match strings which \e begin with the characters '#include'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	457	(When the caret is the first character of a character set it
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	458	has a special meaning, see \link #sets-of-characters Sets of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	459	Characters \endlink.)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	460
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	461	\row \i \bold{$}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	462	\i The dollar signifies the end of the string. For example
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	463	\bold{\\d\\s*$} will match strings which end with a digit
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	464	optionally followed by whitespace. If you wish to match a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	465	literal \c{$} you must escape it by writing
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	466	\c{\\$}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	467
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	468	\row \i \bold{\\b}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	469	\i A word boundary. For example the regexp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	470	\bold{\\bOK\\b} means match immediately after a word
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	471	boundary (e.g. start of string or whitespace) the letter 'O'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	472	then the letter 'K' immediately before another word boundary
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	473	(e.g. end of string or whitespace). But note that the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	474	assertion does not actually match any whitespace so if we
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	475	write \bold{(\\bOK\\b)} and we have a match it will only
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	476	contain 'OK' even if the string is "It's \underline{OK} now".
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	477
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	478	\row \i \bold{\\B}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	479	\i A non-word boundary. This assertion is true wherever
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	480	\bold{\\b} is false. For example if we searched for
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	481	\bold{\\Bon\\B} in "Left on" the match would fail (space
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	482	and end of string aren't non-word boundaries), but it would
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	483	match in "t\underline{on}ne".
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	484
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	485	\row \i \bold{(?=\e E)}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	486	\i Positive lookahead. This assertion is true if the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	487	expression matches at this point in the regexp. For example,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	488	\bold{const(?=\\s+char)} matches 'const' whenever it is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	489	followed by 'char', as in 'static \underline{const} char *'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	490	(Compare with \bold{const\\s+char}, which matches 'static
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	491	\underline{const char} *'.)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	492
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	493	\row \i \bold{(?!\e E)}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	494	\i Negative lookahead. This assertion is true if the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	495	expression does not match at this point in the regexp. For
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	496	example, \bold{const(?!\\s+char)} matches 'const' \e except
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	497	when it is followed by 'char'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	498	\endtable
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	499
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	500	\keyword QRegExp wildcard matching
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	501	\section1 Wildcard Matching
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	502
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	503	Most command shells such as \e bash or \e cmd.exe support "file
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	504	globbing", the ability to identify a group of files by using
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	505	wildcards. The setPatternSyntax() function is used to switch
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	506	between regexp and wildcard mode. Wildcard matching is much
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	507	simpler than full regexps and has only four features:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	508
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	509	\table
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	510	\row \i \bold{c}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	511	\i Any character represents itself apart from those mentioned
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	512	below. Thus \bold{c} matches the character \e c.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	513	\row \i \bold{?}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	514	\i Matches any single character. It is the same as
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	515	\bold{.} in full regexps.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	516	\row \i \bold{*}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	517	\i Matches zero or more of any characters. It is the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	518	same as \bold{.*} in full regexps.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	519	\row \i \bold{[...]}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	520	\i Sets of characters can be represented in square brackets,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	521	similar to full regexps. Within the character class, like
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	522	outside, backslash has no special meaning.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	523	\endtable
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	524
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	525	In the mode Wildcard, the wildcard characters cannot be
7 3f74d0d4af4c qt:70947f0f93d948bc89b3b43d00da758a51f1ef84 Eckhart Koeppen <eckhart.koppen@nokia.com> parents: 4 diff changeset	526	escaped. In the mode WildcardUnix, the character '\\' escapes the
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	527	wildcard.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	528
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	529	For example if we are in wildcard mode and have strings which
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	530	contain filenames we could identify HTML files with \bold{*.html}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	531	This will match zero or more characters followed by a dot followed
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	532	by 'h', 't', 'm' and 'l'.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	533
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	534	To test a string against a wildcard expression, use exactMatch().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	535	For example:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	536
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	537	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 1
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	538
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	539	\target perl-users
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	540	\section1 Notes for Perl Users
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	541
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	542	Most of the character class abbreviations supported by Perl are
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	543	supported by QRegExp, see \link
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	544	#characters-and-abbreviations-for-sets-of-characters characters
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	545	and abbreviations for sets of characters \endlink.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	546
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	547	In QRegExp, apart from within character classes, \c{^} always
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	548	signifies the start of the string, so carets must always be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	549	escaped unless used for that purpose. In Perl the meaning of caret
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	550	varies automagically depending on where it occurs so escaping it
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	551	is rarely necessary. The same applies to \c{$} which in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	552	QRegExp always signifies the end of the string.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	553
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	554	QRegExp's quantifiers are the same as Perl's greedy quantifiers
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	555	(but see the \l{greedy quantifiers}{note above}). Non-greedy
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	556	matching cannot be applied to individual quantifiers, but can be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	557	applied to all the quantifiers in the pattern. For example, to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	558	match the Perl regexp \bold{ro+?m} requires:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	559
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	560	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 2
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	561
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	562	The equivalent of Perl's \c{/i} option is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	563	setCaseSensitivity(Qt::CaseInsensitive).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	564
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	565	Perl's \c{/g} option can be emulated using a \l{#cap_in_a_loop}{loop}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	566
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	567	In QRegExp \bold{.} matches any character, therefore all QRegExp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	568	regexps have the equivalent of Perl's \c{/s} option. QRegExp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	569	does not have an equivalent to Perl's \c{/m} option, but this
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	570	can be emulated in various ways for example by splitting the input
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	571	into lines or by looping with a regexp that searches for newlines.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	572
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	573	Because QRegExp is string oriented, there are no \\A, \\Z, or \\z
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	574	assertions. The \\G assertion is not supported but can be emulated
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	575	in a loop.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	576
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	577	Perl's $& is cap(0) or capturedTexts()[0]. There are no QRegExp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	578	equivalents for $`, $' or $+. Perl's capturing variables, $1, $2,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	579	... correspond to cap(1) or capturedTexts()[1], cap(2) or
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	580	capturedTexts()[2], etc.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	581
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	582	To substitute a pattern use QString::replace().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	583
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	584	Perl's extended \c{/x} syntax is not supported, nor are
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	585	directives, e.g. (?i), or regexp comments, e.g. (?#comment). On
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	586	the other hand, C++'s rules for literal strings can be used to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	587	achieve the same:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	588
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	589	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 3
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	590
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	591	Both zero-width positive and zero-width negative lookahead
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	592	assertions (?=pattern) and (?!pattern) are supported with the same
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	593	syntax as Perl. Perl's lookbehind assertions, "independent"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	594	subexpressions and conditional expressions are not supported.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	595
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	596	Non-capturing parentheses are also supported, with the same
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	597	(?:pattern) syntax.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	598
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	599	See QString::split() and QStringList::join() for equivalents
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	600	to Perl's split and join functions.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	601
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	602	Note: because C++ transforms \\'s they must be written \e twice in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	603	code, e.g. \bold{\\b} must be written \bold{\\\\b}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	604
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	605	\target code-examples
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	606	\section1 Code Examples
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	607
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	608	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 4
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	609
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	610	The third string matches '\underline{6}'. This is a simple validation
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	611	regexp for integers in the range 0 to 99.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	612
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	613	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 5
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	614
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	615	The second string matches '\underline{This_is-OK}'. We've used the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	616	character set abbreviation '\\S' (non-whitespace) and the anchors
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	617	to match strings which contain no whitespace.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	618
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	619	In the following example we match strings containing 'mail' or
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	620	'letter' or 'correspondence' but only match whole words i.e. not
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	621	'email'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	622
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	623	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 6
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	624
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	625	The second string matches "Please write the \underline{letter}". The
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	626	word 'letter' is also captured (because of the parentheses). We
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	627	can see what text we've captured like this:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	628
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	629	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 7
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	630
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	631	This will capture the text from the first set of capturing
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	632	parentheses (counting capturing left parentheses from left to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	633	right). The parentheses are counted from 1 since cap(0) is the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	634	whole matched regexp (equivalent to '&' in most regexp engines).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	635
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	636	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 8
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	637
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	638	Here we've passed the QRegExp to QString's replace() function to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	639	replace the matched text with new text.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	640
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	641	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 9
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	642
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	643	We've used the indexIn() function to repeatedly match the regexp in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	644	the string. Note that instead of moving forward by one character
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	645	at a time \c pos++ we could have written \c {pos +=
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	646	rx.matchedLength()} to skip over the already matched string. The
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	647	count will equal 3, matching 'One \underline{Eric} another
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	648	\underline{Eirik}, and an Ericsson. How many Eiriks, \underline{Eric}?'; it
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	649	doesn't match 'Ericsson' or 'Eiriks' because they are not bounded
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	650	by non-word boundaries.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	651
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	652	One common use of regexps is to split lines of delimited data into
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	653	their component fields.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	654
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	655	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 10
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	656
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	657	In this example our input lines have the format company name, web
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	658	address and country. Unfortunately the regexp is rather long and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	659	not very versatile -- the code will break if we add any more
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	660	fields. A simpler and better solution is to look for the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	661	separator, '\\t' in this case, and take the surrounding text. The
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	662	QString::split() function can take a separator string or regexp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	663	as an argument and split a string accordingly.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	664
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	665	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 11
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	666
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	667	Here field[0] is the company, field[1] the web address and so on.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	668
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	669	To imitate the matching of a shell we can use wildcard mode.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	670
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	671	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 12
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	672
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	673	Wildcard matching can be convenient because of its simplicity, but
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	674	any wildcard regexp can be defined using full regexps, e.g.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	675	\bold{.*\.html$}. Notice that we can't match both \c .html and \c
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	676	.htm files with a wildcard unless we use \bold{.htm} which will
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	677	also match 'test.html.bak'. A full regexp gives us the precision
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	678	we need, \bold{.*\\.html?$}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	679
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	680	QRegExp can match case insensitively using setCaseSensitivity(),
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	681	and can use non-greedy matching, see setMinimal(). By
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	682	default QRegExp uses full regexps but this can be changed with
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	683	setWildcard(). Searching can be forward with indexIn() or backward
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	684	with lastIndexIn(). Captured text can be accessed using
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	685	capturedTexts() which returns a string list of all captured
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	686	strings, or using cap() which returns the captured string for the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	687	given index. The pos() function takes a match index and returns
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	688	the position in the string where the match was made (or -1 if
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	689	there was no match).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	690
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	691	\sa QString, QStringList, QRegExpValidator, QSortFilterProxyModel,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	692	{tools/regexp}{Regular Expression Example}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	693	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	694
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	695	#if defined(Q_OS_VXWORKS) && defined(EOS)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	696	# undef EOS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	697	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	698
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	699	const int NumBadChars = 64;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	700	#define BadChar(ch) ((ch).unicode() % NumBadChars)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	701
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	702	const int NoOccurrence = INT_MAX;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	703	const int EmptyCapture = INT_MAX;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	704	const int InftyLen = INT_MAX;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	705	const int InftyRep = 1025;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	706	const int EOS = -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	707
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	708	static bool isWord(QChar ch)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	709	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	710	return ch.isLetterOrNumber() \|\| ch.isMark() \|\| ch == QLatin1Char('_');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	711	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	712
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	713	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	714	Merges two vectors of ints and puts the result into the first
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	715	one.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	716	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	717	static void mergeInto(QVector<int> *a, const QVector<int> &b)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	718	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	719	int asize = a->size();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	720	int bsize = b.size();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	721	if (asize == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	722	*a = b;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	723	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	724	} else if (bsize == 1 && a->at(asize - 1) < b.at(0)) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	725	a->resize(asize + 1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	726	(*a)[asize] = b.at(0);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	727	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	728	} else if (bsize >= 1) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	729	int csize = asize + bsize;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	730	QVector<int> c(csize);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	731	int i = 0, j = 0, k = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	732	while (i < asize) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	733	if (j < bsize) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	734	if (a->at(i) == b.at(j)) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	735	++i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	736	--csize;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	737	} else if (a->at(i) < b.at(j)) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	738	c[k++] = a->at(i++);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	739	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	740	c[k++] = b.at(j++);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	741	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	742	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	743	memcpy(c.data() + k, a->constData() + i, (asize - i) * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	744	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	745	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	746	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	747	c.resize(csize);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	748	if (j < bsize)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	749	memcpy(c.data() + k, b.constData() + j, (bsize - j) * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	750	*a = c;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	751	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	752	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	753
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	754	#ifndef QT_NO_REGEXP_WILDCARD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	755	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	756	Translates a wildcard pattern to an equivalent regular expression
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	757	pattern (e.g., .cpp to .\.cpp).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	758
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	759	If enableEscaping is true, it is possible to escape the wildcard
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	760	characters with \
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	761	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	762	static QString wc2rx(const QString &wc_str, const bool enableEscaping)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	763	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	764	const int wclen = wc_str.length();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	765	QString rx;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	766	int i = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	767	bool isEscaping = false; // the previous character is '\'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	768	const QChar *wc = wc_str.unicode();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	769
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	770	while (i < wclen) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	771	const QChar c = wc[i++];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	772	switch (c.unicode()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	773	case '\\':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	774	if (enableEscaping) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	775	if (isEscaping) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	776	rx += QLatin1String("\\\\");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	777	} // we insert the \\ later if necessary
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	778	if (i+1 == wclen) { // the end
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	779	rx += QLatin1String("\\\\");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	780	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	781	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	782	rx += QLatin1String("\\\\");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	783	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	784	isEscaping = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	785	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	786	case '*':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	787	if (isEscaping) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	788	rx += QLatin1String("\\*");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	789	isEscaping = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	790	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	791	rx += QLatin1String(".*");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	792	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	793	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	794	case '?':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	795	if (isEscaping) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	796	rx += QLatin1String("\\?");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	797	isEscaping = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	798	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	799	rx += QLatin1Char('.');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	800	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	801
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	802	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	803	case '$':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	804	case '(':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	805	case ')':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	806	case '+':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	807	case '.':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	808	case '^':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	809	case '{':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	810	case '\|':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	811	case '}':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	812	if (isEscaping) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	813	isEscaping = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	814	rx += QLatin1String("\\\\");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	815	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	816	rx += QLatin1Char('\\');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	817	rx += c;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	818	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	819	case '[':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	820	if (isEscaping) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	821	isEscaping = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	822	rx += QLatin1String("\\[");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	823	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	824	rx += c;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	825	if (wc[i] == QLatin1Char('^'))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	826	rx += wc[i++];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	827	if (i < wclen) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	828	if (rx[i] == QLatin1Char(']'))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	829	rx += wc[i++];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	830	while (i < wclen && wc[i] != QLatin1Char(']')) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	831	if (wc[i] == QLatin1Char('\\'))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	832	rx += QLatin1Char('\\');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	833	rx += wc[i++];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	834	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	835	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	836	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	837	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	838
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	839	case ']':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	840	if(isEscaping){
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	841	isEscaping = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	842	rx += QLatin1String("\\");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	843	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	844	rx += c;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	845	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	846
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	847	default:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	848	if(isEscaping){
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	849	isEscaping = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	850	rx += QLatin1String("\\\\");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	851	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	852	rx += c;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	853	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	854	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	855	return rx;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	856	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	857	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	858
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	859	static int caretIndex(int offset, QRegExp::CaretMode caretMode)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	860	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	861	if (caretMode == QRegExp::CaretAtZero) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	862	return 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	863	} else if (caretMode == QRegExp::CaretAtOffset) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	864	return offset;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	865	} else { // QRegExp::CaretWontMatch
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	866	return -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	867	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	868	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	869
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	870	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	871	The QRegExpEngineKey struct uniquely identifies an engine.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	872	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	873	struct QRegExpEngineKey
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	874	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	875	QString pattern;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	876	QRegExp::PatternSyntax patternSyntax;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	877	Qt::CaseSensitivity cs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	878
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	879	inline QRegExpEngineKey(const QString &pattern, QRegExp::PatternSyntax patternSyntax,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	880	Qt::CaseSensitivity cs)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	881	: pattern(pattern), patternSyntax(patternSyntax), cs(cs) {}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	882
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	883	inline void clear() {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	884	pattern.clear();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	885	patternSyntax = QRegExp::RegExp;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	886	cs = Qt::CaseSensitive;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	887	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	888	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	889
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	890	Q_STATIC_GLOBAL_OPERATOR bool operator==(const QRegExpEngineKey &key1, const QRegExpEngineKey &key2)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	891	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	892	return key1.pattern == key2.pattern && key1.patternSyntax == key2.patternSyntax
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	893	&& key1.cs == key2.cs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	894	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	895
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	896	class QRegExpEngine;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	897
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	898	//Q_DECLARE_TYPEINFO(QVector<int>, Q_MOVABLE_TYPE);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	899
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	900	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	901	This is the engine state during matching.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	902	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	903	struct QRegExpMatchState
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	904	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	905	const QChar *in; // a pointer to the input string data
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	906	int pos; // the current position in the string
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	907	int caretPos;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	908	int len; // the length of the input string
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	909	bool minimal; // minimal matching?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	910	int *bigArray; // big array holding the data for the next pointers
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	911	int *inNextStack; // is state is nextStack?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	912	int *curStack; // stack of current states
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	913	int *nextStack; // stack of next states
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	914	int *curCapBegin; // start of current states' captures
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	915	int *nextCapBegin; // start of next states' captures
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	916	int *curCapEnd; // end of current states' captures
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	917	int *nextCapEnd; // end of next states' captures
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	918	int *tempCapBegin; // start of temporary captures
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	919	int *tempCapEnd; // end of temporary captures
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	920	int *capBegin; // start of captures for a next state
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	921	int *capEnd; // end of captures for a next state
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	922	int *slideTab; // bump-along slide table for bad-character heuristic
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	923	int *captured; // what match() returned last
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	924	int slideTabSize; // size of slide table
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	925	int capturedSize;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	926	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	927	QList<QVector<int> > sleeping; // list of back-reference sleepers
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	928	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	929	int matchLen; // length of match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	930	int oneTestMatchedLen; // length of partial match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	931
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	932	const QRegExpEngine *eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	933
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	934	inline QRegExpMatchState() : bigArray(0), captured(0) {}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	935	inline ~QRegExpMatchState() { free(bigArray); }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	936
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	937	void drain() { free(bigArray); bigArray = 0; captured = 0; } // to save memory
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	938	void prepareForMatch(QRegExpEngine *eng);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	939	void match(const QChar *str, int len, int pos, bool minimal,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	940	bool oneTest, int caretIndex);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	941	bool matchHere();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	942	bool testAnchor(int i, int a, const int *capBegin);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	943	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	944
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	945	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	946	The struct QRegExpAutomatonState represents one state in a modified NFA. The
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	947	input characters matched are stored in the state instead of on
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	948	the transitions, something possible for an automaton
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	949	constructed from a regular expression.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	950	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	951	struct QRegExpAutomatonState
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	952	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	953	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	954	int atom; // which atom does this state belong to?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	955	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	956	int match; // what does it match? (see CharClassBit and BackRefBit)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	957	QVector<int> outs; // out-transitions
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	958	QMap<int, int> reenter; // atoms reentered when transiting out
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	959	QMap<int, int> anchors; // anchors met when transiting out
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	960
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	961	inline QRegExpAutomatonState() { }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	962	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	963	inline QRegExpAutomatonState(int a, int m)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	964	: atom(a), match(m) { }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	965	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	966	inline QRegExpAutomatonState(int m)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	967	: match(m) { }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	968	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	969	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	970
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	971	Q_DECLARE_TYPEINFO(QRegExpAutomatonState, Q_MOVABLE_TYPE);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	972
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	973	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	974	The struct QRegExpCharClassRange represents a range of characters (e.g.,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	975	[0-9] denotes range 48 to 57).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	976	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	977	struct QRegExpCharClassRange
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	978	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	979	ushort from; // 48
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	980	ushort len; // 10
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	981	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	982
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	983	Q_DECLARE_TYPEINFO(QRegExpCharClassRange, Q_PRIMITIVE_TYPE);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	984
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	985	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	986	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	987	The struct QRegExpAtom represents one node in the hierarchy of regular
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	988	expression atoms.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	989	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	990	struct QRegExpAtom
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	991	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	992	enum { NoCapture = -1, OfficialCapture = -2, UnofficialCapture = -3 };
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	993
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	994	int parent; // index of parent in array of atoms
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	995	int capture; // index of capture, from 1 to ncap - 1
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	996	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	997
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	998	Q_DECLARE_TYPEINFO(QRegExpAtom, Q_PRIMITIVE_TYPE);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	999	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1000
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1001	struct QRegExpLookahead;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1002
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1003	#ifndef QT_NO_REGEXP_ANCHOR_ALT
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1004	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1005	The struct QRegExpAnchorAlternation represents a pair of anchors with
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1006	OR semantics.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1007	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1008	struct QRegExpAnchorAlternation
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1009	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1010	int a; // this anchor...
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1011	int b; // ...or this one
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1012	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1013
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1014	Q_DECLARE_TYPEINFO(QRegExpAnchorAlternation, Q_PRIMITIVE_TYPE);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1015	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1016
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1017	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1018	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1019	The class QRegExpCharClass represents a set of characters, such as can
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1020	be found in regular expressions (e.g., [a-z] denotes the set
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1021	{a, b, ..., z}).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1022	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1023	class QRegExpCharClass
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1024	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1025	public:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1026	QRegExpCharClass();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1027	inline QRegExpCharClass(const QRegExpCharClass &cc) { operator=(cc); }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1028
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1029	QRegExpCharClass &operator=(const QRegExpCharClass &cc);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1030
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1031	void clear();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1032	bool negative() const { return n; }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1033	void setNegative(bool negative);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1034	void addCategories(int cats);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1035	void addRange(ushort from, ushort to);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1036	void addSingleton(ushort ch) { addRange(ch, ch); }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1037
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1038	bool in(QChar ch) const;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1039	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1040	const QVector<int> &firstOccurrence() const { return occ1; }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1041	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1042
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1043	#if defined(QT_DEBUG)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1044	void dump() const;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1045	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1046
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1047	private:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1048	int c; // character classes
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1049	QVector<QRegExpCharClassRange> r; // character ranges
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1050	bool n; // negative?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1051	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1052	QVector<int> occ1; // first-occurrence array
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1053	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1054	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1055	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1056	struct QRegExpCharClass
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1057	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1058	int dummy;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1059
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1060	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1061	QRegExpCharClass() { occ1.fill(0, NumBadChars); }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1062
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1063	const QVector<int> &firstOccurrence() const { return occ1; }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1064	QVector<int> occ1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1065	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1066	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1067	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1068
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1069	Q_DECLARE_TYPEINFO(QRegExpCharClass, Q_MOVABLE_TYPE);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1070
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1071	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1072	The QRegExpEngine class encapsulates a modified nondeterministic
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1073	finite automaton (NFA).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1074	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1075	class QRegExpEngine
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1076	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1077	public:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1078	QRegExpEngine(Qt::CaseSensitivity cs, bool greedyQuantifiers)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1079	: cs(cs), greedyQuantifiers(greedyQuantifiers) { setup(); }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1080
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1081	QRegExpEngine(const QRegExpEngineKey &key);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1082	~QRegExpEngine();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1083
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1084	bool isValid() const { return valid; }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1085	const QString &errorString() const { return yyError; }
3 41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	1086	int captureCount() const { return officialncap; }
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1087
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1088	int createState(QChar ch);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1089	int createState(const QRegExpCharClass &cc);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1090	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1091	int createState(int bref);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1092	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1093
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1094	void addCatTransitions(const QVector<int> &from, const QVector<int> &to);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1095	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1096	void addPlusTransitions(const QVector<int> &from, const QVector<int> &to, int atom);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1097	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1098
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1099	#ifndef QT_NO_REGEXP_ANCHOR_ALT
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1100	int anchorAlternation(int a, int b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1101	int anchorConcatenation(int a, int b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1102	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1103	int anchorAlternation(int a, int b) { return a & b; }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1104	int anchorConcatenation(int a, int b) { return a \| b; }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1105	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1106	void addAnchors(int from, int to, int a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1107
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1108	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1109	void heuristicallyChooseHeuristic();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1110	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1111
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1112	#if defined(QT_DEBUG)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1113	void dump() const;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1114	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1115
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1116	QAtomicInt ref;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1117
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1118	private:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1119	enum { CharClassBit = 0x10000, BackRefBit = 0x20000 };
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1120	enum { InitialState = 0, FinalState = 1 };
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1121
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1122	void setup();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1123	int setupState(int match);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1124
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1125	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1126	Let's hope that 13 lookaheads and 14 back-references are
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1127	enough.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1128	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1129	enum { MaxLookaheads = 13, MaxBackRefs = 14 };
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1130	enum { Anchor_Dollar = 0x00000001, Anchor_Caret = 0x00000002, Anchor_Word = 0x00000004,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1131	Anchor_NonWord = 0x00000008, Anchor_FirstLookahead = 0x00000010,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1132	Anchor_BackRef1Empty = Anchor_FirstLookahead << MaxLookaheads,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1133	Anchor_BackRef0Empty = Anchor_BackRef1Empty >> 1,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1134	Anchor_Alternation = unsigned(Anchor_BackRef1Empty) << MaxBackRefs,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1135
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1136	Anchor_LookaheadMask = (Anchor_FirstLookahead - 1) ^
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1137	((Anchor_FirstLookahead << MaxLookaheads) - 1) };
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1138	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1139	int startAtom(bool officialCapture);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1140	void finishAtom(int atom, bool needCapture);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1141	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1142
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1143	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1144	int addLookahead(QRegExpEngine *eng, bool negative);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1145	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1146
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1147	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1148	bool goodStringMatch(QRegExpMatchState &matchState) const;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1149	bool badCharMatch(QRegExpMatchState &matchState) const;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1150	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1151	bool bruteMatch(QRegExpMatchState &matchState) const;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1152	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1153
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1154	QVector<QRegExpAutomatonState> s; // array of states
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1155	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1156	QVector<QRegExpAtom> f; // atom hierarchy
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1157	int nf; // number of atoms
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1158	int cf; // current atom
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1159	QVector<int> captureForOfficialCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1160	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1161	int officialncap; // number of captures, seen from the outside
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1162	int ncap; // number of captures, seen from the inside
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1163	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1164	QVector<QRegExpCharClass> cl; // array of character classes
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1165	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1166	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1167	QVector<QRegExpLookahead *> ahead; // array of lookaheads
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1168	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1169	#ifndef QT_NO_REGEXP_ANCHOR_ALT
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1170	QVector<QRegExpAnchorAlternation> aa; // array of (a, b) pairs of anchors
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1171	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1172	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1173	bool caretAnchored; // does the regexp start with ^?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1174	bool trivial; // is the good-string all that needs to match?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1175	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1176	bool valid; // is the regular expression valid?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1177	Qt::CaseSensitivity cs; // case sensitive?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1178	bool greedyQuantifiers; // RegExp2?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1179	bool xmlSchemaExtensions;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1180	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1181	int nbrefs; // number of back-references
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1182	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1183
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1184	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1185	bool useGoodStringHeuristic; // use goodStringMatch? otherwise badCharMatch
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1186
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1187	int goodEarlyStart; // the index where goodStr can first occur in a match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1188	int goodLateStart; // the index where goodStr can last occur in a match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1189	QString goodStr; // the string that any match has to contain
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1190
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1191	int minl; // the minimum length of a match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1192	QVector<int> occ1; // first-occurrence array
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1193	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1194
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1195	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1196	The class Box is an abstraction for a regular expression
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1197	fragment. It can also be seen as one node in the syntax tree of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1198	a regular expression with synthetized attributes.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1199
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1200	Its interface is ugly for performance reasons.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1201	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1202	class Box
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1203	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1204	public:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1205	Box(QRegExpEngine *engine);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1206	Box(const Box &b) { operator=(b); }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1207
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1208	Box &operator=(const Box &b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1209
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1210	void clear() { operator=(Box(eng)); }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1211	void set(QChar ch);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1212	void set(const QRegExpCharClass &cc);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1213	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1214	void set(int bref);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1215	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1216
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1217	void cat(const Box &b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1218	void orx(const Box &b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1219	void plus(int atom);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1220	void opt();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1221	void catAnchor(int a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1222	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1223	void setupHeuristics();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1224	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1225
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1226	#if defined(QT_DEBUG)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1227	void dump() const;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1228	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1229
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1230	private:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1231	void addAnchorsToEngine(const Box &to) const;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1232
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1233	QRegExpEngine *eng; // the automaton under construction
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1234	QVector<int> ls; // the left states (firstpos)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1235	QVector<int> rs; // the right states (lastpos)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1236	QMap<int, int> lanchors; // the left anchors
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1237	QMap<int, int> ranchors; // the right anchors
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1238	int skipanchors; // the anchors to match if the box is skipped
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1239
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1240	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1241	int earlyStart; // the index where str can first occur
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1242	int lateStart; // the index where str can last occur
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1243	QString str; // a string that has to occur in any match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1244	QString leftStr; // a string occurring at the left of this box
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1245	QString rightStr; // a string occurring at the right of this box
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1246	int maxl; // the maximum length of this box (possibly InftyLen)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1247	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1248
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1249	int minl; // the minimum length of this box
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1250	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1251	QVector<int> occ1; // first-occurrence array
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1252	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1253	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1254
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1255	friend class Box;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1256
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1257	void setupCategoriesRangeMap();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1258
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1259	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1260	This is the lexical analyzer for regular expressions.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1261	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1262	enum { Tok_Eos, Tok_Dollar, Tok_LeftParen, Tok_MagicLeftParen, Tok_PosLookahead,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1263	Tok_NegLookahead, Tok_RightParen, Tok_CharClass, Tok_Caret, Tok_Quantifier, Tok_Bar,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1264	Tok_Word, Tok_NonWord, Tok_Char = 0x10000, Tok_BackRef = 0x20000 };
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1265	int getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1266	int getEscape();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1267	#ifndef QT_NO_REGEXP_INTERVAL
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1268	int getRep(int def);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1269	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1270	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1271	void skipChars(int n);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1272	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1273	void error(const char *msg);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1274	void startTokenizer(const QChar *rx, int len);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1275	int getToken();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1276
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1277	const QChar *yyIn; // a pointer to the input regular expression pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1278	int yyPos0; // the position of yyTok in the input pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1279	int yyPos; // the position of the next character to read
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1280	int yyLen; // the length of yyIn
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1281	int yyCh; // the last character read
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1282	QScopedPointer<QRegExpCharClass> yyCharClass; // attribute for Tok_CharClass tokens
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1283	int yyMinRep; // attribute for Tok_Quantifier
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1284	int yyMaxRep; // ditto
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1285	QString yyError; // syntax error or overflow during parsing?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1286
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1287	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1288	This is the syntactic analyzer for regular expressions.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1289	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1290	int parse(const QChar *rx, int len);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1291	void parseAtom(Box *box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1292	void parseFactor(Box *box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1293	void parseTerm(Box *box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1294	void parseExpression(Box *box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1295
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1296	int yyTok; // the last token read
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1297	bool yyMayCapture; // set this to false to disable capturing
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1298	QHash<QByteArray, QPair<int, int> > categoriesRangeMap; // fast lookup hash for xml schema extensions
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1299
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1300	friend struct QRegExpMatchState;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1301	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1302
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1303	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1304	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1305	The struct QRegExpLookahead represents a lookahead a la Perl (e.g.,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1306	(?=foo) and (?!bar)).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1307	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1308	struct QRegExpLookahead
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1309	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1310	QRegExpEngine *eng; // NFA representing the embedded regular expression
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1311	bool neg; // negative lookahead?
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1312
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1313	inline QRegExpLookahead(QRegExpEngine *eng0, bool neg0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1314	: eng(eng0), neg(neg0) { }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1315	inline ~QRegExpLookahead() { delete eng; }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1316	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1317	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1318
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1319	/*! \internal
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1320	convert the pattern string to the RegExp syntax.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1321
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1322	This is also used by QScriptEngine::newRegExp to convert to a pattern that JavaScriptCore can understan
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1323	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1324	Q_CORE_EXPORT QString qt_regexp_toCanonical(const QString &pattern, QRegExp::PatternSyntax patternSyntax)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1325	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1326	switch (patternSyntax) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1327	#ifndef QT_NO_REGEXP_WILDCARD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1328	case QRegExp::Wildcard:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1329	return wc2rx(pattern, false);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1330	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1331	case QRegExp::WildcardUnix:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1332	return wc2rx(pattern, true);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1333	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1334	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1335	case QRegExp::FixedString:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1336	return QRegExp::escape(pattern);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1337	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1338	case QRegExp::W3CXmlSchema11:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1339	default:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1340	return pattern;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1341	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1342	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1343
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1344	QRegExpEngine::QRegExpEngine(const QRegExpEngineKey &key)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1345	: cs(key.cs), greedyQuantifiers(key.patternSyntax == QRegExp::RegExp2),
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1346	xmlSchemaExtensions(key.patternSyntax == QRegExp::W3CXmlSchema11)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1347	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1348	setup();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1349
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1350	QString rx = qt_regexp_toCanonical(key.pattern, key.patternSyntax);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1351
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1352	valid = (parse(rx.unicode(), rx.length()) == rx.length());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1353	if (!valid) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1354	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1355	trivial = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1356	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1357	error(RXERR_LEFTDELIM);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1358	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1359	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1360
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1361	QRegExpEngine::~QRegExpEngine()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1362	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1363	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1364	qDeleteAll(ahead);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1365	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1366	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1367
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1368	void QRegExpMatchState::prepareForMatch(QRegExpEngine *eng)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1369	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1370	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1371	We use one QVector<int> for all the big data used a lot in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1372	matchHere() and friends.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1373	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1374	int ns = eng->s.size(); // number of states
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1375	int ncap = eng->ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1376	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1377	int newSlideTabSize = qMax(eng->minl + 1, 16);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1378	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1379	int newSlideTabSize = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1380	#endif
3 41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	1381	int numCaptures = eng->captureCount();
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1382	int newCapturedSize = 2 + 2 * numCaptures;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1383	bigArray = q_check_ptr((int )realloc(bigArray, ((3 + 4 ncap) * ns + 4 * ncap + newSlideTabSize + newCapturedSize)*sizeof(int)));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1384
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1385	// set all internal variables only _after_ bigArray is realloc'ed
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1386	// to prevent a broken regexp in oom case
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1387
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1388	slideTabSize = newSlideTabSize;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1389	capturedSize = newCapturedSize;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1390	inNextStack = bigArray;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1391	memset(inNextStack, -1, ns * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1392	curStack = inNextStack + ns;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1393	nextStack = inNextStack + 2 * ns;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1394
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1395	curCapBegin = inNextStack + 3 * ns;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1396	nextCapBegin = curCapBegin + ncap * ns;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1397	curCapEnd = curCapBegin + 2 * ncap * ns;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1398	nextCapEnd = curCapBegin + 3 * ncap * ns;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1399
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1400	tempCapBegin = curCapBegin + 4 * ncap * ns;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1401	tempCapEnd = tempCapBegin + ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1402	capBegin = tempCapBegin + 2 * ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1403	capEnd = tempCapBegin + 3 * ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1404
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1405	slideTab = tempCapBegin + 4 * ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1406	captured = slideTab + slideTabSize;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1407	memset(captured, -1, capturedSize*sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1408	this->eng = eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1409	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1410
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1411	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1412	Tries to match in str and returns an array of (begin, length) pairs
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1413	for captured text. If there is no match, all pairs are (-1, -1).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1414	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1415	void QRegExpMatchState::match(const QChar *str0, int len0, int pos0,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1416	bool minimal0, bool oneTest, int caretIndex)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1417	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1418	bool matched = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1419	QChar char_null;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1420
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1421	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1422	if (eng->trivial && !oneTest) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1423	pos = qFindString(str0, len0, pos0, eng->goodStr.unicode(), eng->goodStr.length(), eng->cs);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1424	matchLen = eng->goodStr.length();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1425	matched = (pos != -1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1426	} else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1427	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1428	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1429	in = str0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1430	if (in == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1431	in = &char_null;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1432	pos = pos0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1433	caretPos = caretIndex;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1434	len = len0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1435	minimal = minimal0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1436	matchLen = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1437	oneTestMatchedLen = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1438
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1439	if (eng->valid && pos >= 0 && pos <= len) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1440	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1441	if (oneTest) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1442	matched = matchHere();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1443	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1444	if (pos <= len - eng->minl) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1445	if (eng->caretAnchored) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1446	matched = matchHere();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1447	} else if (eng->useGoodStringHeuristic) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1448	matched = eng->goodStringMatch(*this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1449	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1450	matched = eng->badCharMatch(*this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1451	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1452	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1453	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1454	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1455	matched = oneTest ? matchHere() : eng->bruteMatch(*this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1456	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1457	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1458	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1459
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1460	if (matched) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1461	int *c = captured;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1462	*c++ = pos;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1463	*c++ = matchLen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1464
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1465	int numCaptures = (capturedSize - 2) >> 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1466	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1467	for (int i = 0; i < numCaptures; ++i) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1468	int j = eng->captureForOfficialCapture.at(i);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1469	int len = capEnd[j] - capBegin[j];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1470	*c++ = (len > 0) ? pos + capBegin[j] : 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1471	*c++ = len;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1472	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1473	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1474	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1475	// we rely on 2's complement here
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1476	memset(captured, -1, capturedSize * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1477	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1478	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1479
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1480	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1481	The three following functions add one state to the automaton and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1482	return the number of the state.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1483	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1484
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1485	int QRegExpEngine::createState(QChar ch)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1486	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1487	return setupState(ch.unicode());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1488	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1489
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1490	int QRegExpEngine::createState(const QRegExpCharClass &cc)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1491	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1492	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1493	int n = cl.size();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1494	cl += QRegExpCharClass(cc);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1495	return setupState(CharClassBit \| n);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1496	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1497	Q_UNUSED(cc);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1498	return setupState(CharClassBit);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1499	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1500	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1501
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1502	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1503	int QRegExpEngine::createState(int bref)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1504	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1505	if (bref > nbrefs) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1506	nbrefs = bref;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1507	if (nbrefs > MaxBackRefs) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1508	error(RXERR_LIMIT);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1509	return 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1510	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1511	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1512	return setupState(BackRefBit \| bref);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1513	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1514	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1515
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1516	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1517	The two following functions add a transition between all pairs of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1518	states (i, j) where i is found in from, and j is found in to.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1519
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1520	Cat-transitions are distinguished from plus-transitions for
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1521	capturing.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1522	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1523
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1524	void QRegExpEngine::addCatTransitions(const QVector<int> &from, const QVector<int> &to)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1525	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1526	for (int i = 0; i < from.size(); i++)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1527	mergeInto(&s[from.at(i)].outs, to);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1528	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1529
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1530	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1531	void QRegExpEngine::addPlusTransitions(const QVector<int> &from, const QVector<int> &to, int atom)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1532	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1533	for (int i = 0; i < from.size(); i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1534	QRegExpAutomatonState &st = s[from.at(i)];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1535	const QVector<int> oldOuts = st.outs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1536	mergeInto(&st.outs, to);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1537	if (f.at(atom).capture != QRegExpAtom::NoCapture) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1538	for (int j = 0; j < to.size(); j++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1539	// ### st.reenter.contains(to.at(j)) check looks suspicious
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1540	if (!st.reenter.contains(to.at(j)) &&
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1541	qBinaryFind(oldOuts.constBegin(), oldOuts.constEnd(), to.at(j)) == oldOuts.end())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1542	st.reenter.insert(to.at(j), atom);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1543	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1544	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1545	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1546	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1547	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1548
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1549	#ifndef QT_NO_REGEXP_ANCHOR_ALT
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1550	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1551	Returns an anchor that means a OR b.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1552	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1553	int QRegExpEngine::anchorAlternation(int a, int b)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1554	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1555	if (((a & b) == a \|\| (a & b) == b) && ((a \| b) & Anchor_Alternation) == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1556	return a & b;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1557
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1558	int n = aa.size();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1559	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1560	if (n > 0 && aa.at(n - 1).a == a && aa.at(n - 1).b == b)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1561	return Anchor_Alternation \| (n - 1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1562	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1563
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1564	QRegExpAnchorAlternation element = {a, b};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1565	aa.append(element);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1566	return Anchor_Alternation \| n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1567	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1568
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1569	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1570	Returns an anchor that means a AND b.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1571	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1572	int QRegExpEngine::anchorConcatenation(int a, int b)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1573	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1574	if (((a \| b) & Anchor_Alternation) == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1575	return a \| b;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1576	if ((b & Anchor_Alternation) != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1577	qSwap(a, b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1578
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1579	int aprime = anchorConcatenation(aa.at(a ^ Anchor_Alternation).a, b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1580	int bprime = anchorConcatenation(aa.at(a ^ Anchor_Alternation).b, b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1581	return anchorAlternation(aprime, bprime);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1582	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1583	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1584
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1585	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1586	Adds anchor a on a transition caracterised by its from state and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1587	its to state.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1588	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1589	void QRegExpEngine::addAnchors(int from, int to, int a)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1590	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1591	QRegExpAutomatonState &st = s[from];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1592	if (st.anchors.contains(to))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1593	a = anchorAlternation(st.anchors.value(to), a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1594	st.anchors.insert(to, a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1595	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1596
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1597	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1598	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1599	This function chooses between the good-string and the bad-character
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1600	heuristics. It computes two scores and chooses the heuristic with
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1601	the highest score.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1602
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1603	Here are some common-sense constraints on the scores that should be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1604	respected if the formulas are ever modified: (1) If goodStr is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1605	empty, the good-string heuristic scores 0. (2) If the regular
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1606	expression is trivial, the good-string heuristic should be used.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1607	(3) If the search is case insensitive, the good-string heuristic
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1608	should be used, unless it scores 0. (Case insensitivity turns all
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1609	entries of occ1 to 0.) (4) If (goodLateStart - goodEarlyStart) is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1610	big, the good-string heuristic should score less.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1611	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1612	void QRegExpEngine::heuristicallyChooseHeuristic()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1613	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1614	if (minl == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1615	useGoodStringHeuristic = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1616	} else if (trivial) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1617	useGoodStringHeuristic = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1618	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1619	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1620	Magic formula: The good string has to constitute a good
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1621	proportion of the minimum-length string, and appear at a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1622	more-or-less known index.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1623	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1624	int goodStringScore = (64 * goodStr.length() / minl) -
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1625	(goodLateStart - goodEarlyStart);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1626	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1627	Less magic formula: We pick some characters at random, and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1628	check whether they are good or bad.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1629	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1630	int badCharScore = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1631	int step = qMax(1, NumBadChars / 32);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1632	for (int i = 1; i < NumBadChars; i += step) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1633	if (occ1.at(i) == NoOccurrence)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1634	badCharScore += minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1635	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1636	badCharScore += occ1.at(i);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1637	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1638	badCharScore /= minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1639	useGoodStringHeuristic = (goodStringScore > badCharScore);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1640	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1641	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1642	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1643
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1644	#if defined(QT_DEBUG)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1645	void QRegExpEngine::dump() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1646	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1647	int i, j;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1648	qDebug("Case %ssensitive engine", cs ? "" : "in");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1649	qDebug(" States");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1650	for (i = 0; i < s.size(); i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1651	qDebug(" %d%s", i, i == InitialState ? " (initial)" : i == FinalState ? " (final)" : "");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1652	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1653	if (nf > 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1654	qDebug(" in atom %d", s[i].atom);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1655	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1656	int m = s[i].match;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1657	if ((m & CharClassBit) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1658	qDebug(" match character class %d", m ^ CharClassBit);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1659	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1660	cl[m ^ CharClassBit].dump();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1661	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1662	qDebug(" negative character class");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1663	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1664	} else if ((m & BackRefBit) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1665	qDebug(" match back-reference %d", m ^ BackRefBit);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1666	} else if (m >= 0x20 && m <= 0x7e) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1667	qDebug(" match 0x%.4x (%c)", m, m);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1668	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1669	qDebug(" match 0x%.4x", m);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1670	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1671	for (j = 0; j < s[i].outs.size(); j++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1672	int next = s[i].outs[j];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1673	qDebug(" -> %d", next);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1674	if (s[i].reenter.contains(next))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1675	qDebug(" [reenter %d]", s[i].reenter[next]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1676	if (s[i].anchors.value(next) != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1677	qDebug(" [anchors 0x%.8x]", s[i].anchors[next]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1678	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1679	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1680	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1681	if (nf > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1682	qDebug(" Atom Parent Capture");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1683	for (i = 0; i < nf; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1684	if (f[i].capture == QRegExpAtom::NoCapture) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1685	qDebug(" %6d %6d nil", i, f[i].parent);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1686	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1687	int cap = f[i].capture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1688	bool official = captureForOfficialCapture.contains(cap);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1689	qDebug(" %6d %6d %6d %s", i, f[i].parent, f[i].capture,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1690	official ? "official" : "");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1691	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1692	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1693	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1694	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1695	#ifndef QT_NO_REGEXP_ANCHOR_ALT
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1696	for (i = 0; i < aa.size(); i++)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1697	qDebug(" Anchor alternation 0x%.8x: 0x%.8x 0x%.9x", i, aa[i].a, aa[i].b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1698	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1699	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1700	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1701
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1702	void QRegExpEngine::setup()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1703	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1704	ref = 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1705	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1706	f.resize(32);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1707	nf = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1708	cf = -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1709	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1710	officialncap = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1711	ncap = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1712	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1713	caretAnchored = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1714	trivial = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1715	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1716	valid = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1717	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1718	nbrefs = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1719	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1720	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1721	useGoodStringHeuristic = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1722	minl = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1723	occ1.fill(0, NumBadChars);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1724	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1725	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1726
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1727	int QRegExpEngine::setupState(int match)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1728	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1729	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1730	s += QRegExpAutomatonState(cf, match);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1731	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1732	s += QRegExpAutomatonState(match);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1733	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1734	return s.size() - 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1735	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1736
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1737	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1738	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1739	Functions startAtom() and finishAtom() should be called to delimit
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1740	atoms. When a state is created, it is assigned to the current atom.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1741	The information is later used for capturing.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1742	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1743	int QRegExpEngine::startAtom(bool officialCapture)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1744	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1745	if ((nf & (nf + 1)) == 0 && nf + 1 >= f.size())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1746	f.resize((nf + 1) << 1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1747	f[nf].parent = cf;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1748	cf = nf++;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1749	f[cf].capture = officialCapture ? QRegExpAtom::OfficialCapture : QRegExpAtom::NoCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1750	return cf;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1751	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1752
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1753	void QRegExpEngine::finishAtom(int atom, bool needCapture)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1754	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1755	if (greedyQuantifiers && needCapture && f[atom].capture == QRegExpAtom::NoCapture)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1756	f[atom].capture = QRegExpAtom::UnofficialCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1757	cf = f.at(atom).parent;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1758	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1759	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1760
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1761	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1762	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1763	Creates a lookahead anchor.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1764	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1765	int QRegExpEngine::addLookahead(QRegExpEngine *eng, bool negative)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1766	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1767	int n = ahead.size();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1768	if (n == MaxLookaheads) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1769	error(RXERR_LIMIT);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1770	return 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1771	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1772	ahead += new QRegExpLookahead(eng, negative);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1773	return Anchor_FirstLookahead << n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1774	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1775	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1776
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1777	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1778	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1779	We want the longest leftmost captures.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1780	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1781	static bool isBetterCapture(int ncap, const int begin1, const int end1, const int *begin2,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1782	const int *end2)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1783	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1784	for (int i = 0; i < ncap; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1785	int delta = begin2[i] - begin1[i]; // it has to start early...
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1786	if (delta == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1787	delta = end1[i] - end2[i]; // ...and end late
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1788
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1789	if (delta != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1790	return delta > 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1791	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1792	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1793	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1794	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1795
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1796	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1797	Returns true if anchor a matches at position pos + i in the input
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1798	string, otherwise false.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1799	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1800	bool QRegExpMatchState::testAnchor(int i, int a, const int *capBegin)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1801	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1802	int j;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1803
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1804	#ifndef QT_NO_REGEXP_ANCHOR_ALT
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1805	if ((a & QRegExpEngine::Anchor_Alternation) != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1806	return testAnchor(i, eng->aa.at(a ^ QRegExpEngine::Anchor_Alternation).a, capBegin)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1807	\|\| testAnchor(i, eng->aa.at(a ^ QRegExpEngine::Anchor_Alternation).b, capBegin);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1808	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1809
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1810	if ((a & QRegExpEngine::Anchor_Caret) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1811	if (pos + i != caretPos)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1812	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1813	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1814	if ((a & QRegExpEngine::Anchor_Dollar) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1815	if (pos + i != len)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1816	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1817	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1818	#ifndef QT_NO_REGEXP_ESCAPE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1819	if ((a & (QRegExpEngine::Anchor_Word \| QRegExpEngine::Anchor_NonWord)) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1820	bool before = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1821	bool after = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1822	if (pos + i != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1823	before = isWord(in[pos + i - 1]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1824	if (pos + i != len)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1825	after = isWord(in[pos + i]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1826	if ((a & QRegExpEngine::Anchor_Word) != 0 && (before == after))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1827	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1828	if ((a & QRegExpEngine::Anchor_NonWord) != 0 && (before != after))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1829	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1830	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1831	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1832	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1833	if ((a & QRegExpEngine::Anchor_LookaheadMask) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1834	const QVector<QRegExpLookahead *> &ahead = eng->ahead;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1835	for (j = 0; j < ahead.size(); j++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1836	if ((a & (QRegExpEngine::Anchor_FirstLookahead << j)) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1837	QRegExpMatchState matchState;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1838	matchState.prepareForMatch(ahead[j]->eng);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1839	matchState.match(in + pos + i, len - pos - i, 0,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1840	true, true, matchState.caretPos - matchState.pos - i);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1841	if ((matchState.captured[0] == 0) == ahead[j]->neg)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1842	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1843	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1844	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1845	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1846	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1847	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1848	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1849	for (j = 0; j < eng->nbrefs; j++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1850	if ((a & (QRegExpEngine::Anchor_BackRef1Empty << j)) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1851	int i = eng->captureForOfficialCapture.at(j);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1852	if (capBegin[i] != EmptyCapture)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1853	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1854	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1855	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1856	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1857	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1858	return true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1859	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1860
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1861	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1862	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1863	The three following functions are what Jeffrey Friedl would call
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1864	transmissions (or bump-alongs). Using one or the other should make
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1865	no difference except in performance.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1866	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1867
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1868	bool QRegExpEngine::goodStringMatch(QRegExpMatchState &matchState) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1869	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1870	int k = matchState.pos + goodEarlyStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1871	QStringMatcher matcher(goodStr.unicode(), goodStr.length(), cs);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1872	while ((k = matcher.indexIn(matchState.in, matchState.len, k)) != -1) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1873	int from = k - goodLateStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1874	int to = k - goodEarlyStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1875	if (from > matchState.pos)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1876	matchState.pos = from;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1877
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1878	while (matchState.pos <= to) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1879	if (matchState.matchHere())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1880	return true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1881	++matchState.pos;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1882	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1883	++k;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1884	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1885	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1886	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1887
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1888	bool QRegExpEngine::badCharMatch(QRegExpMatchState &matchState) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1889	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1890	int slideHead = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1891	int slideNext = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1892	int i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1893	int lastPos = matchState.len - minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1894	memset(matchState.slideTab, 0, matchState.slideTabSize * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1895
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1896	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1897	Set up the slide table, used for the bad-character heuristic,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1898	using the table of first occurrence of each character.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1899	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1900	for (i = 0; i < minl; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1901	int sk = occ1[BadChar(matchState.in[matchState.pos + i])];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1902	if (sk == NoOccurrence)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1903	sk = i + 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1904	if (sk > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1905	int k = i + 1 - sk;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1906	if (k < 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1907	sk = i + 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1908	k = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1909	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1910	if (sk > matchState.slideTab[k])
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1911	matchState.slideTab[k] = sk;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1912	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1913	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1914
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1915	if (matchState.pos > lastPos)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1916	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1917
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1918	for (;;) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1919	if (++slideNext >= matchState.slideTabSize)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1920	slideNext = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1921	if (matchState.slideTab[slideHead] > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1922	if (matchState.slideTab[slideHead] - 1 > matchState.slideTab[slideNext])
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1923	matchState.slideTab[slideNext] = matchState.slideTab[slideHead] - 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1924	matchState.slideTab[slideHead] = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1925	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1926	if (matchState.matchHere())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1927	return true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1928	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1929
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1930	if (matchState.pos == lastPos)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1931	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1932
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1933	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1934	Update the slide table. This code has much in common with
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1935	the initialization code.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1936	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1937	int sk = occ1[BadChar(matchState.in[matchState.pos + minl])];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1938	if (sk == NoOccurrence) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1939	matchState.slideTab[slideNext] = minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1940	} else if (sk > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1941	int k = slideNext + minl - sk;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1942	if (k >= matchState.slideTabSize)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1943	k -= matchState.slideTabSize;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1944	if (sk > matchState.slideTab[k])
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1945	matchState.slideTab[k] = sk;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1946	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1947	slideHead = slideNext;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1948	++matchState.pos;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1949	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1950	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1951	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1952	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1953	bool QRegExpEngine::bruteMatch(QRegExpMatchState &matchState) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1954	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1955	while (matchState.pos <= matchState.len) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1956	if (matchState.matchHere())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1957	return true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1958	++matchState.pos;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1959	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1960	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1961	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1962	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1963
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1964	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1965	Here's the core of the engine. It tries to do a match here and now.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1966	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1967	bool QRegExpMatchState::matchHere()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1968	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1969	int ncur = 1, nnext = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1970	int i = 0, j, k, m;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1971	bool stop = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1972
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1973	matchLen = -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1974	oneTestMatchedLen = -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1975	curStack[0] = QRegExpEngine::InitialState;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1976
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1977	int ncap = eng->ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1978	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1979	if (ncap > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1980	for (j = 0; j < ncap; j++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1981	curCapBegin[j] = EmptyCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1982	curCapEnd[j] = EmptyCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1983	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1984	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1985	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1986
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1987	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1988	while ((ncur > 0 \|\| !sleeping.isEmpty()) && i <= len - pos && !stop)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1989	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1990	while (ncur > 0 && i <= len - pos && !stop)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1991	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1992	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1993	int ch = (i < len - pos) ? in[pos + i].unicode() : 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1994	for (j = 0; j < ncur; j++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1995	int cur = curStack[j];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1996	const QRegExpAutomatonState &scur = eng->s.at(cur);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1997	const QVector<int> &outs = scur.outs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1998	for (k = 0; k < outs.size(); k++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1999	int next = outs.at(k);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2000	const QRegExpAutomatonState &snext = eng->s.at(next);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2001	bool inside = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2002	#if !defined(QT_NO_REGEXP_BACKREF) && !defined(QT_NO_REGEXP_CAPTURE)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2003	int needSomeSleep = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2004	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2005
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2006	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2007	First, check if the anchors are anchored properly.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2008	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2009	int a = scur.anchors.value(next);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2010	if (a != 0 && !testAnchor(i, a, curCapBegin + j * ncap))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2011	inside = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2012
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2013	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2014	If indeed they are, check if the input character is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2015	correct for this transition.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2016	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2017	if (inside) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2018	m = snext.match;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2019	if ((m & (QRegExpEngine::CharClassBit \| QRegExpEngine::BackRefBit)) == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2020	if (eng->cs)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2021	inside = (m == ch);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2022	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2023	inside = (QChar(m).toLower() == QChar(ch).toLower());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2024	} else if (next == QRegExpEngine::FinalState) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2025	matchLen = i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2026	stop = minimal;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2027	inside = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2028	} else if ((m & QRegExpEngine::CharClassBit) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2029	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2030	const QRegExpCharClass &cc = eng->cl.at(m ^ QRegExpEngine::CharClassBit);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2031	if (eng->cs)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2032	inside = cc.in(ch);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2033	else if (cc.negative())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2034	inside = cc.in(QChar(ch).toLower()) &&
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2035	cc.in(QChar(ch).toUpper());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2036	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2037	inside = cc.in(QChar(ch).toLower()) \|\|
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2038	cc.in(QChar(ch).toUpper());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2039	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2040	#if !defined(QT_NO_REGEXP_BACKREF) && !defined(QT_NO_REGEXP_CAPTURE)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2041	} else { /* ((m & QRegExpEngine::BackRefBit) != 0) */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2042	int bref = m ^ QRegExpEngine::BackRefBit;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2043	int ell = j * ncap + eng->captureForOfficialCapture.at(bref - 1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2044
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2045	inside = bref <= ncap && curCapBegin[ell] != EmptyCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2046	if (inside) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2047	if (eng->cs)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2048	inside = (in[pos + curCapBegin[ell]] == QChar(ch));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2049	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2050	inside = (in[pos + curCapBegin[ell]].toLower()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2051	== QChar(ch).toLower());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2052	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2053
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2054	if (inside) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2055	int delta;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2056	if (curCapEnd[ell] == EmptyCapture)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2057	delta = i - curCapBegin[ell];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2058	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2059	delta = curCapEnd[ell] - curCapBegin[ell];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2060
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2061	inside = (delta <= len - (pos + i));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2062	if (inside && delta > 1) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2063	int n = 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2064	if (eng->cs) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2065	while (n < delta) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2066	if (in[pos + curCapBegin[ell] + n]
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2067	!= in[pos + i + n])
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2068	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2069	++n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2070	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2071	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2072	while (n < delta) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2073	QChar a = in[pos + curCapBegin[ell] + n];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2074	QChar b = in[pos + i + n];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2075	if (a.toLower() != b.toLower())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2076	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2077	++n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2078	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2079	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2080	inside = (n == delta);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2081	if (inside)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2082	needSomeSleep = delta - 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2083	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2084	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2085	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2086	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2087	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2088
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2089	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2090	We must now update our data structures.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2091	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2092	if (inside) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2093	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2094	int capBegin, capEnd;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2095	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2096	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2097	If the next state was not encountered yet, all
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2098	is fine.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2099	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2100	if ((m = inNextStack[next]) == -1) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2101	m = nnext++;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2102	nextStack[m] = next;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2103	inNextStack[next] = m;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2104	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2105	capBegin = nextCapBegin + m * ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2106	capEnd = nextCapEnd + m * ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2107
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2108	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2109	Otherwise, we'll first maintain captures in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2110	temporary arrays, and decide at the end whether
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2111	it's best to keep the previous capture zones or
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2112	the new ones.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2113	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2114	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2115	capBegin = tempCapBegin;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2116	capEnd = tempCapEnd;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2117	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2118	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2119
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2120	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2121	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2122	Updating the capture zones is much of a task.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2123	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2124	if (ncap > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2125	memcpy(capBegin, curCapBegin + j * ncap, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2126	memcpy(capEnd, curCapEnd + j * ncap, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2127	int c = scur.atom, n = snext.atom;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2128	int p = -1, q = -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2129	int cap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2130
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2131	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2132	Lemma 1. For any x in the range [0..nf), we
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2133	have f[x].parent < x.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2134
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2135	Proof. By looking at startAtom(), it is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2136	clear that cf < nf holds all the time, and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2137	thus that f[nf].parent < nf.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2138	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2139
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2140	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2141	If we are reentering an atom, we empty all
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2142	capture zones inside it.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2143	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2144	if ((q = scur.reenter.value(next)) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2145	QBitArray b(eng->nf, false);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2146	b.setBit(q, true);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2147	for (int ell = q + 1; ell < eng->nf; ell++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2148	if (b.testBit(eng->f.at(ell).parent)) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2149	b.setBit(ell, true);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2150	cap = eng->f.at(ell).capture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2151	if (cap >= 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2152	capBegin[cap] = EmptyCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2153	capEnd[cap] = EmptyCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2154	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2155	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2156	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2157	p = eng->f.at(q).parent;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2158
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2159	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2160	Otherwise, close the capture zones we are
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2161	leaving. We are leaving f[c].capture,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2162	f[f[c].parent].capture,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2163	f[f[f[c].parent].parent].capture, ...,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2164	until f[x].capture, with x such that
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2165	f[x].parent is the youngest common ancestor
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2166	for c and n.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2167
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2168	We go up along c's and n's ancestry until
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2169	we find x.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2170	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2171	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2172	p = c;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2173	q = n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2174	while (p != q) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2175	if (p > q) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2176	cap = eng->f.at(p).capture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2177	if (cap >= 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2178	if (capBegin[cap] == i) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2179	capBegin[cap] = EmptyCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2180	capEnd[cap] = EmptyCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2181	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2182	capEnd[cap] = i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2183	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2184	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2185	p = eng->f.at(p).parent;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2186	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2187	q = eng->f.at(q).parent;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2188	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2189	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2190	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2191
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2192	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2193	In any case, we now open the capture zones
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2194	we are entering. We work upwards from n
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2195	until we reach p (the parent of the atom we
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2196	reenter or the youngest common ancestor).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2197	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2198	while (n > p) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2199	cap = eng->f.at(n).capture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2200	if (cap >= 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2201	capBegin[cap] = i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2202	capEnd[cap] = EmptyCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2203	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2204	n = eng->f.at(n).parent;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2205	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2206	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2207	If the next state was already in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2208	nextStack, we must choose carefully which
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2209	capture zones we want to keep.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2210	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2211	if (capBegin == tempCapBegin &&
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2212	isBetterCapture(ncap, capBegin, capEnd, nextCapBegin + m * ncap,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2213	nextCapEnd + m * ncap)) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2214	memcpy(nextCapBegin + m * ncap, capBegin, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2215	memcpy(nextCapEnd + m * ncap, capEnd, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2216	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2217	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2218	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2219	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2220	We are done with updating the capture zones.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2221	It's now time to put the next state to sleep,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2222	if it needs to, and to remove it from
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2223	nextStack.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2224	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2225	if (needSomeSleep > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2226	QVector<int> zzZ(2 + 2 * ncap);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2227	zzZ[0] = i + needSomeSleep;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2228	zzZ[1] = next;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2229	if (ncap > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2230	memcpy(zzZ.data() + 2, capBegin, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2231	memcpy(zzZ.data() + 2 + ncap, capEnd, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2232	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2233	inNextStack[nextStack[--nnext]] = -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2234	sleeping.append(zzZ);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2235	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2236	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2237	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2238	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2239	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2240	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2241	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2242	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2243	If we reached the final state, hurray! Copy the captured
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2244	zone.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2245	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2246	if (ncap > 0 && (m = inNextStack[QRegExpEngine::FinalState]) != -1) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2247	memcpy(capBegin, nextCapBegin + m * ncap, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2248	memcpy(capEnd, nextCapEnd + m * ncap, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2249	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2250	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2251	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2252	It's time to wake up the sleepers.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2253	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2254	j = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2255	while (j < sleeping.count()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2256	if (sleeping.at(j)[0] == i) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2257	const QVector<int> &zzZ = sleeping.at(j);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2258	int next = zzZ[1];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2259	const int *capBegin = zzZ.data() + 2;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2260	const int *capEnd = zzZ.data() + 2 + ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2261	bool copyOver = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2262
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2263	if ((m = inNextStack[next]) == -1) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2264	m = nnext++;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2265	nextStack[m] = next;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2266	inNextStack[next] = m;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2267	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2268	copyOver = isBetterCapture(ncap, nextCapBegin + m * ncap, nextCapEnd + m * ncap,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2269	capBegin, capEnd);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2270	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2271	if (copyOver) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2272	memcpy(nextCapBegin + m * ncap, capBegin, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2273	memcpy(nextCapEnd + m * ncap, capEnd, ncap * sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2274	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2275
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2276	sleeping.removeAt(j);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2277	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2278	++j;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2279	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2280	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2281	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2282	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2283	for (j = 0; j < nnext; j++)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2284	inNextStack[nextStack[j]] = -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2285
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2286	// avoid needless iteration that confuses oneTestMatchedLen
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2287	if (nnext == 1 && nextStack[0] == QRegExpEngine::FinalState
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2288	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2289	&& sleeping.isEmpty()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2290	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2291	)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2292	stop = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2293
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2294	qSwap(curStack, nextStack);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2295	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2296	qSwap(curCapBegin, nextCapBegin);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2297	qSwap(curCapEnd, nextCapEnd);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2298	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2299	ncur = nnext;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2300	nnext = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2301	++i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2302	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2303
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2304	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2305	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2306	If minimal matching is enabled, we might have some sleepers
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2307	left.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2308	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2309	if (!sleeping.isEmpty())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2310	sleeping.clear();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2311	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2312
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2313	oneTestMatchedLen = i - 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2314	return (matchLen >= 0);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2315	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2316
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2317	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2318
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2319	QRegExpCharClass::QRegExpCharClass()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2320	: c(0), n(false)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2321	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2322	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2323	occ1.fill(NoOccurrence, NumBadChars);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2324	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2325	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2326
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2327	QRegExpCharClass &QRegExpCharClass::operator=(const QRegExpCharClass &cc)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2328	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2329	c = cc.c;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2330	r = cc.r;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2331	n = cc.n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2332	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2333	occ1 = cc.occ1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2334	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2335	return *this;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2336	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2337
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2338	void QRegExpCharClass::clear()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2339	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2340	c = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2341	r.resize(0);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2342	n = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2343	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2344
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2345	void QRegExpCharClass::setNegative(bool negative)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2346	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2347	n = negative;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2348	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2349	occ1.fill(0, NumBadChars);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2350	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2351	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2352
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2353	void QRegExpCharClass::addCategories(int cats)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2354	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2355	c \|= cats;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2356	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2357	occ1.fill(0, NumBadChars);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2358	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2359	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2360
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2361	void QRegExpCharClass::addRange(ushort from, ushort to)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2362	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2363	if (from > to)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2364	qSwap(from, to);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2365	int m = r.size();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2366	r.resize(m + 1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2367	r[m].from = from;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2368	r[m].len = to - from + 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2369
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2370	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2371	int i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2372
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2373	if (to - from < NumBadChars) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2374	if (from % NumBadChars <= to % NumBadChars) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2375	for (i = from % NumBadChars; i <= to % NumBadChars; i++)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2376	occ1[i] = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2377	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2378	for (i = 0; i <= to % NumBadChars; i++)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2379	occ1[i] = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2380	for (i = from % NumBadChars; i < NumBadChars; i++)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2381	occ1[i] = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2382	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2383	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2384	occ1.fill(0, NumBadChars);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2385	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2386	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2387	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2388
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2389	bool QRegExpCharClass::in(QChar ch) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2390	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2391	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2392	if (occ1.at(BadChar(ch)) == NoOccurrence)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2393	return n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2394	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2395
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2396	if (c != 0 && (c & (1 << (int)ch.category())) != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2397	return !n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2398
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2399	const int uc = ch.unicode();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2400	int size = r.size();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2401
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2402	for (int i = 0; i < size; ++i) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2403	const QRegExpCharClassRange &range = r.at(i);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2404	if (uint(uc - range.from) < uint(r.at(i).len))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2405	return !n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2406	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2407	return n;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2408	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2409
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2410	#if defined(QT_DEBUG)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2411	void QRegExpCharClass::dump() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2412	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2413	int i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2414	qDebug(" %stive character class", n ? "nega" : "posi");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2415	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2416	if (c != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2417	qDebug(" categories 0x%.8x", c);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2418	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2419	for (i = 0; i < r.size(); i++)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2420	qDebug(" 0x%.4x through 0x%.4x", r[i].from, r[i].from + r[i].len - 1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2421	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2422	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2423	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2424
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2425	QRegExpEngine::Box::Box(QRegExpEngine *engine)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2426	: eng(engine), skipanchors(0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2427	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2428	, earlyStart(0), lateStart(0), maxl(0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2429	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2430	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2431	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2432	occ1.fill(NoOccurrence, NumBadChars);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2433	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2434	minl = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2435	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2436
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2437	QRegExpEngine::Box &QRegExpEngine::Box::operator=(const Box &b)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2438	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2439	eng = b.eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2440	ls = b.ls;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2441	rs = b.rs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2442	lanchors = b.lanchors;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2443	ranchors = b.ranchors;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2444	skipanchors = b.skipanchors;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2445	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2446	earlyStart = b.earlyStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2447	lateStart = b.lateStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2448	str = b.str;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2449	leftStr = b.leftStr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2450	rightStr = b.rightStr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2451	maxl = b.maxl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2452	occ1 = b.occ1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2453	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2454	minl = b.minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2455	return *this;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2456	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2457
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2458	void QRegExpEngine::Box::set(QChar ch)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2459	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2460	ls.resize(1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2461	ls[0] = eng->createState(ch);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2462	rs = ls;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2463	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2464	str = ch;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2465	leftStr = ch;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2466	rightStr = ch;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2467	maxl = 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2468	occ1[BadChar(ch)] = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2469	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2470	minl = 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2471	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2472
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2473	void QRegExpEngine::Box::set(const QRegExpCharClass &cc)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2474	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2475	ls.resize(1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2476	ls[0] = eng->createState(cc);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2477	rs = ls;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2478	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2479	maxl = 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2480	occ1 = cc.firstOccurrence();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2481	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2482	minl = 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2483	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2484
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2485	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2486	void QRegExpEngine::Box::set(int bref)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2487	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2488	ls.resize(1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2489	ls[0] = eng->createState(bref);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2490	rs = ls;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2491	if (bref >= 1 && bref <= MaxBackRefs)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2492	skipanchors = Anchor_BackRef0Empty << bref;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2493	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2494	maxl = InftyLen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2495	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2496	minl = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2497	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2498	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2499
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2500	void QRegExpEngine::Box::cat(const Box &b)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2501	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2502	eng->addCatTransitions(rs, b.ls);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2503	addAnchorsToEngine(b);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2504	if (minl == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2505	lanchors.unite(b.lanchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2506	if (skipanchors != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2507	for (int i = 0; i < b.ls.size(); i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2508	int a = eng->anchorConcatenation(lanchors.value(b.ls.at(i), 0), skipanchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2509	lanchors.insert(b.ls.at(i), a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2510	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2511	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2512	mergeInto(&ls, b.ls);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2513	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2514	if (b.minl == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2515	ranchors.unite(b.ranchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2516	if (b.skipanchors != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2517	for (int i = 0; i < rs.size(); i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2518	int a = eng->anchorConcatenation(ranchors.value(rs.at(i), 0), b.skipanchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2519	ranchors.insert(rs.at(i), a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2520	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2521	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2522	mergeInto(&rs, b.rs);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2523	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2524	ranchors = b.ranchors;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2525	rs = b.rs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2526	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2527
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2528	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2529	if (maxl != InftyLen) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2530	if (rightStr.length() + b.leftStr.length() >
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2531	qMax(str.length(), b.str.length())) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2532	earlyStart = minl - rightStr.length();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2533	lateStart = maxl - rightStr.length();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2534	str = rightStr + b.leftStr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2535	} else if (b.str.length() > str.length()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2536	earlyStart = minl + b.earlyStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2537	lateStart = maxl + b.lateStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2538	str = b.str;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2539	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2540	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2541
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2542	if (leftStr.length() == maxl)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2543	leftStr += b.leftStr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2544
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2545	if (b.rightStr.length() == b.maxl) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2546	rightStr += b.rightStr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2547	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2548	rightStr = b.rightStr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2549	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2550
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2551	if (maxl == InftyLen \|\| b.maxl == InftyLen) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2552	maxl = InftyLen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2553	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2554	maxl += b.maxl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2555	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2556
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2557	for (int i = 0; i < NumBadChars; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2558	if (b.occ1.at(i) != NoOccurrence && minl + b.occ1.at(i) < occ1.at(i))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2559	occ1[i] = minl + b.occ1.at(i);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2560	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2561	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2562
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2563	minl += b.minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2564	if (minl == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2565	skipanchors = eng->anchorConcatenation(skipanchors, b.skipanchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2566	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2567	skipanchors = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2568	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2569
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2570	void QRegExpEngine::Box::orx(const Box &b)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2571	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2572	mergeInto(&ls, b.ls);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2573	lanchors.unite(b.lanchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2574	mergeInto(&rs, b.rs);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2575	ranchors.unite(b.ranchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2576
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2577	if (b.minl == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2578	if (minl == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2579	skipanchors = eng->anchorAlternation(skipanchors, b.skipanchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2580	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2581	skipanchors = b.skipanchors;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2582	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2583
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2584	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2585	for (int i = 0; i < NumBadChars; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2586	if (occ1.at(i) > b.occ1.at(i))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2587	occ1[i] = b.occ1.at(i);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2588	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2589	earlyStart = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2590	lateStart = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2591	str = QString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2592	leftStr = QString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2593	rightStr = QString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2594	if (b.maxl > maxl)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2595	maxl = b.maxl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2596	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2597	if (b.minl < minl)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2598	minl = b.minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2599	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2600
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2601	void QRegExpEngine::Box::plus(int atom)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2602	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2603	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2604	eng->addPlusTransitions(rs, ls, atom);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2605	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2606	Q_UNUSED(atom);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2607	eng->addCatTransitions(rs, ls);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2608	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2609	addAnchorsToEngine(*this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2610	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2611	maxl = InftyLen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2612	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2613	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2614
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2615	void QRegExpEngine::Box::opt()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2616	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2617	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2618	earlyStart = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2619	lateStart = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2620	str = QString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2621	leftStr = QString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2622	rightStr = QString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2623	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2624	skipanchors = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2625	minl = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2626	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2627
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2628	void QRegExpEngine::Box::catAnchor(int a)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2629	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2630	if (a != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2631	for (int i = 0; i < rs.size(); i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2632	a = eng->anchorConcatenation(ranchors.value(rs.at(i), 0), a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2633	ranchors.insert(rs.at(i), a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2634	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2635	if (minl == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2636	skipanchors = eng->anchorConcatenation(skipanchors, a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2637	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2638	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2639
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2640	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2641	void QRegExpEngine::Box::setupHeuristics()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2642	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2643	eng->goodEarlyStart = earlyStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2644	eng->goodLateStart = lateStart;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2645	eng->goodStr = eng->cs ? str : str.toLower();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2646
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2647	eng->minl = minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2648	if (eng->cs) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2649	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2650	A regular expression such as 112\|1 has occ1['2'] = 2 and minl =
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2651	1 at this point. An entry of occ1 has to be at most minl or
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2652	infinity for the rest of the algorithm to go well.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2653
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2654	We waited until here before normalizing these cases (instead of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2655	doing it in Box::orx()) because sometimes things improve by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2656	themselves. Consider for example (112\|1)34.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2657	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2658	for (int i = 0; i < NumBadChars; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2659	if (occ1.at(i) != NoOccurrence && occ1.at(i) >= minl)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2660	occ1[i] = minl;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2661	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2662	eng->occ1 = occ1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2663	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2664	eng->occ1.fill(0, NumBadChars);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2665	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2666
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2667	eng->heuristicallyChooseHeuristic();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2668	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2669	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2670
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2671	#if defined(QT_DEBUG)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2672	void QRegExpEngine::Box::dump() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2673	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2674	int i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2675	qDebug("Box of at least %d character%s", minl, minl == 1 ? "" : "s");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2676	qDebug(" Left states:");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2677	for (i = 0; i < ls.size(); i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2678	if (lanchors.value(ls[i], 0) == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2679	qDebug(" %d", ls[i]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2680	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2681	qDebug(" %d [anchors 0x%.8x]", ls[i], lanchors[ls[i]]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2682	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2683	qDebug(" Right states:");
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2684	for (i = 0; i < rs.size(); i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2685	if (ranchors.value(rs[i], 0) == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2686	qDebug(" %d", rs[i]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2687	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2688	qDebug(" %d [anchors 0x%.8x]", rs[i], ranchors[rs[i]]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2689	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2690	qDebug(" Skip anchors: 0x%.8x", skipanchors);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2691	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2692	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2693
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2694	void QRegExpEngine::Box::addAnchorsToEngine(const Box &to) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2695	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2696	for (int i = 0; i < to.ls.size(); i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2697	for (int j = 0; j < rs.size(); j++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2698	int a = eng->anchorConcatenation(ranchors.value(rs.at(j), 0),
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2699	to.lanchors.value(to.ls.at(i), 0));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2700	eng->addAnchors(rs[j], to.ls[i], a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2701	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2702	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2703	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2704
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2705	void QRegExpEngine::setupCategoriesRangeMap()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2706	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2707	categoriesRangeMap.insert("IsBasicLatin", qMakePair(0x0000, 0x007F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2708	categoriesRangeMap.insert("IsLatin-1Supplement", qMakePair(0x0080, 0x00FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2709	categoriesRangeMap.insert("IsLatinExtended-A", qMakePair(0x0100, 0x017F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2710	categoriesRangeMap.insert("IsLatinExtended-B", qMakePair(0x0180, 0x024F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2711	categoriesRangeMap.insert("IsIPAExtensions", qMakePair(0x0250, 0x02AF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2712	categoriesRangeMap.insert("IsSpacingModifierLetters", qMakePair(0x02B0, 0x02FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2713	categoriesRangeMap.insert("IsCombiningDiacriticalMarks", qMakePair(0x0300, 0x036F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2714	categoriesRangeMap.insert("IsGreek", qMakePair(0x0370, 0x03FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2715	categoriesRangeMap.insert("IsCyrillic", qMakePair(0x0400, 0x04FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2716	categoriesRangeMap.insert("IsCyrillicSupplement", qMakePair(0x0500, 0x052F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2717	categoriesRangeMap.insert("IsArmenian", qMakePair(0x0530, 0x058F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2718	categoriesRangeMap.insert("IsHebrew", qMakePair(0x0590, 0x05FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2719	categoriesRangeMap.insert("IsArabic", qMakePair(0x0600, 0x06FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2720	categoriesRangeMap.insert("IsSyriac", qMakePair(0x0700, 0x074F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2721	categoriesRangeMap.insert("IsArabicSupplement", qMakePair(0x0750, 0x077F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2722	categoriesRangeMap.insert("IsThaana", qMakePair(0x0780, 0x07BF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2723	categoriesRangeMap.insert("IsDevanagari", qMakePair(0x0900, 0x097F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2724	categoriesRangeMap.insert("IsBengali", qMakePair(0x0980, 0x09FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2725	categoriesRangeMap.insert("IsGurmukhi", qMakePair(0x0A00, 0x0A7F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2726	categoriesRangeMap.insert("IsGujarati", qMakePair(0x0A80, 0x0AFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2727	categoriesRangeMap.insert("IsOriya", qMakePair(0x0B00, 0x0B7F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2728	categoriesRangeMap.insert("IsTamil", qMakePair(0x0B80, 0x0BFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2729	categoriesRangeMap.insert("IsTelugu", qMakePair(0x0C00, 0x0C7F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2730	categoriesRangeMap.insert("IsKannada", qMakePair(0x0C80, 0x0CFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2731	categoriesRangeMap.insert("IsMalayalam", qMakePair(0x0D00, 0x0D7F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2732	categoriesRangeMap.insert("IsSinhala", qMakePair(0x0D80, 0x0DFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2733	categoriesRangeMap.insert("IsThai", qMakePair(0x0E00, 0x0E7F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2734	categoriesRangeMap.insert("IsLao", qMakePair(0x0E80, 0x0EFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2735	categoriesRangeMap.insert("IsTibetan", qMakePair(0x0F00, 0x0FFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2736	categoriesRangeMap.insert("IsMyanmar", qMakePair(0x1000, 0x109F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2737	categoriesRangeMap.insert("IsGeorgian", qMakePair(0x10A0, 0x10FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2738	categoriesRangeMap.insert("IsHangulJamo", qMakePair(0x1100, 0x11FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2739	categoriesRangeMap.insert("IsEthiopic", qMakePair(0x1200, 0x137F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2740	categoriesRangeMap.insert("IsEthiopicSupplement", qMakePair(0x1380, 0x139F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2741	categoriesRangeMap.insert("IsCherokee", qMakePair(0x13A0, 0x13FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2742	categoriesRangeMap.insert("IsUnifiedCanadianAboriginalSyllabics", qMakePair(0x1400, 0x167F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2743	categoriesRangeMap.insert("IsOgham", qMakePair(0x1680, 0x169F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2744	categoriesRangeMap.insert("IsRunic", qMakePair(0x16A0, 0x16FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2745	categoriesRangeMap.insert("IsTagalog", qMakePair(0x1700, 0x171F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2746	categoriesRangeMap.insert("IsHanunoo", qMakePair(0x1720, 0x173F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2747	categoriesRangeMap.insert("IsBuhid", qMakePair(0x1740, 0x175F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2748	categoriesRangeMap.insert("IsTagbanwa", qMakePair(0x1760, 0x177F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2749	categoriesRangeMap.insert("IsKhmer", qMakePair(0x1780, 0x17FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2750	categoriesRangeMap.insert("IsMongolian", qMakePair(0x1800, 0x18AF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2751	categoriesRangeMap.insert("IsLimbu", qMakePair(0x1900, 0x194F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2752	categoriesRangeMap.insert("IsTaiLe", qMakePair(0x1950, 0x197F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2753	categoriesRangeMap.insert("IsNewTaiLue", qMakePair(0x1980, 0x19DF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2754	categoriesRangeMap.insert("IsKhmerSymbols", qMakePair(0x19E0, 0x19FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2755	categoriesRangeMap.insert("IsBuginese", qMakePair(0x1A00, 0x1A1F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2756	categoriesRangeMap.insert("IsPhoneticExtensions", qMakePair(0x1D00, 0x1D7F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2757	categoriesRangeMap.insert("IsPhoneticExtensionsSupplement", qMakePair(0x1D80, 0x1DBF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2758	categoriesRangeMap.insert("IsCombiningDiacriticalMarksSupplement", qMakePair(0x1DC0, 0x1DFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2759	categoriesRangeMap.insert("IsLatinExtendedAdditional", qMakePair(0x1E00, 0x1EFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2760	categoriesRangeMap.insert("IsGreekExtended", qMakePair(0x1F00, 0x1FFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2761	categoriesRangeMap.insert("IsGeneralPunctuation", qMakePair(0x2000, 0x206F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2762	categoriesRangeMap.insert("IsSuperscriptsandSubscripts", qMakePair(0x2070, 0x209F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2763	categoriesRangeMap.insert("IsCurrencySymbols", qMakePair(0x20A0, 0x20CF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2764	categoriesRangeMap.insert("IsCombiningMarksforSymbols", qMakePair(0x20D0, 0x20FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2765	categoriesRangeMap.insert("IsLetterlikeSymbols", qMakePair(0x2100, 0x214F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2766	categoriesRangeMap.insert("IsNumberForms", qMakePair(0x2150, 0x218F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2767	categoriesRangeMap.insert("IsArrows", qMakePair(0x2190, 0x21FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2768	categoriesRangeMap.insert("IsMathematicalOperators", qMakePair(0x2200, 0x22FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2769	categoriesRangeMap.insert("IsMiscellaneousTechnical", qMakePair(0x2300, 0x23FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2770	categoriesRangeMap.insert("IsControlPictures", qMakePair(0x2400, 0x243F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2771	categoriesRangeMap.insert("IsOpticalCharacterRecognition", qMakePair(0x2440, 0x245F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2772	categoriesRangeMap.insert("IsEnclosedAlphanumerics", qMakePair(0x2460, 0x24FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2773	categoriesRangeMap.insert("IsBoxDrawing", qMakePair(0x2500, 0x257F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2774	categoriesRangeMap.insert("IsBlockElements", qMakePair(0x2580, 0x259F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2775	categoriesRangeMap.insert("IsGeometricShapes", qMakePair(0x25A0, 0x25FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2776	categoriesRangeMap.insert("IsMiscellaneousSymbols", qMakePair(0x2600, 0x26FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2777	categoriesRangeMap.insert("IsDingbats", qMakePair(0x2700, 0x27BF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2778	categoriesRangeMap.insert("IsMiscellaneousMathematicalSymbols-A", qMakePair(0x27C0, 0x27EF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2779	categoriesRangeMap.insert("IsSupplementalArrows-A", qMakePair(0x27F0, 0x27FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2780	categoriesRangeMap.insert("IsBraillePatterns", qMakePair(0x2800, 0x28FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2781	categoriesRangeMap.insert("IsSupplementalArrows-B", qMakePair(0x2900, 0x297F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2782	categoriesRangeMap.insert("IsMiscellaneousMathematicalSymbols-B", qMakePair(0x2980, 0x29FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2783	categoriesRangeMap.insert("IsSupplementalMathematicalOperators", qMakePair(0x2A00, 0x2AFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2784	categoriesRangeMap.insert("IsMiscellaneousSymbolsandArrows", qMakePair(0x2B00, 0x2BFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2785	categoriesRangeMap.insert("IsGlagolitic", qMakePair(0x2C00, 0x2C5F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2786	categoriesRangeMap.insert("IsCoptic", qMakePair(0x2C80, 0x2CFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2787	categoriesRangeMap.insert("IsGeorgianSupplement", qMakePair(0x2D00, 0x2D2F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2788	categoriesRangeMap.insert("IsTifinagh", qMakePair(0x2D30, 0x2D7F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2789	categoriesRangeMap.insert("IsEthiopicExtended", qMakePair(0x2D80, 0x2DDF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2790	categoriesRangeMap.insert("IsSupplementalPunctuation", qMakePair(0x2E00, 0x2E7F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2791	categoriesRangeMap.insert("IsCJKRadicalsSupplement", qMakePair(0x2E80, 0x2EFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2792	categoriesRangeMap.insert("IsKangxiRadicals", qMakePair(0x2F00, 0x2FDF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2793	categoriesRangeMap.insert("IsIdeographicDescriptionCharacters", qMakePair(0x2FF0, 0x2FFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2794	categoriesRangeMap.insert("IsCJKSymbolsandPunctuation", qMakePair(0x3000, 0x303F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2795	categoriesRangeMap.insert("IsHiragana", qMakePair(0x3040, 0x309F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2796	categoriesRangeMap.insert("IsKatakana", qMakePair(0x30A0, 0x30FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2797	categoriesRangeMap.insert("IsBopomofo", qMakePair(0x3100, 0x312F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2798	categoriesRangeMap.insert("IsHangulCompatibilityJamo", qMakePair(0x3130, 0x318F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2799	categoriesRangeMap.insert("IsKanbun", qMakePair(0x3190, 0x319F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2800	categoriesRangeMap.insert("IsBopomofoExtended", qMakePair(0x31A0, 0x31BF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2801	categoriesRangeMap.insert("IsCJKStrokes", qMakePair(0x31C0, 0x31EF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2802	categoriesRangeMap.insert("IsKatakanaPhoneticExtensions", qMakePair(0x31F0, 0x31FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2803	categoriesRangeMap.insert("IsEnclosedCJKLettersandMonths", qMakePair(0x3200, 0x32FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2804	categoriesRangeMap.insert("IsCJKCompatibility", qMakePair(0x3300, 0x33FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2805	categoriesRangeMap.insert("IsCJKUnifiedIdeographsExtensionA", qMakePair(0x3400, 0x4DB5));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2806	categoriesRangeMap.insert("IsYijingHexagramSymbols", qMakePair(0x4DC0, 0x4DFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2807	categoriesRangeMap.insert("IsCJKUnifiedIdeographs", qMakePair(0x4E00, 0x9FFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2808	categoriesRangeMap.insert("IsYiSyllables", qMakePair(0xA000, 0xA48F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2809	categoriesRangeMap.insert("IsYiRadicals", qMakePair(0xA490, 0xA4CF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2810	categoriesRangeMap.insert("IsModifierToneLetters", qMakePair(0xA700, 0xA71F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2811	categoriesRangeMap.insert("IsSylotiNagri", qMakePair(0xA800, 0xA82F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2812	categoriesRangeMap.insert("IsHangulSyllables", qMakePair(0xAC00, 0xD7A3));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2813	categoriesRangeMap.insert("IsPrivateUse", qMakePair(0xE000, 0xF8FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2814	categoriesRangeMap.insert("IsCJKCompatibilityIdeographs", qMakePair(0xF900, 0xFAFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2815	categoriesRangeMap.insert("IsAlphabeticPresentationForms", qMakePair(0xFB00, 0xFB4F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2816	categoriesRangeMap.insert("IsArabicPresentationForms-A", qMakePair(0xFB50, 0xFDFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2817	categoriesRangeMap.insert("IsVariationSelectors", qMakePair(0xFE00, 0xFE0F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2818	categoriesRangeMap.insert("IsVerticalForms", qMakePair(0xFE10, 0xFE1F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2819	categoriesRangeMap.insert("IsCombiningHalfMarks", qMakePair(0xFE20, 0xFE2F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2820	categoriesRangeMap.insert("IsCJKCompatibilityForms", qMakePair(0xFE30, 0xFE4F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2821	categoriesRangeMap.insert("IsSmallFormVariants", qMakePair(0xFE50, 0xFE6F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2822	categoriesRangeMap.insert("IsArabicPresentationForms-B", qMakePair(0xFE70, 0xFEFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2823	categoriesRangeMap.insert("IsHalfwidthandFullwidthForms", qMakePair(0xFF00, 0xFFEF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2824	categoriesRangeMap.insert("IsSpecials", qMakePair(0xFFF0, 0xFFFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2825	categoriesRangeMap.insert("IsLinearBSyllabary", qMakePair(0x10000, 0x1007F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2826	categoriesRangeMap.insert("IsLinearBIdeograms", qMakePair(0x10080, 0x100FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2827	categoriesRangeMap.insert("IsAegeanNumbers", qMakePair(0x10100, 0x1013F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2828	categoriesRangeMap.insert("IsAncientGreekNumbers", qMakePair(0x10140, 0x1018F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2829	categoriesRangeMap.insert("IsOldItalic", qMakePair(0x10300, 0x1032F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2830	categoriesRangeMap.insert("IsGothic", qMakePair(0x10330, 0x1034F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2831	categoriesRangeMap.insert("IsUgaritic", qMakePair(0x10380, 0x1039F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2832	categoriesRangeMap.insert("IsOldPersian", qMakePair(0x103A0, 0x103DF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2833	categoriesRangeMap.insert("IsDeseret", qMakePair(0x10400, 0x1044F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2834	categoriesRangeMap.insert("IsShavian", qMakePair(0x10450, 0x1047F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2835	categoriesRangeMap.insert("IsOsmanya", qMakePair(0x10480, 0x104AF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2836	categoriesRangeMap.insert("IsCypriotSyllabary", qMakePair(0x10800, 0x1083F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2837	categoriesRangeMap.insert("IsKharoshthi", qMakePair(0x10A00, 0x10A5F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2838	categoriesRangeMap.insert("IsByzantineMusicalSymbols", qMakePair(0x1D000, 0x1D0FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2839	categoriesRangeMap.insert("IsMusicalSymbols", qMakePair(0x1D100, 0x1D1FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2840	categoriesRangeMap.insert("IsAncientGreekMusicalNotation", qMakePair(0x1D200, 0x1D24F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2841	categoriesRangeMap.insert("IsTaiXuanJingSymbols", qMakePair(0x1D300, 0x1D35F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2842	categoriesRangeMap.insert("IsMathematicalAlphanumericSymbols", qMakePair(0x1D400, 0x1D7FF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2843	categoriesRangeMap.insert("IsCJKUnifiedIdeographsExtensionB", qMakePair(0x20000, 0x2A6DF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2844	categoriesRangeMap.insert("IsCJKCompatibilityIdeographsSupplement", qMakePair(0x2F800, 0x2FA1F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2845	categoriesRangeMap.insert("IsTags", qMakePair(0xE0000, 0xE007F));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2846	categoriesRangeMap.insert("IsVariationSelectorsSupplement", qMakePair(0xE0100, 0xE01EF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2847	categoriesRangeMap.insert("IsSupplementaryPrivateUseArea-A", qMakePair(0xF0000, 0xFFFFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2848	categoriesRangeMap.insert("IsSupplementaryPrivateUseArea-B", qMakePair(0x100000, 0x10FFFF));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2849	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2850
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2851	int QRegExpEngine::getChar()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2852	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2853	return (yyPos == yyLen) ? EOS : yyIn[yyPos++].unicode();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2854	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2855
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2856	int QRegExpEngine::getEscape()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2857	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2858	#ifndef QT_NO_REGEXP_ESCAPE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2859	const char tab[] = "afnrtv"; // no b, as \b means word boundary
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2860	const char backTab[] = "\a\f\n\r\t\v";
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2861	ushort low;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2862	int i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2863	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2864	ushort val;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2865	int prevCh = yyCh;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2866
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2867	if (prevCh == EOS) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2868	error(RXERR_END);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2869	return Tok_Char \| '\\';
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2870	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2871	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2872	#ifndef QT_NO_REGEXP_ESCAPE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2873	if ((prevCh & ~0xff) == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2874	const char *p = strchr(tab, prevCh);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2875	if (p != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2876	return Tok_Char \| backTab[p - tab];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2877	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2878	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2879
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2880	switch (prevCh) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2881	#ifndef QT_NO_REGEXP_ESCAPE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2882	case '0':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2883	val = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2884	for (i = 0; i < 3; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2885	if (yyCh >= '0' && yyCh <= '7')
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2886	val = (val << 3) \| (yyCh - '0');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2887	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2888	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2889	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2890	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2891	if ((val & ~0377) != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2892	error(RXERR_OCTAL);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2893	return Tok_Char \| val;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2894	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2895	#ifndef QT_NO_REGEXP_ESCAPE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2896	case 'B':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2897	return Tok_NonWord;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2898	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2899	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2900	case 'D':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2901	// see QChar::isDigit()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2902	yyCharClass->addCategories(0x7fffffef);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2903	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2904	case 'S':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2905	// see QChar::isSpace()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2906	yyCharClass->addCategories(0x7ffff87f);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2907	yyCharClass->addRange(0x0000, 0x0008);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2908	yyCharClass->addRange(0x000e, 0x001f);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2909	yyCharClass->addRange(0x007f, 0x009f);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2910	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2911	case 'W':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2912	// see QChar::isLetterOrNumber() and QChar::isMark()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2913	yyCharClass->addCategories(0x7fe07f81);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2914	yyCharClass->addRange(0x203f, 0x2040);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2915	yyCharClass->addSingleton(0x2040);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2916	yyCharClass->addSingleton(0x2054);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2917	yyCharClass->addSingleton(0x30fb);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2918	yyCharClass->addRange(0xfe33, 0xfe34);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2919	yyCharClass->addRange(0xfe4d, 0xfe4f);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2920	yyCharClass->addSingleton(0xff3f);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2921	yyCharClass->addSingleton(0xff65);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2922	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2923	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2924	#ifndef QT_NO_REGEXP_ESCAPE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2925	case 'b':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2926	return Tok_Word;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2927	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2928	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2929	case 'd':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2930	// see QChar::isDigit()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2931	yyCharClass->addCategories(0x00000010);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2932	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2933	case 's':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2934	// see QChar::isSpace()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2935	yyCharClass->addCategories(0x00000380);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2936	yyCharClass->addRange(0x0009, 0x000d);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2937	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2938	case 'w':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2939	// see QChar::isLetterOrNumber() and QChar::isMark()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2940	yyCharClass->addCategories(0x000f807e);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2941	yyCharClass->addSingleton(0x005f); // '_'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2942	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2943	case 'I':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2944	if (xmlSchemaExtensions) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2945	yyCharClass->setNegative(!yyCharClass->negative());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2946	// fall through
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2947	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2948	case 'i':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2949	if (xmlSchemaExtensions) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2950	yyCharClass->addCategories(0x000f807e);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2951	yyCharClass->addSingleton(0x003a); // ':'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2952	yyCharClass->addSingleton(0x005f); // '_'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2953	yyCharClass->addRange(0x0041, 0x005a); // [A-Z]
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2954	yyCharClass->addRange(0x0061, 0x007a); // [a-z]
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2955	yyCharClass->addRange(0xc0, 0xd6);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2956	yyCharClass->addRange(0xd8, 0xf6);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2957	yyCharClass->addRange(0xf8, 0x2ff);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2958	yyCharClass->addRange(0x370, 0x37d);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2959	yyCharClass->addRange(0x37f, 0x1fff);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2960	yyCharClass->addRange(0x200c, 0x200d);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2961	yyCharClass->addRange(0x2070, 0x218f);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2962	yyCharClass->addRange(0x2c00, 0x2fef);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2963	yyCharClass->addRange(0x3001, 0xd7ff);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2964	yyCharClass->addRange(0xf900, 0xfdcf);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2965	yyCharClass->addRange(0xfdf0, 0xfffd);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2966	yyCharClass->addRange((ushort)0x10000, (ushort)0xeffff);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2967	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2968	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2969	case 'C':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2970	if (xmlSchemaExtensions) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2971	yyCharClass->setNegative(!yyCharClass->negative());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2972	// fall through
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2973	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2974	case 'c':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2975	if (xmlSchemaExtensions) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2976	yyCharClass->addCategories(0x000f807e);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2977	yyCharClass->addSingleton(0x002d); // '-'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2978	yyCharClass->addSingleton(0x002e); // '.'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2979	yyCharClass->addSingleton(0x003a); // ':'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2980	yyCharClass->addSingleton(0x005f); // '_'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2981	yyCharClass->addSingleton(0xb7);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2982	yyCharClass->addRange(0x0030, 0x0039); // [0-9]
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2983	yyCharClass->addRange(0x0041, 0x005a); // [A-Z]
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2984	yyCharClass->addRange(0x0061, 0x007a); // [a-z]
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2985	yyCharClass->addRange(0xc0, 0xd6);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2986	yyCharClass->addRange(0xd8, 0xf6);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2987	yyCharClass->addRange(0xf8, 0x2ff);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2988	yyCharClass->addRange(0x370, 0x37d);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2989	yyCharClass->addRange(0x37f, 0x1fff);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2990	yyCharClass->addRange(0x200c, 0x200d);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2991	yyCharClass->addRange(0x2070, 0x218f);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2992	yyCharClass->addRange(0x2c00, 0x2fef);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2993	yyCharClass->addRange(0x3001, 0xd7ff);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2994	yyCharClass->addRange(0xf900, 0xfdcf);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2995	yyCharClass->addRange(0xfdf0, 0xfffd);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2996	yyCharClass->addRange((ushort)0x10000, (ushort)0xeffff);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2997	yyCharClass->addRange(0x0300, 0x036f);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2998	yyCharClass->addRange(0x203f, 0x2040);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2999	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3000	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3001	case 'P':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3002	if (xmlSchemaExtensions) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3003	yyCharClass->setNegative(!yyCharClass->negative());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3004	// fall through
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3005	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3006	case 'p':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3007	if (xmlSchemaExtensions) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3008	if (yyCh != '{') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3009	error(RXERR_CHARCLASS);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3010	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3011	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3012
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3013	QByteArray category;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3014	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3015	while (yyCh != '}') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3016	if (yyCh == EOS) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3017	error(RXERR_END);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3018	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3019	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3020	category.append(yyCh);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3021	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3022	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3023	yyCh = getChar(); // skip closing '}'
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3024
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3025	if (category == "M") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3026	yyCharClass->addCategories(0x0000000e);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3027	} else if (category == "Mn") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3028	yyCharClass->addCategories(0x00000002);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3029	} else if (category == "Mc") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3030	yyCharClass->addCategories(0x00000004);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3031	} else if (category == "Me") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3032	yyCharClass->addCategories(0x00000008);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3033	} else if (category == "N") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3034	yyCharClass->addCategories(0x00000070);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3035	} else if (category == "Nd") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3036	yyCharClass->addCategories(0x00000010);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3037	} else if (category == "Nl") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3038	yyCharClass->addCategories(0x00000020);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3039	} else if (category == "No") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3040	yyCharClass->addCategories(0x00000040);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3041	} else if (category == "Z") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3042	yyCharClass->addCategories(0x00000380);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3043	} else if (category == "Zs") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3044	yyCharClass->addCategories(0x00000080);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3045	} else if (category == "Zl") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3046	yyCharClass->addCategories(0x00000100);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3047	} else if (category == "Zp") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3048	yyCharClass->addCategories(0x00000200);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3049	} else if (category == "C") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3050	yyCharClass->addCategories(0x00006c00);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3051	} else if (category == "Cc") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3052	yyCharClass->addCategories(0x00000400);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3053	} else if (category == "Cf") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3054	yyCharClass->addCategories(0x00000800);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3055	} else if (category == "Cs") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3056	yyCharClass->addCategories(0x00001000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3057	} else if (category == "Co") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3058	yyCharClass->addCategories(0x00002000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3059	} else if (category == "Cn") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3060	yyCharClass->addCategories(0x00004000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3061	} else if (category == "L") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3062	yyCharClass->addCategories(0x000f8000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3063	} else if (category == "Lu") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3064	yyCharClass->addCategories(0x00008000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3065	} else if (category == "Ll") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3066	yyCharClass->addCategories(0x00010000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3067	} else if (category == "Lt") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3068	yyCharClass->addCategories(0x00020000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3069	} else if (category == "Lm") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3070	yyCharClass->addCategories(0x00040000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3071	} else if (category == "Lo") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3072	yyCharClass->addCategories(0x00080000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3073	} else if (category == "P") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3074	yyCharClass->addCategories(0x4f580780);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3075	} else if (category == "Pc") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3076	yyCharClass->addCategories(0x00100000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3077	} else if (category == "Pd") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3078	yyCharClass->addCategories(0x00200000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3079	} else if (category == "Ps") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3080	yyCharClass->addCategories(0x00400000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3081	} else if (category == "Pe") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3082	yyCharClass->addCategories(0x00800000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3083	} else if (category == "Pi") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3084	yyCharClass->addCategories(0x01000000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3085	} else if (category == "Pf") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3086	yyCharClass->addCategories(0x02000000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3087	} else if (category == "Po") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3088	yyCharClass->addCategories(0x04000000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3089	} else if (category == "S") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3090	yyCharClass->addCategories(0x78000000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3091	} else if (category == "Sm") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3092	yyCharClass->addCategories(0x08000000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3093	} else if (category == "Sc") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3094	yyCharClass->addCategories(0x10000000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3095	} else if (category == "Sk") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3096	yyCharClass->addCategories(0x20000000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3097	} else if (category == "So") {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3098	yyCharClass->addCategories(0x40000000);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3099	} else if (category.startsWith("Is")) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3100	if (categoriesRangeMap.isEmpty())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3101	setupCategoriesRangeMap();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3102
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3103	if (categoriesRangeMap.contains(category)) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3104	const QPair<int, int> range = categoriesRangeMap.value(category);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3105	yyCharClass->addRange(range.first, range.second);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3106	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3107	error(RXERR_CATEGORY);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3108	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3109	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3110	error(RXERR_CATEGORY);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3111	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3112	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3113	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3114	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3115	#ifndef QT_NO_REGEXP_ESCAPE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3116	case 'x':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3117	val = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3118	for (i = 0; i < 4; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3119	low = QChar(yyCh).toLower().unicode();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3120	if (low >= '0' && low <= '9')
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3121	val = (val << 4) \| (low - '0');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3122	else if (low >= 'a' && low <= 'f')
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3123	val = (val << 4) \| (low - 'a' + 10);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3124	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3125	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3126	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3127	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3128	return Tok_Char \| val;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3129	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3130	default:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3131	if (prevCh >= '1' && prevCh <= '9') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3132	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3133	val = prevCh - '0';
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3134	while (yyCh >= '0' && yyCh <= '9') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3135	val = (val * 10) + (yyCh - '0');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3136	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3137	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3138	return Tok_BackRef \| val;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3139	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3140	error(RXERR_DISABLED);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3141	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3142	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3143	return Tok_Char \| prevCh;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3144	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3145	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3146
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3147	#ifndef QT_NO_REGEXP_INTERVAL
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3148	int QRegExpEngine::getRep(int def)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3149	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3150	if (yyCh >= '0' && yyCh <= '9') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3151	int rep = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3152	do {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3153	rep = 10 * rep + yyCh - '0';
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3154	if (rep >= InftyRep) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3155	error(RXERR_REPETITION);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3156	rep = def;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3157	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3158	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3159	} while (yyCh >= '0' && yyCh <= '9');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3160	return rep;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3161	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3162	return def;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3163	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3164	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3165	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3166
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3167	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3168	void QRegExpEngine::skipChars(int n)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3169	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3170	if (n > 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3171	yyPos += n - 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3172	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3173	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3174	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3175	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3176
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3177	void QRegExpEngine::error(const char *msg)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3178	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3179	if (yyError.isEmpty())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3180	yyError = QLatin1String(msg);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3181	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3182
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3183	void QRegExpEngine::startTokenizer(const QChar *rx, int len)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3184	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3185	yyIn = rx;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3186	yyPos0 = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3187	yyPos = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3188	yyLen = len;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3189	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3190	yyCharClass.reset(new QRegExpCharClass);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3191	yyMinRep = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3192	yyMaxRep = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3193	yyError = QString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3194	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3195
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3196	int QRegExpEngine::getToken()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3197	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3198	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3199	ushort pendingCh = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3200	bool charPending;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3201	bool rangePending;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3202	int tok;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3203	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3204	int prevCh = yyCh;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3205
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3206	yyPos0 = yyPos - 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3207	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3208	yyCharClass->clear();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3209	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3210	yyMinRep = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3211	yyMaxRep = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3212	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3213
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3214	switch (prevCh) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3215	case EOS:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3216	yyPos0 = yyPos;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3217	return Tok_Eos;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3218	case '$':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3219	return Tok_Dollar;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3220	case '(':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3221	if (yyCh == '?') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3222	prevCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3223	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3224	switch (prevCh) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3225	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3226	case '!':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3227	return Tok_NegLookahead;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3228	case '=':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3229	return Tok_PosLookahead;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3230	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3231	case ':':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3232	return Tok_MagicLeftParen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3233	default:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3234	error(RXERR_LOOKAHEAD);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3235	return Tok_MagicLeftParen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3236	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3237	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3238	return Tok_LeftParen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3239	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3240	case ')':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3241	return Tok_RightParen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3242	case '*':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3243	yyMinRep = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3244	yyMaxRep = InftyRep;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3245	return Tok_Quantifier;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3246	case '+':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3247	yyMinRep = 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3248	yyMaxRep = InftyRep;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3249	return Tok_Quantifier;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3250	case '.':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3251	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3252	yyCharClass->setNegative(true);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3253	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3254	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3255	case '?':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3256	yyMinRep = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3257	yyMaxRep = 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3258	return Tok_Quantifier;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3259	case '[':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3260	#ifndef QT_NO_REGEXP_CCLASS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3261	if (yyCh == '^') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3262	yyCharClass->setNegative(true);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3263	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3264	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3265	charPending = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3266	rangePending = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3267	do {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3268	if (yyCh == '-' && charPending && !rangePending) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3269	rangePending = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3270	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3271	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3272	if (charPending && !rangePending) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3273	yyCharClass->addSingleton(pendingCh);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3274	charPending = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3275	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3276	if (yyCh == '\\') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3277	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3278	tok = getEscape();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3279	if (tok == Tok_Word)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3280	tok = '\b';
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3281	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3282	tok = Tok_Char \| yyCh;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3283	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3284	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3285	if (tok == Tok_CharClass) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3286	if (rangePending) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3287	yyCharClass->addSingleton('-');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3288	yyCharClass->addSingleton(pendingCh);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3289	charPending = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3290	rangePending = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3291	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3292	} else if ((tok & Tok_Char) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3293	if (rangePending) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3294	yyCharClass->addRange(pendingCh, tok ^ Tok_Char);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3295	charPending = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3296	rangePending = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3297	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3298	pendingCh = tok ^ Tok_Char;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3299	charPending = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3300	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3301	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3302	error(RXERR_CHARCLASS);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3303	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3304	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3305	} while (yyCh != ']' && yyCh != EOS);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3306	if (rangePending)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3307	yyCharClass->addSingleton('-');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3308	if (charPending)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3309	yyCharClass->addSingleton(pendingCh);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3310	if (yyCh == EOS)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3311	error(RXERR_END);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3312	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3313	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3314	return Tok_CharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3315	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3316	error(RXERR_END);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3317	return Tok_Char \| '[';
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3318	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3319	case '\\':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3320	return getEscape();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3321	case ']':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3322	error(RXERR_LEFTDELIM);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3323	return Tok_Char \| ']';
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3324	case '^':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3325	return Tok_Caret;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3326	case '{':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3327	#ifndef QT_NO_REGEXP_INTERVAL
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3328	yyMinRep = getRep(0);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3329	yyMaxRep = yyMinRep;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3330	if (yyCh == ',') {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3331	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3332	yyMaxRep = getRep(InftyRep);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3333	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3334	if (yyMaxRep < yyMinRep)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3335	error(RXERR_INTERVAL);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3336	if (yyCh != '}')
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3337	error(RXERR_REPETITION);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3338	yyCh = getChar();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3339	return Tok_Quantifier;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3340	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3341	error(RXERR_DISABLED);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3342	return Tok_Char \| '{';
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3343	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3344	case '\|':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3345	return Tok_Bar;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3346	case '}':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3347	error(RXERR_LEFTDELIM);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3348	return Tok_Char \| '}';
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3349	default:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3350	return Tok_Char \| prevCh;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3351	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3352	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3353
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3354	int QRegExpEngine::parse(const QChar *pattern, int len)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3355	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3356	valid = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3357	startTokenizer(pattern, len);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3358	yyTok = getToken();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3359	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3360	yyMayCapture = true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3361	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3362	yyMayCapture = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3363	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3364
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3365	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3366	int atom = startAtom(false);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3367	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3368	QRegExpCharClass anything;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3369	Box box(this); // create InitialState
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3370	box.set(anything);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3371	Box rightBox(this); // create FinalState
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3372	rightBox.set(anything);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3373
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3374	Box middleBox(this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3375	parseExpression(&middleBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3376	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3377	finishAtom(atom, false);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3378	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3379	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3380	middleBox.setupHeuristics();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3381	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3382	box.cat(middleBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3383	box.cat(rightBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3384	yyCharClass.reset(0);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3385
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3386	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3387	for (int i = 0; i < nf; ++i) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3388	switch (f[i].capture) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3389	case QRegExpAtom::NoCapture:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3390	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3391	case QRegExpAtom::OfficialCapture:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3392	f[i].capture = ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3393	captureForOfficialCapture.append(ncap);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3394	++ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3395	++officialncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3396	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3397	case QRegExpAtom::UnofficialCapture:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3398	f[i].capture = greedyQuantifiers ? ncap++ : QRegExpAtom::NoCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3399	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3400	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3401
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3402	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3403	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3404	if (officialncap == 0 && nbrefs == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3405	ncap = nf = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3406	f.clear();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3407	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3408	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3409	// handle the case where there's a \5 with no corresponding capture
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3410	// (captureForOfficialCapture.size() != officialncap)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3411	for (int i = 0; i < nbrefs - officialncap; ++i) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3412	captureForOfficialCapture.append(ncap);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3413	++ncap;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3414	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3415	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3416	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3417
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3418	if (!yyError.isEmpty())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3419	return -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3420
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3421	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3422	const QRegExpAutomatonState &sinit = s.at(InitialState);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3423	caretAnchored = !sinit.anchors.isEmpty();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3424	if (caretAnchored) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3425	const QMap<int, int> &anchors = sinit.anchors;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3426	QMap<int, int>::const_iterator a;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3427	for (a = anchors.constBegin(); a != anchors.constEnd(); ++a) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3428	if (
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3429	#ifndef QT_NO_REGEXP_ANCHOR_ALT
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3430	(*a & Anchor_Alternation) != 0 \|\|
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3431	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3432	(*a & Anchor_Caret) == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3433	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3434	caretAnchored = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3435	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3436	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3437	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3438	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3439	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3440
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3441	// cleanup anchors
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3442	int numStates = s.count();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3443	for (int i = 0; i < numStates; ++i) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3444	QRegExpAutomatonState &state = s[i];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3445	if (!state.anchors.isEmpty()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3446	QMap<int, int>::iterator a = state.anchors.begin();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3447	while (a != state.anchors.end()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3448	if (a.value() == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3449	a = state.anchors.erase(a);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3450	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3451	++a;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3452	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3453	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3454	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3455
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3456	return yyPos0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3457	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3458
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3459	void QRegExpEngine::parseAtom(Box *box)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3460	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3461	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3462	QRegExpEngine *eng = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3463	bool neg;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3464	int len;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3465	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3466
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3467	if ((yyTok & Tok_Char) != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3468	box->set(QChar(yyTok ^ Tok_Char));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3469	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3470	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3471	trivial = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3472	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3473	switch (yyTok) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3474	case Tok_Dollar:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3475	box->catAnchor(Anchor_Dollar);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3476	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3477	case Tok_Caret:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3478	box->catAnchor(Anchor_Caret);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3479	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3480	#ifndef QT_NO_REGEXP_LOOKAHEAD
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3481	case Tok_PosLookahead:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3482	case Tok_NegLookahead:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3483	neg = (yyTok == Tok_NegLookahead);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3484	eng = new QRegExpEngine(cs, greedyQuantifiers);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3485	len = eng->parse(yyIn + yyPos - 1, yyLen - yyPos + 1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3486	if (len >= 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3487	skipChars(len);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3488	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3489	error(RXERR_LOOKAHEAD);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3490	box->catAnchor(addLookahead(eng, neg));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3491	yyTok = getToken();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3492	if (yyTok != Tok_RightParen)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3493	error(RXERR_LOOKAHEAD);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3494	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3495	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3496	#ifndef QT_NO_REGEXP_ESCAPE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3497	case Tok_Word:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3498	box->catAnchor(Anchor_Word);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3499	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3500	case Tok_NonWord:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3501	box->catAnchor(Anchor_NonWord);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3502	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3503	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3504	case Tok_LeftParen:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3505	case Tok_MagicLeftParen:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3506	yyTok = getToken();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3507	parseExpression(box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3508	if (yyTok != Tok_RightParen)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3509	error(RXERR_END);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3510	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3511	case Tok_CharClass:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3512	box->set(*yyCharClass);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3513	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3514	case Tok_Quantifier:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3515	error(RXERR_REPETITION);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3516	break;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3517	default:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3518	#ifndef QT_NO_REGEXP_BACKREF
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3519	if ((yyTok & Tok_BackRef) != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3520	box->set(yyTok ^ Tok_BackRef);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3521	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3522	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3523	error(RXERR_DISABLED);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3524	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3525	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3526	yyTok = getToken();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3527	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3528
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3529	void QRegExpEngine::parseFactor(Box *box)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3530	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3531	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3532	int outerAtom = greedyQuantifiers ? startAtom(false) : -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3533	int innerAtom = startAtom(yyMayCapture && yyTok == Tok_LeftParen);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3534	bool magicLeftParen = (yyTok == Tok_MagicLeftParen);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3535	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3536	const int innerAtom = -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3537	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3538
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3539	#ifndef QT_NO_REGEXP_INTERVAL
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3540	#define YYREDO() \
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3541	yyIn = in, yyPos0 = pos0, yyPos = pos, yyLen = len, yyCh = ch, \
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3542	*yyCharClass = charClass, yyMinRep = 0, yyMaxRep = 0, yyTok = tok
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3543
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3544	const QChar *in = yyIn;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3545	int pos0 = yyPos0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3546	int pos = yyPos;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3547	int len = yyLen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3548	int ch = yyCh;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3549	QRegExpCharClass charClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3550	if (yyTok == Tok_CharClass)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3551	charClass = *yyCharClass;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3552	int tok = yyTok;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3553	bool mayCapture = yyMayCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3554	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3555
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3556	parseAtom(box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3557	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3558	finishAtom(innerAtom, magicLeftParen);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3559	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3560
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3561	bool hasQuantifier = (yyTok == Tok_Quantifier);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3562	if (hasQuantifier) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3563	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3564	trivial = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3565	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3566	if (yyMaxRep == InftyRep) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3567	box->plus(innerAtom);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3568	#ifndef QT_NO_REGEXP_INTERVAL
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3569	} else if (yyMaxRep == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3570	box->clear();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3571	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3572	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3573	if (yyMinRep == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3574	box->opt();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3575
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3576	#ifndef QT_NO_REGEXP_INTERVAL
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3577	yyMayCapture = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3578	int alpha = (yyMinRep == 0) ? 0 : yyMinRep - 1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3579	int beta = (yyMaxRep == InftyRep) ? 0 : yyMaxRep - (alpha + 1);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3580
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3581	Box rightBox(this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3582	int i;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3583
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3584	for (i = 0; i < beta; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3585	YYREDO();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3586	Box leftBox(this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3587	parseAtom(&leftBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3588	leftBox.cat(rightBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3589	leftBox.opt();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3590	rightBox = leftBox;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3591	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3592	for (i = 0; i < alpha; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3593	YYREDO();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3594	Box leftBox(this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3595	parseAtom(&leftBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3596	leftBox.cat(rightBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3597	rightBox = leftBox;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3598	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3599	rightBox.cat(*box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3600	*box = rightBox;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3601	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3602	yyTok = getToken();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3603	#ifndef QT_NO_REGEXP_INTERVAL
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3604	yyMayCapture = mayCapture;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3605	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3606	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3607	#undef YYREDO
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3608	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3609	if (greedyQuantifiers)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3610	finishAtom(outerAtom, hasQuantifier);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3611	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3612	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3613
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3614	void QRegExpEngine::parseTerm(Box *box)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3615	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3616	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3617	if (yyTok != Tok_Eos && yyTok != Tok_RightParen && yyTok != Tok_Bar)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3618	parseFactor(box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3619	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3620	while (yyTok != Tok_Eos && yyTok != Tok_RightParen && yyTok != Tok_Bar) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3621	Box rightBox(this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3622	parseFactor(&rightBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3623	box->cat(rightBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3624	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3625	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3626
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3627	void QRegExpEngine::parseExpression(Box *box)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3628	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3629	parseTerm(box);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3630	while (yyTok == Tok_Bar) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3631	#ifndef QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3632	trivial = false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3633	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3634	Box rightBox(this);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3635	yyTok = getToken();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3636	parseTerm(&rightBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3637	box->orx(rightBox);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3638	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3639	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3640
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3641	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3642	The struct QRegExpPrivate contains the private data of a regular
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3643	expression other than the automaton. It makes it possible for many
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3644	QRegExp objects to use the same QRegExpEngine object with different
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3645	QRegExpPrivate objects.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3646	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3647	struct QRegExpPrivate
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3648	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3649	QRegExpEngine *eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3650	QRegExpEngineKey engineKey;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3651	bool minimal;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3652	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3653	QString t; // last string passed to QRegExp::indexIn() or lastIndexIn()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3654	QStringList capturedCache; // what QRegExp::capturedTexts() returned last
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3655	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3656	QRegExpMatchState matchState;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3657
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3658	inline QRegExpPrivate()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3659	: eng(0), engineKey(QString(), QRegExp::RegExp, Qt::CaseSensitive), minimal(false) { }
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3660	inline QRegExpPrivate(const QRegExpEngineKey &key)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3661	: eng(0), engineKey(key), minimal(false) {}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3662	};
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3663
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3664	#if !defined(QT_NO_REGEXP_OPTIM)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3665	uint qHash(const QRegExpEngineKey &key)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3666	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3667	return qHash(key.pattern);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3668	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3669
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3670	typedef QCache<QRegExpEngineKey, QRegExpEngine> EngineCache;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3671	Q_GLOBAL_STATIC(EngineCache, globalEngineCache)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3672	Q_GLOBAL_STATIC(QMutex, mutex)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3673	#endif // QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3674
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3675	static void derefEngine(QRegExpEngine *eng, const QRegExpEngineKey &key)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3676	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3677	if (!eng->ref.deref()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3678	#if !defined(QT_NO_REGEXP_OPTIM)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3679	if (globalEngineCache()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3680	QMutexLocker locker(mutex());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3681	QT_TRY {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3682	globalEngineCache()->insert(key, eng, 4 + key.pattern.length() / 4);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3683	} QT_CATCH(const std::bad_alloc &) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3684	// in case of an exception (e.g. oom), just delete the engine
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3685	delete eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3686	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3687	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3688	delete eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3689	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3690	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3691	Q_UNUSED(key);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3692	delete eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3693	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3694	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3695	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3696
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3697	static void prepareEngine_helper(QRegExpPrivate *priv)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3698	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3699	bool initMatchState = !priv->eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3700	#if !defined(QT_NO_REGEXP_OPTIM)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3701	if (!priv->eng && globalEngineCache()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3702	QMutexLocker locker(mutex());
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3703	priv->eng = globalEngineCache()->take(priv->engineKey);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3704	if (priv->eng != 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3705	priv->eng->ref.ref();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3706	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3707	#endif // QT_NO_REGEXP_OPTIM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3708
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3709	if (!priv->eng)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3710	priv->eng = new QRegExpEngine(priv->engineKey);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3711
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3712	if (initMatchState)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3713	priv->matchState.prepareForMatch(priv->eng);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3714	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3715
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3716	inline static void prepareEngine(QRegExpPrivate *priv)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3717	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3718	if (priv->eng)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3719	return;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3720	prepareEngine_helper(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3721	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3722
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3723	static void prepareEngineForMatch(QRegExpPrivate *priv, const QString &str)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3724	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3725	prepareEngine(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3726	priv->matchState.prepareForMatch(priv->eng);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3727	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3728	priv->t = str;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3729	priv->capturedCache.clear();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3730	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3731	Q_UNUSED(str);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3732	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3733	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3734
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3735	static void invalidateEngine(QRegExpPrivate *priv)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3736	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3737	if (priv->eng != 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3738	derefEngine(priv->eng, priv->engineKey);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3739	priv->eng = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3740	priv->matchState.drain();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3741	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3742	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3743
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3744	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3745	\enum QRegExp::CaretMode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3746
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3747	The CaretMode enum defines the different meanings of the caret
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3748	(\bold{^}) in a regular expression. The possible values are:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3749
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3750	\value CaretAtZero
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3751	The caret corresponds to index 0 in the searched string.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3752
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3753	\value CaretAtOffset
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3754	The caret corresponds to the start offset of the search.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3755
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3756	\value CaretWontMatch
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3757	The caret never matches.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3758	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3759
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3760	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3761	\enum QRegExp::PatternSyntax
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3762
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3763	The syntax used to interpret the meaning of the pattern.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3764
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3765	\value RegExp A rich Perl-like pattern matching syntax. This is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3766	the default.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3767
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3768	\value RegExp2 Like RegExp, but with \l{greedy quantifiers}. This
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3769	will be the default in Qt 5. (Introduced in Qt 4.2.)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3770
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3771	\value Wildcard This provides a simple pattern matching syntax
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3772	similar to that used by shells (command interpreters) for "file
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3773	globbing". See \l{Wildcard Matching}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3774
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3775	\value WildcardUnix This is similar to Wildcard but with the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3776	behavior of a Unix shell. The wildcard characters can be escaped
7 3f74d0d4af4c qt:70947f0f93d948bc89b3b43d00da758a51f1ef84 Eckhart Koeppen <eckhart.koppen@nokia.com> parents: 4 diff changeset	3777	with the character "\\".
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3778
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3779	\value FixedString The pattern is a fixed string. This is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3780	equivalent to using the RegExp pattern on a string in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3781	which all metacharacters are escaped using escape().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3782
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3783	\value W3CXmlSchema11 The pattern is a regular expression as
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3784	defined by the W3C XML Schema 1.1 specification.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3785
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3786	\sa setPatternSyntax()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3787	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3788
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3789	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3790	Constructs an empty regexp.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3791
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3792	\sa isValid(), errorString()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3793	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3794	QRegExp::QRegExp()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3795	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3796	priv = new QRegExpPrivate;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3797	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3798
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3799	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3800	Constructs a regular expression object for the given \a pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3801	string. The pattern must be given using wildcard notation if \a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3802	syntax is \l Wildcard; the default is \l RegExp. The pattern is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3803	case sensitive, unless \a cs is Qt::CaseInsensitive. Matching is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3804	greedy (maximal), but can be changed by calling
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3805	setMinimal().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3806
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3807	\sa setPattern(), setCaseSensitivity(), setPatternSyntax()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3808	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3809	QRegExp::QRegExp(const QString &pattern, Qt::CaseSensitivity cs, PatternSyntax syntax)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3810	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3811	priv = new QRegExpPrivate(QRegExpEngineKey(pattern, syntax, cs));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3812	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3813
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3814	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3815	Constructs a regular expression as a copy of \a rx.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3816
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3817	\sa operator=()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3818	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3819	QRegExp::QRegExp(const QRegExp &rx)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3820	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3821	priv = new QRegExpPrivate;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3822	operator=(rx);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3823	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3824
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3825	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3826	Destroys the regular expression and cleans up its internal data.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3827	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3828	QRegExp::~QRegExp()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3829	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3830	invalidateEngine(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3831	delete priv;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3832	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3833
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3834	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3835	Copies the regular expression \a rx and returns a reference to the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3836	copy. The case sensitivity, wildcard, and minimal matching options
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3837	are also copied.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3838	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3839	QRegExp &QRegExp::operator=(const QRegExp &rx)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3840	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3841	prepareEngine(rx.priv); // to allow sharing
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3842	QRegExpEngine *otherEng = rx.priv->eng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3843	if (otherEng)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3844	otherEng->ref.ref();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3845	invalidateEngine(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3846	priv->eng = otherEng;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3847	priv->engineKey = rx.priv->engineKey;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3848	priv->minimal = rx.priv->minimal;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3849	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3850	priv->t = rx.priv->t;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3851	priv->capturedCache = rx.priv->capturedCache;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3852	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3853	if (priv->eng)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3854	priv->matchState.prepareForMatch(priv->eng);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3855	priv->matchState.captured = rx.priv->matchState.captured;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3856	return *this;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3857	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3858
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3859	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3860	Returns true if this regular expression is equal to \a rx;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3861	otherwise returns false.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3862
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3863	Two QRegExp objects are equal if they have the same pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3864	strings and the same settings for case sensitivity, wildcard and
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3865	minimal matching.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3866	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3867	bool QRegExp::operator==(const QRegExp &rx) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3868	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3869	return priv->engineKey == rx.priv->engineKey && priv->minimal == rx.priv->minimal;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3870	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3871
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3872	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3873	\fn bool QRegExp::operator!=(const QRegExp &rx) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3874
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3875	Returns true if this regular expression is not equal to \a rx;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3876	otherwise returns false.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3877
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3878	\sa operator==()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3879	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3880
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3881	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3882	Returns true if the pattern string is empty; otherwise returns
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3883	false.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3884
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3885	If you call exactMatch() with an empty pattern on an empty string
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3886	it will return true; otherwise it returns false since it operates
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3887	over the whole string. If you call indexIn() with an empty pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3888	on \e any string it will return the start offset (0 by default)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3889	because the empty pattern matches the 'emptiness' at the start of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3890	the string. In this case the length of the match returned by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3891	matchedLength() will be 0.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3892
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3893	See QString::isEmpty().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3894	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3895
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3896	bool QRegExp::isEmpty() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3897	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3898	return priv->engineKey.pattern.isEmpty();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3899	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3900
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3901	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3902	Returns true if the regular expression is valid; otherwise returns
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3903	false. An invalid regular expression never matches.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3904
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3905	The pattern \bold{[a-z} is an example of an invalid pattern, since
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3906	it lacks a closing square bracket.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3907
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3908	Note that the validity of a regexp may also depend on the setting
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3909	of the wildcard flag, for example \bold{*.html} is a valid
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3910	wildcard regexp but an invalid full regexp.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3911
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3912	\sa errorString()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3913	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3914	bool QRegExp::isValid() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3915	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3916	if (priv->engineKey.pattern.isEmpty()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3917	return true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3918	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3919	prepareEngine(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3920	return priv->eng->isValid();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3921	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3922	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3923
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3924	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3925	Returns the pattern string of the regular expression. The pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3926	has either regular expression syntax or wildcard syntax, depending
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3927	on patternSyntax().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3928
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3929	\sa patternSyntax(), caseSensitivity()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3930	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3931	QString QRegExp::pattern() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3932	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3933	return priv->engineKey.pattern;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3934	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3935
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3936	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3937	Sets the pattern string to \a pattern. The case sensitivity,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3938	wildcard, and minimal matching options are not changed.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3939
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3940	\sa setPatternSyntax(), setCaseSensitivity()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3941	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3942	void QRegExp::setPattern(const QString &pattern)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3943	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3944	if (priv->engineKey.pattern != pattern) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3945	invalidateEngine(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3946	priv->engineKey.pattern = pattern;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3947	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3948	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3949
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3950	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3951	Returns Qt::CaseSensitive if the regexp is matched case
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3952	sensitively; otherwise returns Qt::CaseInsensitive.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3953
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3954	\sa patternSyntax(), pattern(), isMinimal()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3955	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3956	Qt::CaseSensitivity QRegExp::caseSensitivity() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3957	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3958	return priv->engineKey.cs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3959	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3960
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3961	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3962	Sets case sensitive matching to \a cs.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3963
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3964	If \a cs is Qt::CaseSensitive, \bold{\\.txt$} matches
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3965	\c{readme.txt} but not \c{README.TXT}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3966
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3967	\sa setPatternSyntax(), setPattern(), setMinimal()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3968	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3969	void QRegExp::setCaseSensitivity(Qt::CaseSensitivity cs)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3970	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3971	if ((bool)cs != (bool)priv->engineKey.cs) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3972	invalidateEngine(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3973	priv->engineKey.cs = cs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3974	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3975	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3976
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3977	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3978	Returns the syntax used by the regular expression. The default is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3979	QRegExp::RegExp.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3980
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3981	\sa pattern(), caseSensitivity()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3982	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3983	QRegExp::PatternSyntax QRegExp::patternSyntax() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3984	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3985	return priv->engineKey.patternSyntax;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3986	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3987
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3988	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3989	Sets the syntax mode for the regular expression. The default is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3990	QRegExp::RegExp.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3991
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3992	Setting \a syntax to QRegExp::Wildcard enables simple shell-like
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3993	\l{wildcard matching}. For example, \bold{r*.txt} matches the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3994	string \c{readme.txt} in wildcard mode, but does not match
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3995	\c{readme}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3996
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3997	Setting \a syntax to QRegExp::FixedString means that the pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3998	is interpreted as a plain string. Special characters (e.g.,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3999	backslash) don't need to be escaped then.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4000
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4001	\sa setPattern(), setCaseSensitivity(), escape()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4002	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4003	void QRegExp::setPatternSyntax(PatternSyntax syntax)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4004	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4005	if (syntax != priv->engineKey.patternSyntax) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4006	invalidateEngine(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4007	priv->engineKey.patternSyntax = syntax;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4008	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4009	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4010
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4011	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4012	Returns true if minimal (non-greedy) matching is enabled;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4013	otherwise returns false.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4014
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4015	\sa caseSensitivity(), setMinimal()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4016	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4017	bool QRegExp::isMinimal() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4018	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4019	return priv->minimal;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4020	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4021
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4022	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4023	Enables or disables minimal matching. If \a minimal is false,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4024	matching is greedy (maximal) which is the default.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4025
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4026	For example, suppose we have the input string "We must be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4027	<b>bold</b>, very <b>bold</b>!" and the pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4028	\bold{<b>.*</b>}. With the default greedy (maximal) matching,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4029	the match is "We must be \underline{<b>bold</b>, very
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4030	<b>bold</b>}!". But with minimal (non-greedy) matching, the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4031	first match is: "We must be \underline{<b>bold</b>}, very
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4032	<b>bold</b>!" and the second match is "We must be <b>bold</b>,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4033	very \underline{<b>bold</b>}!". In practice we might use the pattern
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4034	\bold{<b>[^<]*\</b>} instead, although this will still fail for
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4035	nested tags.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4036
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4037	\sa setCaseSensitivity()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4038	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4039	void QRegExp::setMinimal(bool minimal)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4040	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4041	priv->minimal = minimal;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4042	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4043
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4044	// ### Qt 5: make non-const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4045	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4046	Returns true if \a str is matched exactly by this regular
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4047	expression; otherwise returns false. You can determine how much of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4048	the string was matched by calling matchedLength().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4049
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4050	For a given regexp string R, exactMatch("R") is the equivalent of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4051	indexIn("^R$") since exactMatch() effectively encloses the regexp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4052	in the start of string and end of string anchors, except that it
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4053	sets matchedLength() differently.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4054
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4055	For example, if the regular expression is \bold{blue}, then
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4056	exactMatch() returns true only for input \c blue. For inputs \c
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4057	bluebell, \c blutak and \c lightblue, exactMatch() returns false
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4058	and matchedLength() will return 4, 3 and 0 respectively.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4059
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4060	Although const, this function sets matchedLength(),
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4061	capturedTexts(), and pos().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4062
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4063	\sa indexIn(), lastIndexIn()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4064	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4065	bool QRegExp::exactMatch(const QString &str) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4066	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4067	prepareEngineForMatch(priv, str);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4068	priv->matchState.match(str.unicode(), str.length(), 0, priv->minimal, true, 0);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4069	if (priv->matchState.captured[1] == str.length()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4070	return true;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4071	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4072	priv->matchState.captured[0] = 0;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4073	priv->matchState.captured[1] = priv->matchState.oneTestMatchedLen;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4074	return false;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4075	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4076	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4077
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4078	// ### Qt 5: make non-const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4079	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4080	Attempts to find a match in \a str from position \a offset (0 by
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4081	default). If \a offset is -1, the search starts at the last
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4082	character; if -2, at the next to last character; etc.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4083
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4084	Returns the position of the first match, or -1 if there was no
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4085	match.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4086
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4087	The \a caretMode parameter can be used to instruct whether \bold{^}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4088	should match at index 0 or at \a offset.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4089
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4090	You might prefer to use QString::indexOf(), QString::contains(),
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4091	or even QStringList::filter(). To replace matches use
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4092	QString::replace().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4093
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4094	Example:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4095	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 13
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4096
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4097	Although const, this function sets matchedLength(),
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4098	capturedTexts() and pos().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4099
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4100	If the QRegExp is a wildcard expression (see setPatternSyntax())
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4101	and want to test a string against the whole wildcard expression,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4102	use exactMatch() instead of this function.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4103
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4104	\sa lastIndexIn(), exactMatch()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4105	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4106
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4107	int QRegExp::indexIn(const QString &str, int offset, CaretMode caretMode) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4108	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4109	prepareEngineForMatch(priv, str);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4110	if (offset < 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4111	offset += str.length();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4112	priv->matchState.match(str.unicode(), str.length(), offset,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4113	priv->minimal, false, caretIndex(offset, caretMode));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4114	return priv->matchState.captured[0];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4115	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4116
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4117	// ### Qt 5: make non-const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4118	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4119	Attempts to find a match backwards in \a str from position \a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4120	offset. If \a offset is -1 (the default), the search starts at the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4121	last character; if -2, at the next to last character; etc.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4122
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4123	Returns the position of the first match, or -1 if there was no
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4124	match.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4125
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4126	The \a caretMode parameter can be used to instruct whether \bold{^}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4127	should match at index 0 or at \a offset.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4128
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4129	Although const, this function sets matchedLength(),
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4130	capturedTexts() and pos().
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4131
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4132	\warning Searching backwards is much slower than searching
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4133	forwards.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4134
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4135	\sa indexIn(), exactMatch()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4136	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4137
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4138	int QRegExp::lastIndexIn(const QString &str, int offset, CaretMode caretMode) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4139	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4140	prepareEngineForMatch(priv, str);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4141	if (offset < 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4142	offset += str.length();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4143	if (offset < 0 \|\| offset > str.length()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4144	memset(priv->matchState.captured, -1, priv->matchState.capturedSize*sizeof(int));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4145	return -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4146	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4147
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4148	while (offset >= 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4149	priv->matchState.match(str.unicode(), str.length(), offset,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4150	priv->minimal, true, caretIndex(offset, caretMode));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4151	if (priv->matchState.captured[0] == offset)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4152	return offset;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4153	--offset;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4154	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4155	return -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4156	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4157
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4158	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4159	Returns the length of the last matched string, or -1 if there was
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4160	no match.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4161
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4162	\sa exactMatch(), indexIn(), lastIndexIn()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4163	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4164	int QRegExp::matchedLength() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4165	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4166	return priv->matchState.captured[1];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4167	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4168
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4169	#ifndef QT_NO_REGEXP_CAPTURE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4170	/*!
3 41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4171	\obsolete
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4172	Returns the number of captures contained in the regular expression.
3 41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4173
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4174	\sa captureCount()
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4175	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4176	int QRegExp::numCaptures() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4177	{
3 41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4178	return captureCount();
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4179	}
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4180
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4181	/*!
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4182	\since 4.6
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4183	Returns the number of captures contained in the regular expression.
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4184	*/
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4185	int QRegExp::captureCount() const
41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4186	{
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4187	prepareEngine(priv);
3 41300fa6a67c Revision: 201003 Dremov Kirill (Nokia-D-MSW/Tampere) <kirill.dremov@nokia.com> parents: 0 diff changeset	4188	return priv->eng->captureCount();
0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4189	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4190
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4191	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4192	Returns a list of the captured text strings.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4193
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4194	The first string in the list is the entire matched string. Each
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4195	subsequent list element contains a string that matched a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4196	(capturing) subexpression of the regexp.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4197
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4198	For example:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4199	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 14
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4200
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4201	The above example also captures elements that may be present but
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4202	which we have no interest in. This problem can be solved by using
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4203	non-capturing parentheses:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4204
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4205	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 15
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4206
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4207	Note that if you want to iterate over the list, you should iterate
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4208	over a copy, e.g.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4209	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 16
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4210
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4211	Some regexps can match an indeterminate number of times. For
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4212	example if the input string is "Offsets: 12 14 99 231 7" and the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4213	regexp, \c{rx}, is \bold{(\\d+)+}, we would hope to get a list of
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4214	all the numbers matched. However, after calling
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4215	\c{rx.indexIn(str)}, capturedTexts() will return the list ("12",
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4216	"12"), i.e. the entire match was "12" and the first subexpression
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4217	matched was "12". The correct approach is to use cap() in a
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4218	\l{QRegExp#cap_in_a_loop}{loop}.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4219
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4220	The order of elements in the string list is as follows. The first
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4221	element is the entire matching string. Each subsequent element
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4222	corresponds to the next capturing open left parentheses. Thus
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4223	capturedTexts()[1] is the text of the first capturing parentheses,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4224	capturedTexts()[2] is the text of the second and so on
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4225	(corresponding to $1, $2, etc., in some other regexp languages).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4226
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4227	\sa cap(), pos()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4228	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4229	QStringList QRegExp::capturedTexts() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4230	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4231	if (priv->capturedCache.isEmpty()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4232	prepareEngine(priv);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4233	const int *captured = priv->matchState.captured;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4234	int n = priv->matchState.capturedSize;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4235
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4236	for (int i = 0; i < n; i += 2) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4237	QString m;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4238	if (captured[i + 1] == 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4239	m = QLatin1String(""); // ### Qt 5: don't distinguish between null and empty
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4240	else if (captured[i] >= 0)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4241	m = priv->t.mid(captured[i], captured[i + 1]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4242	priv->capturedCache.append(m);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4243	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4244	priv->t.clear();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4245	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4246	return priv->capturedCache;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4247	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4248
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4249	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4250	\internal
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4251	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4252	QStringList QRegExp::capturedTexts()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4253	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4254	return const_cast<const QRegExp *>(this)->capturedTexts();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4255	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4256
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4257	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4258	Returns the text captured by the \a nth subexpression. The entire
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4259	match has index 0 and the parenthesized subexpressions have
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4260	indexes starting from 1 (excluding non-capturing parentheses).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4261
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4262	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 17
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4263
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4264	The order of elements matched by cap() is as follows. The first
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4265	element, cap(0), is the entire matching string. Each subsequent
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4266	element corresponds to the next capturing open left parentheses.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4267	Thus cap(1) is the text of the first capturing parentheses, cap(2)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4268	is the text of the second, and so on.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4269
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4270	\sa capturedTexts(), pos()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4271	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4272	QString QRegExp::cap(int nth) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4273	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4274	return capturedTexts().value(nth);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4275	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4276
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4277	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4278	\internal
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4279	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4280	QString QRegExp::cap(int nth)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4281	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4282	return const_cast<const QRegExp *>(this)->cap(nth);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4283	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4284
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4285	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4286	Returns the position of the \a nth captured text in the searched
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4287	string. If \a nth is 0 (the default), pos() returns the position
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4288	of the whole match.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4289
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4290	Example:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4291	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 18
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4292
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4293	For zero-length matches, pos() always returns -1. (For example, if
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4294	cap(4) would return an empty string, pos(4) returns -1.) This is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4295	a feature of the implementation.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4296
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4297	\sa cap(), capturedTexts()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4298	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4299	int QRegExp::pos(int nth) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4300	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4301	if (nth < 0 \|\| nth >= priv->matchState.capturedSize / 2)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4302	return -1;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4303	else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4304	return priv->matchState.captured[2 * nth];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4305	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4306
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4307	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4308	\internal
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4309	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4310	int QRegExp::pos(int nth)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4311	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4312	return const_cast<const QRegExp *>(this)->pos(nth);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4313	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4314
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4315	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4316	Returns a text string that explains why a regexp pattern is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4317	invalid the case being; otherwise returns "no error occurred".
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4318
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4319	\sa isValid()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4320	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4321	QString QRegExp::errorString() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4322	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4323	if (isValid()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4324	return QString::fromLatin1(RXERR_OK);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4325	} else {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4326	return priv->eng->errorString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4327	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4328	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4329
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4330	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4331	\internal
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4332	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4333	QString QRegExp::errorString()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4334	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4335	return const_cast<const QRegExp *>(this)->errorString();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4336	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4337	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4338
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4339	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4340	Returns the string \a str with every regexp special character
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4341	escaped with a backslash. The special characters are $, (,), *, +,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4342	., ?, [, \,], ^, {, \| and }.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4343
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4344	Example:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4345
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4346	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 19
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4347
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4348	This function is useful to construct regexp patterns dynamically:
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4349
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4350	\snippet doc/src/snippets/code/src_corelib_tools_qregexp.cpp 20
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4351
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4352	\sa setPatternSyntax()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4353	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4354	QString QRegExp::escape(const QString &str)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4355	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4356	QString quoted;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4357	const int count = str.count();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4358	quoted.reserve(count * 2);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4359	const QLatin1Char backslash('\\');
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4360	for (int i = 0; i < count; i++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4361	switch (str.at(i).toLatin1()) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4362	case '$':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4363	case '(':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4364	case ')':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4365	case '*':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4366	case '+':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4367	case '.':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4368	case '?':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4369	case '[':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4370	case '\\':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4371	case ']':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4372	case '^':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4373	case '{':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4374	case '\|':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4375	case '}':
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4376	quoted.append(backslash);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4377	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4378	quoted.append(str.at(i));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4379	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4380	return quoted;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4381	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4382
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4383	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4384	\fn bool QRegExp::caseSensitive() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4385
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4386	Use \l caseSensitivity() instead.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4387	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4388
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4389	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4390	\fn void QRegExp::setCaseSensitive(bool sensitive)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4391
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4392	Use \l setCaseSensitivity() instead.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4393	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4394
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4395	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4396	\fn bool QRegExp::wildcard() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4397
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4398	Use \l patternSyntax() instead.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4399
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4400	\oldcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4401	bool wc = rx.wildcard();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4402	\newcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4403	bool wc = (rx.patternSyntax() == QRegExp::Wildcard);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4404	\endcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4405	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4406
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4407	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4408	\fn void QRegExp::setWildcard(bool wildcard)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4409
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4410	Use \l setPatternSyntax() instead.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4411
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4412	\oldcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4413	rx.setWildcard(wc);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4414	\newcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4415	rx.setPatternSyntax(wc ? QRegExp::Wildcard : QRegExp::RegExp);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4416	\endcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4417	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4418
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4419	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4420	\fn bool QRegExp::minimal() const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4421
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4422	Use \l isMinimal() instead.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4423	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4424
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4425	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4426	\fn int QRegExp::search(const QString &str, int from = 0,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4427	CaretMode caretMode = CaretAtZero) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4428
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4429	Use \l indexIn() instead.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4430	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4431
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4432	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4433	\fn int QRegExp::searchRev(const QString &str, int from = -1, \
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4434	CaretMode caretMode = CaretAtZero) const
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4435
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4436	Use \l lastIndexIn() instead.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4437	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4438
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4439	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4440	\fn QRegExp::QRegExp(const QString &pattern, bool cs, bool wildcard = false)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4441
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4442	Use another constructor instead.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4443
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4444	\oldcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4445	QRegExp rx("*.txt", false, true);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4446	\newcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4447	QRegExp rx("*.txt", Qt::CaseInsensitive, QRegExp::Wildcard);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4448	\endcode
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4449	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4450
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4451	#ifndef QT_NO_DATASTREAM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4452	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4453	\relates QRegExp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4454
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4455	Writes the regular expression \a regExp to stream \a out.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4456
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4457	\sa {Format of the QDataStream Operators}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4458	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4459	QDataStream &operator<<(QDataStream &out, const QRegExp &regExp)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4460	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4461	return out << regExp.pattern() << (quint8)regExp.caseSensitivity()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4462	<< (quint8)regExp.patternSyntax()
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4463	<< (quint8)!!regExp.isMinimal();
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4464	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4465
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4466	/*!
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4467	\relates QRegExp
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4468
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4469	Reads a regular expression from stream \a in into \a regExp.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4470
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4471	\sa {Format of the QDataStream Operators}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4472	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4473	QDataStream &operator>>(QDataStream &in, QRegExp &regExp)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4474	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4475	QString pattern;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4476	quint8 cs;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4477	quint8 patternSyntax;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4478	quint8 isMinimal;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4479
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4480	in >> pattern >> cs >> patternSyntax >> isMinimal;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4481
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4482	QRegExp newRegExp(pattern, Qt::CaseSensitivity(cs),
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4483	QRegExp::PatternSyntax(patternSyntax));
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4484
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4485	newRegExp.setMinimal(isMinimal);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4486	regExp = newRegExp;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4487	return in;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4488	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4489	#endif // QT_NO_DATASTREAM
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4490
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4491	QT_END_NAMESPACE

author	Eckhart Koeppen <eckhart.koppen@nokia.com>
	Wed, 21 Apr 2010 12:15:23 +0300
branch	RCL_3
changeset 12	cc75c76972ee
parent 7	3f74d0d4af4c
permissions	-rw-r--r--