FCL/sf/mw/searchsrv: comparison searchengine/oss/cl/clucene/src/clucene/analysis/standard/standardtokenizer.cpp

equal deleted inserted replaced

-:6f2c1c46032b
+:6c1a2771f4b7
 					str.appendChar('.');
 					return ReadDotted(&str, CL_NS2(analysis,standard)::UNKNOWN,t);
 				case '\'':
 					str.appendChar('\'');
 					return ReadApostrophe(&str,t);
-				case '@':
+//				case '@':
-					str.appendChar('@');
+//					str.appendChar('@');
-					return ReadAt(&str,t);
+//					return ReadAt(&str,t);
 				case '&':
 					str.appendChar('&');
 					return ReadCompany(&str,t);
 				/* default: fall through to end of this function. */
 			}
 }
 while (!EOS && str.len < LUCENE_MAX_WORD_LEN-1 ) {
 ch = readChar();
 const bool dot = ch == '.';
 const bool dash = ch == '-';
+//const bool at = ch == '@';
 if (!(ALNUM || UNDERSCORE || dot || dash)) {
 break;
 }
 /* Multiple dots or dashes in succession end the token.
 if (!prevWasDot) {
 SHAVE_RIGHTMOST(str);
 }
 break;
 }
 str.appendChar(ch);
 prevWasDot = dot;
 prevWasDash = dash;
 }
 }
 }
 }
 }
 } /* End block-guard of strBuf */
-if (!EOS) {
-if (ch == '@' && str.len < LUCENE_MAX_WORD_LEN-1) {
-str.appendChar('@');
+//    if (!EOS) {
-return ReadAt(&str,t);
+//      if (ch == '@' && str.len < LUCENE_MAX_WORD_LEN-1) {
-} else {
+//        str.appendChar('@');
-unReadChar();
+//        return ReadAt(&str,t);
-}
+//      } else {
-}
+//        unReadChar();
+//      }
-	return setToken(t,&str,CL_NS2(analysis,standard)::UNKNOWN
-			? forcedType : CL_NS2(analysis,standard)::HOST);
+if (!EOS) {
+unReadChar();
+}
+return setToken(t,&str,CL_NS2(analysis,standard)::ALPHANUM);
+//	return setToken(t,&str,CL_NS2(analysis,standard)::UNKNOWN
+//			? forcedType : CL_NS2(analysis,standard)::HOST);
 }
 bool StandardTokenizer::ReadApostrophe(StringBuffer* _str, Token* t) {
 StringBuffer& str=*_str;

changeset 2	6c1a2771f4b7
parent 0	671dee74050a
child 10	afe194b6b1cd
child 24	65456528cac2