searchengine/cpix/tsrc/cpixunittest/data/cpixunittest/analysis/whitebox/analyzer_exp_out.txt
equal
deleted
inserted
replaced
10 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
10 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
11 'Juon' 'nyt' 'teetä' |
11 'Juon' 'nyt' 'teetä' |
12 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
12 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
13 'Tee' 'näin' |
13 'Tee' 'näin' |
14 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
14 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
15 'ปรากฏการณ์ฝนดาวตก' '7' '-18' 'พ' 'ยนี้' 'นายวรวิทย์' 'ตันวุฒิบัณฑิต' 'ปราชญ์ภูมิปัญญาท้องถิ่นด้านดาราศาสตร์ไทยกล่าวว่า' '17' '-18' 'พฤศจิกายน' '2552' |
15 'ปรากฏการณ์ฝนดาวตก' '7' '-18พ' 'ยนี้' 'นายวรวิทย์' 'ตันวุฒิบัณฑิต' 'ปราชญ์ภูมิปัญญาท้องถิ่นด้านดาราศาสตร์ไทยกล่าวว่า' '17' '-18' 'พฤศจิกายน' '2552' |
16 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
16 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
17 'จะมีปรากฏการณ์ดาราศาสตร์ครั้งสำคัญที่ชาวไทยเคยประทับใจมาแล้วเมื่อปี' '2541' '-2544' 'คือในคืนวันที่' '17' 'ต่อเนื่องวันที่' '18' 'พฤศจิกายน' '2552' |
17 'จะมีปรากฏการณ์ดาราศาสตร์ครั้งสำคัญที่ชาวไทยเคยประทับใจมาแล้วเมื่อปี' '2541' '-2544' 'คือในคืนวันที่' '17' 'ต่อเนื่องวันที่' '18' 'พฤศจิกายน' '2552' |
18 |
18 |
19 Analyzer "whitespace": |
19 Analyzer "whitespace": |
20 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
20 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
240 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
240 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
241 'j' 'n' 't' |
241 'j' 'n' 't' |
242 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
242 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
243 't' 'n' |
243 't' 'n' |
244 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
244 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
245 'ป' '7' '-' 'พ' 'ย' 'น' 'ต' 'ป' '1' '-' 'พ' '2' |
245 'ป' '7' '-' 'ย' 'น' 'ต' 'ป' '1' '-' 'พ' '2' |
246 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
246 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
247 'จ' '2' '-' 'ค' '1' 'ต' '1' 'พ' '2' |
247 'จ' '2' '-' 'ค' '1' 'ต' '1' 'พ' '2' |
248 |
248 |
249 Analyzer "standard>prefixes(2)": |
249 Analyzer "standard>prefixes(2)": |
250 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
250 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
258 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
258 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
259 'ju'|'j' 'ny'|'n' 'te'|'t' |
259 'ju'|'j' 'ny'|'n' 'te'|'t' |
260 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
260 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
261 'te'|'t' 'nä'|'n' |
261 'te'|'t' 'nä'|'n' |
262 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
262 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
263 'ปร'|'ป' '7' '-1'|'-' 'พ' 'ยน'|'ย' 'นา'|'น' 'ตั'|'ต' 'ปร'|'ป' '17'|'1' '-1'|'-' 'พฤ'|'พ' '25'|'2' |
263 'ปร'|'ป' '7' '-1'|'-' 'ยน'|'ย' 'นา'|'น' 'ตั'|'ต' 'ปร'|'ป' '17'|'1' '-1'|'-' 'พฤ'|'พ' '25'|'2' |
264 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
264 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
265 'จะ'|'จ' '25'|'2' '-2'|'-' 'คื'|'ค' '17'|'1' 'ต่'|'ต' '18'|'1' 'พฤ'|'พ' '25'|'2' |
265 'จะ'|'จ' '25'|'2' '-2'|'-' 'คื'|'ค' '17'|'1' 'ต่'|'ต' '18'|'1' 'พฤ'|'พ' '25'|'2' |
266 |
266 |
267 Analyzer "standard>prefixes(3)": |
267 Analyzer "standard>prefixes(3)": |
268 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
268 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
276 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
276 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
277 'juo'|'ju'|'j' 'nyt'|'ny'|'n' 'tee'|'te'|'t' |
277 'juo'|'ju'|'j' 'nyt'|'ny'|'n' 'tee'|'te'|'t' |
278 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
278 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
279 'tee'|'te'|'t' 'näi'|'nä'|'n' |
279 'tee'|'te'|'t' 'näi'|'nä'|'n' |
280 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
280 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
281 'ปรา'|'ปร'|'ป' '7' '-18'|'-1'|'-' 'พ' 'ยนี'|'ยน'|'ย' 'นาย'|'นา'|'น' 'ตัน'|'ตั'|'ต' 'ปรา'|'ปร'|'ป' '17'|'1' '-18'|'-1'|'-' 'พฤศ'|'พฤ'|'พ' '255'|'25'|'2' |
281 'ปรา'|'ปร'|'ป' '7' '-18'|'-1'|'-' 'ยนี'|'ยน'|'ย' 'นาย'|'นา'|'น' 'ตัน'|'ตั'|'ต' 'ปรา'|'ปร'|'ป' '17'|'1' '-18'|'-1'|'-' 'พฤศ'|'พฤ'|'พ' '255'|'25'|'2' |
282 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
282 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
283 'จะม'|'จะ'|'จ' '254'|'25'|'2' '-25'|'-2'|'-' 'คือ'|'คื'|'ค' '17'|'1' 'ต่อ'|'ต่'|'ต' '18'|'1' 'พฤศ'|'พฤ'|'พ' '255'|'25'|'2' |
283 'จะม'|'จะ'|'จ' '254'|'25'|'2' '-25'|'-2'|'-' 'คือ'|'คื'|'ค' '17'|'1' 'ต่อ'|'ต่'|'ต' '18'|'1' 'พฤศ'|'พฤ'|'พ' '255'|'25'|'2' |
284 |
284 |
285 Analyzer "stdtokens>stdfilter>lowercase>thai>stop(en)": |
285 Analyzer "stdtokens>stdfilter>lowercase>thai>stop(en)": |
286 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
286 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
294 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
294 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized: |
295 'juon' 'nyt' 'teetä' |
295 'juon' 'nyt' 'teetä' |
296 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
296 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized: |
297 'tee' 'näin' |
297 'tee' 'näin' |
298 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
298 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized: |
299 'ปรากฏการณ์' 'ฝน' 'ดาวตก' '7' '-18' 'พ' 'ยนี' '้' 'นาย' 'วรวิท' 'ย์' 'ตัน' 'วุฒิ' 'บัณฑิต' 'ปราชญ์' 'ภูมิปัญญา' 'ท้อง' 'ถิ่น' 'ด้าน' 'ดาราศาสตร์' 'ไทย' 'กล่าว' 'ว่า' '17' '-18' 'พฤศจิกายน' '2552' |
299 'ปรากฏการณ์' 'ฝน' 'ดาวตก' '7' '-18พ' 'ยนี' '้' 'นาย' 'วรวิท' 'ย์' 'ตัน' 'วุฒิ' 'บัณฑิต' 'ปราชญ์' 'ภูมิปัญญา' 'ท้อง' 'ถิ่น' 'ด้าน' 'ดาราศาสตร์' 'ไทย' 'กล่าว' 'ว่า' '17' '-18' 'พฤศจิกายน' '2552' |
300 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
300 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized: |
301 'จะ' 'มี' 'ปรากฏการณ์' 'ดาราศาสตร์' 'ครั้ง' 'สำคัญ' 'ที่' 'ชาว' 'ไทย' 'เคย' 'ประทับ' 'ใจมา' 'แล้ว' 'เมื่อ' 'ปี' '2541' '-2544' 'คือ' 'ใน' 'คืน' 'วัน' 'ที่' '17' 'ต่อ' 'เนื่อง' 'วัน' 'ที่' '18' 'พฤศจิกายน' '2552' |
301 'จะ' 'มี' 'ปรากฏการณ์' 'ดาราศาสตร์' 'ครั้ง' 'สำคัญ' 'ที่' 'ชาว' 'ไทย' 'เคย' 'ประทับ' 'ใจมา' 'แล้ว' 'เมื่อ' 'ปี' '2541' '-2544' 'คือ' 'ใน' 'คืน' 'วัน' 'ที่' '17' 'ต่อ' 'เนื่อง' 'วัน' 'ที่' '18' 'พฤศจิกายน' '2552' |
302 |
302 |
303 Analyzer "cjk>stop(en)": |
303 Analyzer "cjk>stop(en)": |
304 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |
304 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: |