searchengine/cpix/tsrc/cpixunittest/data/cpixunittest/analysis/whitebox/analyzer_exp_out.txt
changeset 24 65456528cac2
parent 8 6547bf8ca13a
equal deleted inserted replaced
23:d4d56f5e7c55 24:65456528cac2
    10 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
    10 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
    11  'Juon' 'nyt' 'teetä'
    11  'Juon' 'nyt' 'teetä'
    12 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
    12 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
    13  'Tee' 'näin'
    13  'Tee' 'näin'
    14 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
    14 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
    15  'ปรากฏการณ์ฝนดาวตก' '7' '-18' 'พ' 'ยนี้' 'นายวรวิทย์' 'ตันวุฒิบัณฑิต' 'ปราชญ์ภูมิปัญญาท้องถิ่นด้านดาราศาสตร์ไทยกล่าวว่า' '17' '-18' 'พฤศจิกายน' '2552'
    15  'ปรากฏการณ์ฝนดาวตก' '7' '-18พ' 'ยนี้' 'นายวรวิทย์' 'ตันวุฒิบัณฑิต' 'ปราชญ์ภูมิปัญญาท้องถิ่นด้านดาราศาสตร์ไทยกล่าวว่า' '17' '-18' 'พฤศจิกายน' '2552'
    16 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
    16 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
    17  'จะมีปรากฏการณ์ดาราศาสตร์ครั้งสำคัญที่ชาวไทยเคยประทับใจมาแล้วเมื่อปี' '2541' '-2544' 'คือในคืนวันที่' '17' 'ต่อเนื่องวันที่' '18' 'พฤศจิกายน' '2552'
    17  'จะมีปรากฏการณ์ดาราศาสตร์ครั้งสำคัญที่ชาวไทยเคยประทับใจมาแล้วเมื่อปี' '2541' '-2544' 'คือในคืนวันที่' '17' 'ต่อเนื่องวันที่' '18' 'พฤศจิกายน' '2552'
    18 
    18 
    19 Analyzer "whitespace":
    19 Analyzer "whitespace":
    20 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
    20 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
   240 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
   240 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
   241  'j' 'n' 't'
   241  'j' 'n' 't'
   242 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
   242 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
   243  't' 'n'
   243  't' 'n'
   244 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
   244 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
   245  'ป' '7' '-' 'พ' 'ย' 'น' 'ต' 'ป' '1' '-' 'พ' '2'
   245  'ป' '7' '-' 'ย' 'น' 'ต' 'ป' '1' '-' 'พ' '2'
   246 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
   246 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
   247  'จ' '2' '-' 'ค' '1' 'ต' '1' 'พ' '2'
   247  'จ' '2' '-' 'ค' '1' 'ต' '1' 'พ' '2'
   248 
   248 
   249 Analyzer "standard>prefixes(2)":
   249 Analyzer "standard>prefixes(2)":
   250 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
   250 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
   258 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
   258 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
   259  'ju'|'j' 'ny'|'n' 'te'|'t'
   259  'ju'|'j' 'ny'|'n' 'te'|'t'
   260 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
   260 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
   261  'te'|'t' 'nä'|'n'
   261  'te'|'t' 'nä'|'n'
   262 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
   262 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
   263  'ปร'|'ป' '7' '-1'|'-' 'พ' 'ยน'|'ย' 'นา'|'น' 'ตั'|'ต' 'ปร'|'ป' '17'|'1' '-1'|'-' 'พฤ'|'พ' '25'|'2'
   263  'ปร'|'ป' '7' '-1'|'-' 'ยน'|'ย' 'นา'|'น' 'ตั'|'ต' 'ปร'|'ป' '17'|'1' '-1'|'-' 'พฤ'|'พ' '25'|'2'
   264 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
   264 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
   265  'จะ'|'จ' '25'|'2' '-2'|'-' 'คื'|'ค' '17'|'1' 'ต่'|'ต' '18'|'1' 'พฤ'|'พ' '25'|'2'
   265  'จะ'|'จ' '25'|'2' '-2'|'-' 'คื'|'ค' '17'|'1' 'ต่'|'ต' '18'|'1' 'พฤ'|'พ' '25'|'2'
   266 
   266 
   267 Analyzer "standard>prefixes(3)":
   267 Analyzer "standard>prefixes(3)":
   268 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
   268 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
   276 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
   276 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
   277  'juo'|'ju'|'j' 'nyt'|'ny'|'n' 'tee'|'te'|'t'
   277  'juo'|'ju'|'j' 'nyt'|'ny'|'n' 'tee'|'te'|'t'
   278 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
   278 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
   279  'tee'|'te'|'t' 'näi'|'nä'|'n'
   279  'tee'|'te'|'t' 'näi'|'nä'|'n'
   280 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
   280 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
   281  'ปรา'|'ปร'|'ป' '7' '-18'|'-1'|'-' 'พ' 'ยนี'|'ยน'|'ย' 'นาย'|'นา'|'น' 'ตัน'|'ตั'|'ต' 'ปรา'|'ปร'|'ป' '17'|'1' '-18'|'-1'|'-' 'พฤศ'|'พฤ'|'พ' '255'|'25'|'2'
   281  'ปรา'|'ปร'|'ป' '7' '-18'|'-1'|'-' 'ยนี'|'ยน'|'ย' 'นาย'|'นา'|'น' 'ตัน'|'ตั'|'ต' 'ปรา'|'ปร'|'ป' '17'|'1' '-18'|'-1'|'-' 'พฤศ'|'พฤ'|'พ' '255'|'25'|'2'
   282 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
   282 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
   283  'จะม'|'จะ'|'จ' '254'|'25'|'2' '-25'|'-2'|'-' 'คือ'|'คื'|'ค' '17'|'1' 'ต่อ'|'ต่'|'ต' '18'|'1' 'พฤศ'|'พฤ'|'พ' '255'|'25'|'2'
   283  'จะม'|'จะ'|'จ' '254'|'25'|'2' '-25'|'-2'|'-' 'คือ'|'คื'|'ค' '17'|'1' 'ต่อ'|'ต่'|'ต' '18'|'1' 'พฤศ'|'พฤ'|'พ' '255'|'25'|'2'
   284 
   284 
   285 Analyzer "stdtokens>stdfilter>lowercase>thai>stop(en)":
   285 Analyzer "stdtokens>stdfilter>lowercase>thai>stop(en)":
   286 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
   286 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
   294 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
   294 File !:\data\cpixunittestcorpus\stem\fi\1.txt tokenized:
   295  'juon' 'nyt' 'teetä'
   295  'juon' 'nyt' 'teetä'
   296 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
   296 File !:\data\cpixunittestcorpus\stem\fi\2.txt tokenized:
   297  'tee' 'näin'
   297  'tee' 'näin'
   298 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
   298 File !:\data\cpixunittestcorpus\loc\th\1.txt tokenized:
   299  'ปรากฏการณ์' 'ฝน' 'ดาวตก' '7' '-18' 'พ' 'ยนี' '้' 'นาย' 'วรวิท' 'ย์' 'ตัน' 'วุฒิ' 'บัณฑิต' 'ปราชญ์' 'ภูมิปัญญา' 'ท้อง' 'ถิ่น' 'ด้าน' 'ดาราศาสตร์' 'ไทย' 'กล่าว' 'ว่า' '17' '-18' 'พฤศจิกายน' '2552'
   299  'ปรากฏการณ์' 'ฝน' 'ดาวตก' '7' '-18พ' 'ยนี' '้' 'นาย' 'วรวิท' 'ย์' 'ตัน' 'วุฒิ' 'บัณฑิต' 'ปราชญ์' 'ภูมิปัญญา' 'ท้อง' 'ถิ่น' 'ด้าน' 'ดาราศาสตร์' 'ไทย' 'กล่าว' 'ว่า' '17' '-18' 'พฤศจิกายน' '2552'
   300 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
   300 File !:\data\cpixunittestcorpus\loc\th\2.txt tokenized:
   301  'จะ' 'มี' 'ปรากฏการณ์' 'ดาราศาสตร์' 'ครั้ง' 'สำคัญ' 'ที่' 'ชาว' 'ไทย' 'เคย' 'ประทับ' 'ใจมา' 'แล้ว' 'เมื่อ' 'ปี' '2541' '-2544' 'คือ' 'ใน' 'คืน' 'วัน' 'ที่' '17' 'ต่อ' 'เนื่อง' 'วัน' 'ที่' '18' 'พฤศจิกายน' '2552'
   301  'จะ' 'มี' 'ปรากฏการณ์' 'ดาราศาสตร์' 'ครั้ง' 'สำคัญ' 'ที่' 'ชาว' 'ไทย' 'เคย' 'ประทับ' 'ใจมา' 'แล้ว' 'เมื่อ' 'ปี' '2541' '-2544' 'คือ' 'ใน' 'คืน' 'วัน' 'ที่' '17' 'ต่อ' 'เนื่อง' 'วัน' 'ที่' '18' 'พฤศจิกายน' '2552'
   302 
   302 
   303 Analyzer "cjk>stop(en)":
   303 Analyzer "cjk>stop(en)":
   304 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized:
   304 File !:\data\cpixunittestcorpus\stem\en\1.txt tokenized: