searchengine/cpix/tsrc/cpixunittest/data/cpixunittest/analysis/whitebox/loc/he_exp_out.txt
equal
deleted
inserted
replaced
|
1 Analyzer "natural": |
|
2 File ./cpixunittestcorpus/text/en/1.txt tokenized: |
|
3 'i' 'am' 'happy' |
|
4 File ./cpixunittestcorpus/text/en/2.txt tokenized: |
|
5 'oh' 'happiness' |
|
6 File ./cpixunittestcorpus/text/en/3.txt tokenized: |
|
7 'nothing' 'important' 'in' 'here' 'so' 'don't' 'even' 'look' 'because' 'you' 'shall' 'find' 'nothing' 'whatsoever' |
|
8 File ./cpixunittestcorpus/text/en/4.txt tokenized: |
|
9 'what' 'is' 'happening' 'here' |
|
10 |
|
11 Analyzer "natural": |
|
12 File ./cpixunittestcorpus/text/he/1.txt tokenized: |
|
13 'שפעת'|'פעת' 'החזירים'|'חזירים' 'תושבת'|'ושבת'|'שבת'|'בת'|'ת' 'נצרת'|'צרת' 'עילית' 'בת'|'ת' '51' 'ללא'|'לא'|'א' 'מחלות'|'חלות' 'רקע' 'מתה'|'תה'|'ה' |
|
14 File ./cpixunittestcorpus/text/he/2.txt tokenized: |
|
15 'בבית'|'בית'|'ית'|'ת' 'החולים'|'חולים' 'העמק'|'עמק' 'החולה'|'חולה' 'טופלה' 'אתמול'|'תמול'|'מול'|'ול'|'ל' 'בתרופה'|'תרופה'|'רופה' 'הניסיונית'|'ניסיונית'|'יסיונית'|'סיונית' |
|
16 File ./cpixunittestcorpus/text/he/3.txt tokenized: |
|
17 'פרהמיביר' 'אולם'|'ולם'|'לם'|'ם' 'מצבה'|'צבה' 'הוסיף'|'וסיף'|'סיף' 'להידרדר'|'הידרדר'|'ידרדר'|'דרדר' |
|
18 File ./cpixunittestcorpus/text/he/4.txt tokenized: |
|
19 'והבוקר'|'הבוקר'|'בוקר'|'וקר'|'קר' 'נקבע'|'קבע' 'מותה'|'ותה'|'תה'|'ה' 'החולה'|'חולה' 'תושבת'|'ושבת'|'שבת'|'בת'|'ת' 'נצרת'|'צרת' 'עילית' |
|
20 |