Сайт курса «Лингвистические данные», бакалавры 1 курс НИУ ВШЭ
Используйте то же видео, которое вы использовали в ДЗ-4. При сохранении файла с разметкой добавьте -gest
в конец названия.
Например, разметка хранится в файле Cherepovets_pal1964-pos.eaf
— значит, вам нужно будет открыть именно его, добавить новую разметку, сохранить под именем Cherepovets_pal1964-gest.eaf
и загрузить на гитхаб.
Домашнее задание является продолжением практикума в классе, нужно разметить следующие слои:
gesture@...
)gestActiveOrgan@...
, тип слоев gesture_organs, родительский слой - gesture@…)gestMeaning@...
, тип gesture_meaning, родительский слой - gesture@…)gestComment@...
, тип gesture_comment, родительский слой - gesture@…)eduType@...
, тип utterance_types со стереотипом Symbolic Association, родительский слой text@…)Для оценки будет достаточно разметить тот же фрагмент ролика, что и в ДЗ-4, то есть минуту.
Примечание: Если во фрагменте, который вы размечаете, видна только голова (а руки и т.п. не видны), размечайте те жесты, которые вы реально наблюдаете (кивки, покачивания и другие движения головы). Додумывать, какие жесты рук могли бы сопровождать речь, нельзя.
Разметьте автоматически леммы и морфологические признаки слов.
words@...
как текст с разделителями...-pos.eaf
Должно получиться два слоя:
* леммы (начальные формы слов) (`lemma@...`)
* морфологические признаки (`morph@...`)
Напишите, насколько хорошо справился морфологический анализатор. Есть ли ошибки, спорные случаи? Что вызвало сложности? Вам могут пригодиться НКРЯ и Грамматический словарь А. А. Зализняка
Symbolic Association
(родительский слой words@...
).Пример:
Экспортированный файл
words@anb1944m 00:00:15.210 00:00:15.537 человек
words@anb1944m 00:00:15.537 00:00:15.864 говорит
words@anb1944m 00:00:15.864 00:00:16.191 очень
words@anb1944m 00:00:16.191 00:00:16.520 быстро
Выдача Mystem
человек{человек=S,m,anim=(acc,pl|gen,pl|nom,sg)}
говорит{говорить=V,ipf,tran=inpraes,sg,indic,3p}
очень{очень=ADV=}
быстро{быстро=ADV=}
Файл для импорта
lemma@anb1944m 00:00:15.210 00:00:15.537 человек
lemma@anb1944m 00:00:15.537 00:00:15.864 говорить
lemma@anb1944m 00:00:15.864 00:00:16.191 очень
lemma@anb1944m 00:00:16.191 00:00:16.520 быстро
morph@anb1944m 00:00:15.210 00:00:15.537 S,m,anim=(acc,pl|gen,pl|nom,sg)
morph@anb1944m 00:00:15.537 00:00:15.864 V,ipf,tran=inpraes,sg,indic,3p
morph@anb1944m 00:00:15.864 00:00:16.191 ADV=
morph@anb1944m 00:00:16.191 00:00:16.520 ADV=