lingdata

Сайт курса «Лингвистические данные», бакалавры 1 курс НИУ ВШЭ

View the Project on GitHub olesar/lingdata

Домашнее задание 5

Используйте то же видео, которое вы использовали в ДЗ-4. При сохранении файла с разметкой добавьте -gest в конец названия.

Например, разметка хранится в файле Cherepovets_pal1964-pos.eaf — значит, вам нужно будет открыть именно его, добавить новую разметку, сохранить под именем Cherepovets_pal1964-gest.eaf и загрузить на гитхаб.

Домашнее задание является продолжением практикума в классе, нужно разметить следующие слои:

Для оценки будет достаточно разметить тот же фрагмент ролика, что и в ДЗ-4, то есть минуту.

Примечание: Если во фрагменте, который вы размечаете, видна только голова (а руки и т.п. не видны), размечайте те жесты, которые вы реально наблюдаете (кивки, покачивания и другие движения головы). Додумывать, какие жесты рук могли бы сопровождать речь, нельзя.

Бонус на 9-10

Разметьте автоматически леммы и морфологические признаки слов.

Должно получиться два слоя:

* леммы (начальные формы слов) (`lemma@...`)
* морфологические признаки (`morph@...`)

Пример:

Экспортированный файл

words@anb1944m	00:00:15.210	00:00:15.537	человек
words@anb1944m	00:00:15.537	00:00:15.864	говорит
words@anb1944m	00:00:15.864	00:00:16.191	очень
words@anb1944m	00:00:16.191	00:00:16.520	быстро

Выдача Mystem

человек{человек=S,m,anim=(acc,pl|gen,pl|nom,sg)}
говорит{говорить=V,ipf,tran=inpraes,sg,indic,3p}
очень{очень=ADV=}
быстро{быстро=ADV=}

Файл для импорта

lemma@anb1944m	00:00:15.210	00:00:15.537	человек
lemma@anb1944m	00:00:15.537	00:00:15.864	говорить
lemma@anb1944m	00:00:15.864	00:00:16.191	очень
lemma@anb1944m	00:00:16.191	00:00:16.520	быстро
morph@anb1944m	00:00:15.210	00:00:15.537	S,m,anim=(acc,pl|gen,pl|nom,sg)
morph@anb1944m	00:00:15.537	00:00:15.864	V,ipf,tran=inpraes,sg,indic,3p
morph@anb1944m	00:00:15.864	00:00:16.191	ADV=
morph@anb1944m	00:00:16.191	00:00:16.520	ADV=