lingdata

Сайт курса «Лингвистические данные», бакалавры 1 курс НИУ ВШЭ

View the Project on GitHub olesar/lingdata

Домашнее задание 5

Используйте то же видео, которое вы использовали в ДЗ-4. При сохранении файла с разметкой добавьте -gest в конец названия.

Например, разметка хранится в файле Cherepovets_pal1964-pos.eaf — значит, вам нужно будет открыть именно его, добавить новую разметку, сохранить под именем Cherepovets_pal1964-gest.eaf и загрузить на гитхаб.

Домашнее задание является продолжением практикума в классе, нужно разметить следующие слои:

Для оценки будет достаточно разметить тот же фрагмент ролика, что и в ДЗ-4, то есть минуту.

Примечание: Если во фрагменте, который вы размечаете, видна только голова (а руки и т.п. не видны), размечайте те жесты, которые вы реально наблюдаете (кивки, покачивания и другие движения головы). Додумывать, какие жесты рук могли бы сопровождать речь, нельзя.

Бонус на 9-10

Разметьте автоматически леммы и морфологические признаки слов.

Должно получиться два слоя:

* леммы (начальные формы слов) (`lemma@...`)
* морфологические признаки (`morph@...`)

Пример:

Экспортированный файл

words@anb1944m	00:00:15.210	00:00:15.537	людям
words@anb1944m	00:00:15.537	00:00:15.864	говорить
words@anb1944m	00:00:15.864	00:00:16.191	очень
words@anb1944m	00:00:16.191	00:00:16.520	трудно

Выдача Mystem

людям	человек	S,муж,од=дат,мн
говорить	говорить	V,несов,пе=инф
очень	очень	ADV=
трудно	трудно	ADV=

Файл для импорта

lemma@anb1944m	00:00:15.210	00:00:15.537	человек
lemma@anb1944m	00:00:15.537	00:00:15.864	говорить
lemma@anb1944m	00:00:15.864	00:00:16.191	очень
lemma@anb1944m	00:00:16.191	00:00:16.520	трудно
morph@anb1944m	00:00:15.210	00:00:15.537	S,муж,од=дат,мн
morph@anb1944m	00:00:15.537	00:00:15.864	V,несов,пе=инф
morph@anb1944m	00:00:15.864	00:00:16.191	ADV=
morph@anb1944m	00:00:16.191	00:00:16.520	ADV=