lingdata

Сайт курса «Лингвистические данные», бакалавры 1 курс НИУ ВШЭ

View the Project on GitHub olesar/lingdata

Разметка мультимедийных данных в системе ELAN

ELAN - система для разметки мультимедийных (аудио- и видео-) данных, созданная в Институте Макса Планка в Неймегене (Нидерланды). Позволяет создавать слои разметки разных типов, определяемых пользователем. В ELAN-е часто делают следующие виды разметки:

Файлы для работы

Скачайте программу ELAN со страницы Института М. Планка (основная версия, не Simple!), а также Образец разметки
На семинаре вы можете размечать свое видео или скачать Видео сказки.

1. Знакомство с системой

Запустите программу
(исполняемый файл .jnlp, согласитесь, что вы доверяете источнику, из которого получен файл),
затем откройте файл с аннотацией.

Подождите некоторое время, пока загрузятся файлы (одновременно загружаются и аннотация, и файлы видео и/или аудио), изучите структуру слоев разметки, запустите видео, чтобы посмотреть, как синхронизируется видео и слои разметки.

Важные компоненты:

Слои

Независимые и связанные с родительским слои:

2. Разметка файла с нуля

Для работы вам понадобится ваш видеофайл (загрузите его на компьютер) и файл с транскрипцией (в формате .txt). Если так случилось, что у вас нет своих материалов, можно использовать следующие файлы для работы: видео

2.0. Откройте ELAN

2.1. Создайте новый пустой файл для аннотации вашего видео и(или) аудио

Сохраните файл аннотации под своим именем (формат .eaf)

2.2. Импортируйте типы аннотаций из образца .eaf

Можно сразу импортировать все типы слоев из файла образца.

Если нужно, так можно создать новые типы с нуля:

* Тип -> Добавьте новый тип слоев  
Создадим два новых типа:
>> utterance и
>> gestures (стереотип у обоих - None).
Еще один тип -- для интерпретации значения жестов:
>> gesture-meaning (должен иметь стереотип Symbolic Association, это зависимый тип, т.к. аннотация значений привязана по времени к аннотации жестов).

2.2. Создайте слои аннотации

Проиграйте мультимедиа с помощью центральной кнопки на панели проигрывателя, определите количество участников речевой ситуации (включая и тех, кто говорит на видео “за кадром”).

Если вы размечаете видео, для каждого участника в кадре создадим слой его жестов (для участника @abp1960f - @abp1960f-gestures и т.п.). Укажем тип (gestures), участника, аннотатора, остальное дефолтно. Под каждым слоем жестов создадим слой для интерпретации их значения в речевой ситуации (например, @abp1960f-gestMeaning). Здесь укажите тип (gesture-meaning) и родительский слой (например, @abp1960f-gestures)

2.3. Разбейте клип на микрореплики и впишите аннотации для транскриптов  

Если нужно, настройте режим замедленного проигрывания видео (90-70%):

Чтобы начать вводить аннотации, необходимо активировать нужный слой (двойным кликом - он должен быть подкрашен розовым). Проигрывайте мультимедиа и выделяйте микрореплики – предложения или даже лучше части предложений между паузами.

Кликнув мышкой, установите красную полосу на месте примерного начала микрореплики, а затем, держа нажатой клавишу SHIFT кликните на конце микрореплики (то же можно сделать в режиме drag-and-drop, как будто вы выделяете слова). Кликните на появившемся “отрезке” дважды, откроется область для заполнения аннотации.


Полезное

Сдвинуть левую/правую границу аннотации: зажав ALT, подвести курсор к границе и подвинуть. Сдвинуть аннотацию: зажав ALT и наведя курсор на аннотацию, подвинуть влево/вправо. Ctrl + Space: проиграть / поставить на паузу. Shift + Space: проиграть выделенное. Ctrl + PageUp/PageDown: промотать вперед/назад. Уточнять области для аннотации можно с помощью панели прокрутки (например, переместить красную линию на 1 секунду вперед) и находящейся справа панели выделений (переместить красную линию к концу/началу реплики; проиграть реплику; снять выделение).

Аннотируйте реплики говорящих примерно для 30 секунд видео/аудио.

PROFIT!

В конце работы сохраните свой файл аннотаций (он будет иметь расширение .eaf)

Список горячих клавиш и команд

Список горячих клавиш и команд

Alt+n – новый элемент разметки на слое
Alt+d – удалить элемент аннотации
Ctrl+Space – запустить/остановить проигрывание медиа файла
Alt+Left – перейти на предыдущую аннотацию
Alt+Right – перейти на следующую аннотацию
Alt+Shift+c – отменить выделение
Alt+Down – перейти на нижнюю аннотацию
Alt+Up – перейти на верхнюю аннотацию
Ctrl+/ – перевести курсор в начало/конец выделения
Ctrl+Alt+t – удалить слой разметки
Ctrl+c – копировать элемент аннотации
Ctrl+b – промотать в начало
Ctrl+e – промотать в конец
Ctrl+Left – перевести курсор на 40 ms раньше
Ctrl+PgDown – промотать вперед на “страницу”
Ctrl+PgUp – промотать назад на “страницу”
Ctrl+Right – перевести курсор на 40 ms позже
Ctrl+Shift+Left – перевести курсор на 10 ms раньше
Ctrl+Shift+Right – перевести курсор на 10 ms позже
Ctrl+Shift+t – добавить новый тип
Ctrl+t – создать новый слой разметки
Ctrl+v – вставить элемент аннотации
Ctrl+w – закрыть один из открытых проектов ELAN
Ctrl+y – повторить действие
Ctrl+z – отменить действие
Edit>Linked files (Ctrl+Alt+l) – добавить или удалить медиа файлы в проект ELAN
Edit>Preferences>Edit Shortcuts – изменить горячие клавиши
File>Automatic Backup – настройка автосохранения резервных копий проектов ELAN
File>Close (Ctrl+w) – закрыть один из открытых проектов ELAN
File>Export as – экспортировать проект ELAN в другие форматы
File>Import – импортироватьв ELANиз Toolbox, FieldWorks, PRAAT, Transcriber, Shoebox, CHAT, Recognizer и CSV-файла; File>New (Ctrl+n) – создать новый проект ELAN
File>Open (Ctrl+o) – открыть один из старых проектов ELAN
File>Print Preview (Ctrl+Alt+p) – настройка печати разметки ELAN
File>Save (Ctrl+s) – сохранить проект ELAN
Options>Annotation Mode – перейти в режим аннотации
Options>Language – изменить язык программной оболочки
Options>Segmentation Mode – перейти в режим сегментации
Options>Transcription Mode – перейти в режим транскрипции
RButton>Change attributes of – настройка параметров слоя разметки
RButton>Conected – отключить/включить связь временной оси разметки и аудио
RButton>Copy annotation (Ctrl+с) – копировать элемент аннотации
RButton>Delete annotation (Alt+d) – удалить элемент аннотации
RButton>Paste annotation (Ctrl+v) – вставить элемент аннотации
RButton>Save current frame as image – сохранить кадр как изображение
RButton>Sort tiers – сортировать слои разметки
RButton>Stereo Chanels>Merged – слияние двух аудиопотоков в один
RButton>Time ruller visible – отключить/включить временную ось
RButton>Vertical zoom – масштабирование амплитудного диапазона осцилограммы
RButton>Visible tiers – скрыть один и больше слоев разметки
RButton>Zoom – масштабирование видео
Shift+Left – перевести курсор на 1 s раньше
Shift+Right – перевести курсор на 1 s позже
Shift+Space – проиграть выделенное
Tier>Add new tier (Ctrl+t) – создать новый слой разметки
Tier>Copy tier – копировать слой разметки
Tier>Delete tier (Ctrl+Alt+t) – удалить слой разметки
Type>Add new linguistic type (Ctrl+Shift+t) – добавить новый лингвистический тип
Type>Change linguistic type – изменить лингвистический тип
Type>Delete linguistic type – удалить лингвистический тип
View>Shortcuts – посмотреть список всех команд, которые заданы горячими клавишами
View>Viewer – включить/выключить отображение каждого из окон просмотра
Window – переключение между разными проектами ELAN
Help>About ELAN>Citing ELAN... – информация о том, как ссылаться на ELAN

Дополнительные материалы