Курс магистратуры “Компьютерная лингвистика” НИУ ВШЭ

Расписание

День Тема Материалы
13.01 Введение. Типы данных и типы количественных лингвистических исследований Слайды
Основы языка R Lab1 Rmd; Учебник, гл. 1-8
20.01 R: Чтение данных. Визуализации: ggplot2 Lab2 Rmd; Учебник, гл. 14
27.01 R: Tidyverse. Работа с таблицами. Описательные статистики Lab3 Rmd; Data wrangling cheat sheet; упражнения keys; Учебник, гл. 9-12
03.02 Распределения. Выборки. Центральная предельная теорема. Слайды
Стандартная ошибка. Доверительные интервалы Lab4; Учебник, гл. 17
10.02 Проверка статистических гипотез: H0. t-test и его непараметрические аналоги Слайды; Lab5 html; Учебник, гл. 17-18 и 20
Корреляционный анализ
17.02 Дисперсионный анализ (ANOVA). Величина эффекта Слайды; Lab6, html; Учебник, гл. 19 и 22
24.02 Критерий хи-квадрат и точный тест Фишера, величина эффекта для номинальных переменных Lab7, html
17.03 Линейная регрессия. Принципы выбора моделей Учебник, гл. 21; Lab8, html; Cheat sheet: статистики как lm

Домашние задания

Сдаются на почту gmail neurolong@ с темой с темой da4cl накануне семинара

Литература

Hvitfeldt, Emil. Feature Engineering A-Z (https://feaz-book.com/)
Wickham, H. R for data science: import, tidy, transform, visualize, and model data. 2017 (https://r4ds.hadley.nz/)
Wickham, H. ggplot2: elegant graphics for data analysis. 2009 (https://ggplot2-book.org)
Tabachnick, Barbara G., & Linda S. Fidell. Using multivariate statistics. 2014 (https://hisp.htmi.ch/pluginfile.php/77114/mod_resource/content/0/Using%20Multivariate%20Statistics%20%28Tabachnick%20and%20Fidell%29.pdf)
Silge, Julia, & David Robinson. Text Mining with R: A Tidy Approach. O’Reilly Media, 2017 (https://www.tidytextmining.com/)
Levshina N. How to do Linguistics with R: Data exploration and statistical analysis. 2015.
Baayen, R. H. Analyzing linguistic data: a practical introduction to statistics using R. 2014.
Gries St. T. Statistics for Linguistics with R. 3rd ed. 2021.
Поздняков И. Анализ данных и статистика в R (https://pozdniakov.github.io/tidy_stats) Алиева О. Компьютерный анализ текста в R. 2023 (https://locusclassicus.github.io/text_analysis_2023)
Продвинутые главы:
Мороз Г. Введение в анализ данных на R для гуманитарных и социальных наук. 2022 (https://agricolamz.github.io/daR4hs)
Harney, H. L. (2016). Bayesian Inference: Data Evaluation and Decisions (Vol. 2nd ed). Springer.
McElreath, R. (2016). Statistical Rethinking: A Bayesian Course with Examples in R and Stan. eBook (https://github.com/rmcelreath/stat_rethinking_2024)
Nicenboim, Bruno, Daniel J. Schad, and Shravan Vasishth. An Introduction to Bayesian Data Analysis for Cognitive Science. 2024 (https://bruno.nicenboim.me/bayescogsci/)